请在 下方输入 要搜索的题目:

强化学习与监督学习的区别

强化学习与监督学习的区别

发布时间:2024-12-12 16:53:33
推荐参考答案 ( 由 快搜搜题库 官方老师解答 )
联系客服
答案:(1)强化学习是试错学习(Trail-and-error),由于没有直接的指导信息,智能体要以不断与环境进行交互,通过试错的方式来获得最佳策略。 (2)延迟回报,强化学习的指导信息很少,而且往往是在事后(最后一个状态)才给出的,这就导致了一个问题,就是获得正回报或者负回报以后,如何将回报分配给前面的状态。
专业技术学习
专业技术学习
搜搜题库系统