请在下方输入要搜索的题目：

关于策略梯度的方法说法正确的是

A、只适用于离散动作空间;
B、适用于连续动作空间;
C、策略梯度的方法与DQN中的目标函数一致;
D、策略梯度的方法通过Q值挑选动作

发布时间：2025-05-09 11:04:45

推荐参考答案 ( 由快搜搜题库官方老师解答 )

联系客服

答案：适用于连续动作空间

专业技术学习

相关试题

专业技术学习

搜搜题库系统

公务员面试题库及答案考试题库网卫生法学题库护士资格证考试题库社工师题库数量关系题库国网考试题库注册会计师会计题库联通笔试题库滴滴考试题库答案教师进城考试题库征信考试题库华图在线题库题库官网招警考试题库数字推理题库心理学考试题库国考行测题库社区工作者考试题库及答案公安基础知识题库