什么是深度强化学习？

在上一支视频中我们提到过，强化学习中的主体会依据环境采取行动，使用神经网络构建强化学习主体的方法，就是深度强化学习。

游戏、机械臂、自动驾驶，强化学习面对的情景多种多样，环境、行为、回报很难穷尽。但只要有输入就一定会有输出，神经网络面对没有见过的情况也能做出选择，这就是我们使用深度强化学习的原因。

内容为转载

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

频道：视频