#AI有多智能
2022-01-19 08:30
扫码打开虎嗅APP
在上一支视频中我们提到过,强化学习中的主体会依据环境采取行动,使用神经网络构建强化学习主体的方法,就是深度强化学习。
游戏、机械臂、自动驾驶,强化学习面对的情景多种多样,环境、行为、回报很难穷尽。但只要有输入就一定会有输出,神经网络面对没有见过的情况也能做出选择,这就是我们使用深度强化学习的原因。