#AI有多智能
2022-01-18 08:25与监督学习、无监督学习类似,强化学习并不是某种特定的模型或算法,指的是训练方法。在强化学习中,做出决策的一方被称为主体,它存在于环境中。主体每做出一个动作,环境就会给予反馈,主体会在评估反馈后决定下一个动作。对于强化学习来说,一切动作的依据都是回报。
内容为转载
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
频道: 视频