扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
#AI有多智能
2022-01-18 08:25

什么是强化学习?

与监督学习、无监督学习类似,强化学习并不是某种特定的模型或算法,指的是训练方法。在强化学习中,做出决策的一方被称为主体,它存在于环境中。主体每做出一个动作,环境就会给予反馈,主体会在评估反馈后决定下一个动作。对于强化学习来说,一切动作的依据都是回报。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
频道: 视频

别打CALL,打钱

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: