正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
#AI有多智能
2022-01-18 08:25

什么是强化学习?

与监督学习、无监督学习类似,强化学习并不是某种特定的模型或算法,指的是训练方法。在强化学习中,做出决策的一方被称为主体,它存在于环境中。主体每做出一个动作,环境就会给予反馈,主体会在评估反馈后决定下一个动作。对于强化学习来说,一切动作的依据都是回报。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

别打CALL,打钱

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: