正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
#5分钟科普
2020-11-19 11:52

什么是循环神经网络RNN?

在识别图像时,输入的每张图片都是孤立的。认出这张图片是苹果,并不会对认出下一张图片是梨造成影响。但对于语言来说,顺序是十分重要的。「我吃苹果」和「苹果吃我」,词语顺序的改变表达了完全不同的意义。顺序也提供了一定的信息,比如「吃」后面大概率是代表食物的名词。为了捕捉数据的这种关联,人们找到了 RNN,一个高度重视序列信息的网络。


序列就是数据的前后关系,RNN 的基础结构仍然是神经网络。只不过它多了一个小盒子,用来记录数据输入时网络的状态。在下一次输入数据时,网络必须考虑小盒子中保存的信息。随着数据的一次次输入,存储信息也在不断更新,盒子中的信息被称为隐状态(hidden state)。和开始举出的例子一样,RNN 最常见的应用领域就是自然语言处理。机器翻译是寻找相同的意义 序列在不同语言中的表达,诗歌生成是基于一个主题,按照一定的规则输出有逻辑的词语序列。改变两端的信息类型,输入图片、输出句子,这就是看图说话。语音同样可以看作声音信号按时间顺序组成的序列,语音识别和语音生成同样在 RNN 的能力范围内。股票价格也可以被看作一个受时间影响的序列,很多量化交易模型的建立,就是基于这样的认知。不过 RNN 仍有不可忽视的缺陷,数据输入得越早,在隐状态中占据的影响就越小。也就是说如果一个句子很长,RNN 就会忘记开始时说了什么。于是就有了RNN 的改良版: LSTM 长短时记忆模型,这就留到之后再讲吧。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

别打CALL,打钱

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: