正确的提示信息
扫码打开虎嗅APP
从思考到创造
打开APP
资讯
视频
前沿科技
车与出行
商业消费
社会文化
金融财经
出海
国际热点
游戏娱乐
健康
书影音
医疗
3C数码
观点
其他
虎嗅视界
24小时
专题/活动
虎嗅智库
登录
极速注册
取消
搜索历史
删除
完成
全部删除
数码
互联网
数码
互联网
热搜词
短视频
字节跳动
拼多多
抖音
投资心态
美团
网易
人生
阿里
账号或密码错误
2014-09-19 13:16
【虎嗅夏季F&M节】百度张潼:深度学习接近人脑,是巨头竞相追逐的未来
虎嗅
虎嗅注:
虎嗅FM节上,百度研究院副院长张潼发表了有关于深度学习的主题演讲。现在为什么大家都很重视深度学习?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型有其独特的优势。在张潼及百度的愿景里,深度学习的意义是研发出最接近人脑复杂程度的模型,而这也是Google正在追逐的未来,这可能是互联网公司目前正在进行的最前沿研究。以下是他演讲的主要内容,虎嗅进行了编辑。
这是我第一次来深圳,也是第一次来虎嗅参加类似的活动,我是搞技术的,我做的更多的还是面向于偏技术的,我很高兴跟大家分享。如果大家跟数据有关系,特别是互联网企业都会对数据打交道,深度学习近年来是非常火的概念。
很多人对深度学习感兴趣,包括VC等等,他们看到的是什么呢?很多互联网公司会对技术非常感兴趣。像谷歌做了很多事,2011年成立了谷歌大脑的计划,这个比较著名的人是Andrew Ng,另外一个是Jeff Dean,他们当时的目的是想建一个世界最大的深度学习网络。
我跟大家分享一下这个技术能做什么,为什么大家的兴趣那么大?互联网,大家说大数据,为什么我们这么重视数据,百度要用数据来做智能化,特别是人工智能实验室,一个是数据,一个是智能,这两个是关键词。互联网目前是几种模式,如果看BAT的话,一个是联接人和信息,像百度,阿里是联接人和商品,还有腾讯和facebook都是联接人和人。主要是这三个模式,另外还有线上线下。
这些实际上都是数据驱动,跟传统的不太一样,互联网企业讲快速迭代,一个是数据驱动,这样要进行很多分析。特别是进行到一定的程度,比较高度的时候,你需要提取数据,其中一个是数据制导,比如百度的搜索技术、语音技术等等。深度学习更大的概念是机器学习,如果我们看一个图的话首先是有大数据,然后是分析,包括建模,用高效的算法解决这些模型,然后集合到你的系统里面,最后就成为一个智能化的系统。深度学习在整个流程里面最主要的是复杂模型,像人脑的模型,这个模型的效果非常好。深度学习是互联网数据分析必不可少的。
我们说一下语音,这是深度学习用得比较广的领域,你说一句话,通过计算机给你翻译出来。机器学习有输入输出,输入是声学信号,输出就是变成文字,比如说你好或者其他的。问题规模是非常大,基于大数据,百度或者类似大的互联网企业都是上万小时的语料,数据规模是百亿级,类别上万类。你进来的是一些文字,最后你希望用它训练出来一个模型,而这些模型最后可以在线上用。模型在这里是深度学习的模型,这是目前效果最好的一个方式。计算技术上需要大规模的计算技术,有一些技术的瓶颈需要处理。
从模型上来讲有两种,深度学习相对应的概念是浅度学习,浅度也是一个机器学习模型,它的意思就是人工要抽取特征,通过人工的方式变成计算机可以识别的,然后学习跟学习线性组合。后来发现数据量变得更大的时候,你可以用更复杂的模型,这些模型包括深度的模型,它的好处就是可以从原始出发自动学习组合,这样的能力是人工不足的地方就用机器代替,然后要并行大数据,另外要很大的计算能力,这样就能得到更好的效果,就能实现类似智能化。
智能化是今后十年大家最关注的技术前沿,这从技术瓶颈上也是非常高的。举一个图像识别的例子,它怎么从产生到生成,然后学习一些比较高级的。比如开始进来的都是一些图像的像素,后面一层就会有一些边出来,再下一层就是学习特征,再上面就组建成人脸。这种信息是自动学出来的,不是人制造的。传统的学习方法是人来做的。语音也类似,也是从低到高慢慢建立起来的。 另外它非常像人大脑的结构,深度学习本身是模拟大脑的,它的结构跟大脑走得非常近。从某种意义上来讲深度学习跟人脑是非常近的。图像识别传统的方法是在2010年用浅层模型,达到了74%,到2012年有了非常大的提升,达到了85%。
现在为什么大家都很重视深度学习呢?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型独特的优势就会显现出来了。
想象一下将来数据会越来越大,特别是互联网里面,各位如果创业的话对数据也非常关心,将来也是非常大的数据,建立复杂模型也是非常重要的。
数据规模,首先是成倍的增长,包括广告、语音、图像等等。另外一个是计算能力,其中有一个代表,GPU的出现,你计算是用CPU,最近深度学习用得比较多的是GPU,GPU使得计算能力大大提高,GPU一两个星期能处理的数据,CPU可能要一年。还有复杂的图像模型。最后要有一些算法支持它,它有异步式的算法来支持它的计算。
我们的目标是使计算机更加智能,这是在座各位想做的事,要智能,能够理解人,能够知道意图。我们现在的手段跟以前的区别是我们有大数据。那我们就要分析它,复杂模型就很重要。计算能力也上去了,最后要做一个系统才能达到你的目的。深度学习是非常接近人脑,第二是向人工智能走得非常近,也许它不是最终的目标,但是有很好的效果提升。
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:
前沿科技
支持一下
赞赏
0人已赞赏
分享至:
1
大 家 都 在 看
【虎嗅夏季F&M节】“出门问问”CEO李志飞:那些牛逼的工程师适合创业吗?
虎嗅
27:58
思创力中国出海意见领袖论坛上线
钱德虎
【虎嗅夏季F&M节】硬件之都论硬件创新,圆桌会议甚至聊出了智能炒菜机
虎嗅
【虎嗅夏季F&M节】平安科技杨一辰:金融企业向左、互联网企业向右
虎嗅
【虎嗅夏季F&M节】90后米公益创始人王子:公益是平的,公益也是一种消费
王子
【虎嗅夏季F&M节】伏牛堂张天一:找回餐饮业的尊严,开创以餐馆为流量入口的商业模式
虎嗅
【虎嗅夏季F&M节】华大基因李英睿:生命是什么?我们为什么要研究它?
虎嗅
【虎嗅夏季F&M节】腾讯蒋杰:实时计算,腾讯用它来干嘛?
虎嗅
大模型的经济账怎么算?
峰小瑞
2万字解读:人工智能这次真的能带动科技产业复苏么?
INDIGO 的数字镜像©
AI首先替代的不是蓝领白领工作?
中欧EMBA
25:27
#AI有多智能
越来越卷的人工智能,未来发展方向究竟在哪儿?
老石谈芯
13:10
#AI有多智能
2023年科技界热度之王:AI大模型的崛起与影响
万大叔
12:49
#AI有多智能
年度热门词汇“大模型”是突然爆发的新事物吗?
复旦管院
27:05
#AI有多智能
对话百度李彦宏:开源模型是智商税,AI Agent正在爆发
硅谷101
12:03
#AI有多智能
中国电信,又拿了个第一
量子位
14:40
#AI有多智能
AI是下一场“互联网泡沫”?谈谈大模型发展的三个瓶颈
白呀白Talk
47:13
#AI有多智能
AI的价值探索:如何拓展商业边界?
大咖说小编
06:21
#AI有多智能
十万亿参数,能堆出一个通用人工智能么?
量子位
04:07
#AI有多智能
中国大模型为什么更关注产业?
脑极体
大 家 都 在 搜
短视频
字节跳动
拼多多
抖音
投资心态
美团
网易
人生
阿里
APP内打开
好的内容,值得赞赏
您的赞赏金额会直接进入作者的虎嗅账号
自定义
支付:
元
匿名赞赏
支付