正确的提示信息
扫码打开虎嗅APP
从思考到创造
打开APP
资讯
视频
前沿科技
车与出行
商业消费
社会文化
金融财经
出海
国际热点
游戏娱乐
健康
书影音
医疗
3C数码
观点
其他
榜单
虎嗅视界
24小时
妙投APP
虎嗅智库
登录
极速注册
取消
搜索历史
删除
完成
全部删除
数码
互联网
数码
互联网
热搜词
腾讯
房子
微信
IPO
香港
海底捞
火锅
烂尾
区域经济
账号或密码错误
2014-09-19 13:16
【虎嗅夏季F&M节】百度张潼:深度学习接近人脑,是巨头竞相追逐的未来
虎嗅
虎嗅注:
虎嗅FM节上,百度研究院副院长张潼发表了有关于深度学习的主题演讲。现在为什么大家都很重视深度学习?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型有其独特的优势。在张潼及百度的愿景里,深度学习的意义是研发出最接近人脑复杂程度的模型,而这也是Google正在追逐的未来,这可能是互联网公司目前正在进行的最前沿研究。以下是他演讲的主要内容,虎嗅进行了编辑。
这是我第一次来深圳,也是第一次来虎嗅参加类似的活动,我是搞技术的,我做的更多的还是面向于偏技术的,我很高兴跟大家分享。如果大家跟数据有关系,特别是互联网企业都会对数据打交道,深度学习近年来是非常火的概念。
很多人对深度学习感兴趣,包括VC等等,他们看到的是什么呢?很多互联网公司会对技术非常感兴趣。像谷歌做了很多事,2011年成立了谷歌大脑的计划,这个比较著名的人是Andrew Ng,另外一个是Jeff Dean,他们当时的目的是想建一个世界最大的深度学习网络。
我跟大家分享一下这个技术能做什么,为什么大家的兴趣那么大?互联网,大家说大数据,为什么我们这么重视数据,百度要用数据来做智能化,特别是人工智能实验室,一个是数据,一个是智能,这两个是关键词。互联网目前是几种模式,如果看BAT的话,一个是联接人和信息,像百度,阿里是联接人和商品,还有腾讯和facebook都是联接人和人。主要是这三个模式,另外还有线上线下。
这些实际上都是数据驱动,跟传统的不太一样,互联网企业讲快速迭代,一个是数据驱动,这样要进行很多分析。特别是进行到一定的程度,比较高度的时候,你需要提取数据,其中一个是数据制导,比如百度的搜索技术、语音技术等等。深度学习更大的概念是机器学习,如果我们看一个图的话首先是有大数据,然后是分析,包括建模,用高效的算法解决这些模型,然后集合到你的系统里面,最后就成为一个智能化的系统。深度学习在整个流程里面最主要的是复杂模型,像人脑的模型,这个模型的效果非常好。深度学习是互联网数据分析必不可少的。
我们说一下语音,这是深度学习用得比较广的领域,你说一句话,通过计算机给你翻译出来。机器学习有输入输出,输入是声学信号,输出就是变成文字,比如说你好或者其他的。问题规模是非常大,基于大数据,百度或者类似大的互联网企业都是上万小时的语料,数据规模是百亿级,类别上万类。你进来的是一些文字,最后你希望用它训练出来一个模型,而这些模型最后可以在线上用。模型在这里是深度学习的模型,这是目前效果最好的一个方式。计算技术上需要大规模的计算技术,有一些技术的瓶颈需要处理。
从模型上来讲有两种,深度学习相对应的概念是浅度学习,浅度也是一个机器学习模型,它的意思就是人工要抽取特征,通过人工的方式变成计算机可以识别的,然后学习跟学习线性组合。后来发现数据量变得更大的时候,你可以用更复杂的模型,这些模型包括深度的模型,它的好处就是可以从原始出发自动学习组合,这样的能力是人工不足的地方就用机器代替,然后要并行大数据,另外要很大的计算能力,这样就能得到更好的效果,就能实现类似智能化。
智能化是今后十年大家最关注的技术前沿,这从技术瓶颈上也是非常高的。举一个图像识别的例子,它怎么从产生到生成,然后学习一些比较高级的。比如开始进来的都是一些图像的像素,后面一层就会有一些边出来,再下一层就是学习特征,再上面就组建成人脸。这种信息是自动学出来的,不是人制造的。传统的学习方法是人来做的。语音也类似,也是从低到高慢慢建立起来的。 另外它非常像人大脑的结构,深度学习本身是模拟大脑的,它的结构跟大脑走得非常近。从某种意义上来讲深度学习跟人脑是非常近的。图像识别传统的方法是在2010年用浅层模型,达到了74%,到2012年有了非常大的提升,达到了85%。
现在为什么大家都很重视深度学习呢?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型独特的优势就会显现出来了。
想象一下将来数据会越来越大,特别是互联网里面,各位如果创业的话对数据也非常关心,将来也是非常大的数据,建立复杂模型也是非常重要的。
数据规模,首先是成倍的增长,包括广告、语音、图像等等。另外一个是计算能力,其中有一个代表,GPU的出现,你计算是用CPU,最近深度学习用得比较多的是GPU,GPU使得计算能力大大提高,GPU一两个星期能处理的数据,CPU可能要一年。还有复杂的图像模型。最后要有一些算法支持它,它有异步式的算法来支持它的计算。
我们的目标是使计算机更加智能,这是在座各位想做的事,要智能,能够理解人,能够知道意图。我们现在的手段跟以前的区别是我们有大数据。那我们就要分析它,复杂模型就很重要。计算能力也上去了,最后要做一个系统才能达到你的目的。深度学习是非常接近人脑,第二是向人工智能走得非常近,也许它不是最终的目标,但是有很好的效果提升。
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:
前沿科技
支持一下
赞赏
0人已赞赏
分享至:
1
大 家 都 在 看
【虎嗅夏季F&M节】“出门问问”CEO李志飞:那些牛逼的工程师适合创业吗?
虎嗅
27:58
思创力中国出海意见领袖论坛上线
钱德虎
【虎嗅夏季F&M节】硬件之都论硬件创新,圆桌会议甚至聊出了智能炒菜机
虎嗅
【虎嗅夏季F&M节】平安科技杨一辰:金融企业向左、互联网企业向右
虎嗅
【虎嗅夏季F&M节】90后米公益创始人王子:公益是平的,公益也是一种消费
王子
【虎嗅夏季F&M节】伏牛堂张天一:找回餐饮业的尊严,开创以餐馆为流量入口的商业模式
虎嗅
【虎嗅夏季F&M节】华大基因李英睿:生命是什么?我们为什么要研究它?
虎嗅
【虎嗅夏季F&M节】腾讯蒋杰:实时计算,腾讯用它来干嘛?
虎嗅
2万字解读:人工智能这次真的能带动科技产业复苏么?
INDIGO 的数字镜像©
25:27
#AI有多智能
越来越卷的人工智能,未来发展方向究竟在哪儿?
老石谈芯
迈向2024,AI创业有哪些新机会?
峰小瑞
ChatGPT和AI大模型,下一个时代的跳板?| 502回顾
虎嗅智库
13:10
#AI有多智能
2023年科技界热度之王:AI大模型的崛起与影响
万大叔
12:49
#AI有多智能
年度热门词汇“大模型”是突然爆发的新事物吗?
复旦管院
12:03
#AI有多智能
中国电信,又拿了个第一
量子位
14:40
#AI有多智能
AI是下一场“互联网泡沫”?谈谈大模型发展的三个瓶颈
白呀白Talk
47:13
#AI有多智能
AI的价值探索:如何拓展商业边界?
大咖说小编
06:21
#AI有多智能
十万亿参数,能堆出一个通用人工智能么?
量子位
04:07
#AI有多智能
中国大模型为什么更关注产业?
脑极体
05:53
淘宝有这么多数据,为什么“猜你喜欢”还是打动不了你
造就Talk
大 家 都 在 搜
腾讯
房子
微信
IPO
香港
海底捞
火锅
烂尾
区域经济
APP内打开
好的内容,值得赞赏
您的赞赏金额会直接进入作者的虎嗅账号
自定义
支付:
元
匿名赞赏
支付