扫码打开虎嗅APP
虎嗅注:12月6日下午,虎嗅第8期听书会在世贸天阶腾讯汇举行,本期来与大家分享的是《浪潮之巅》《数学之美》《文明之光》的作者吴军博士。听书会的互动嘉宾是英特尔中国研究院院长吴甘沙。这次的话题是机器智能大数据和硅谷的投资新趋势,两位的分享都是干货满满,本文汇总了他们现场分享内容,虎嗅进行了编辑,有删节。
硅谷创投新趋势
(图片来自于吴军博士现场分享的PPT:硅谷 2.0 VC的变化)
这些年美国风险投资的金额,每年稳定在一年300亿美元,峰值的时候是在2000年前后,超过1000美元,其中硅谷占40%。但是从投入产出比来讲,过去两年比2000年高峰的时期还要高,它的回报很好。接下来20年有这样三个趋势:
1.云计算+移动互联网+大数据(正在进行时);
2.机器智能(现在时);
3.IT+生物医疗(未来时)。
将来所有的公司都是大数据公司
今后20年经济发展的动力就是大数据。什么是大数据?
1.大数据一定是数据量大,但也不仅仅是数据量大。
2.大数据不是结构化和非结构化的问题,根本特征一定是多维度的。
3.它强调完备性。
大数据跟机器智能的关系已经看逐渐清晰了,一旦产生的时候,它会让计算机好像变得很聪明,而为什么这时候爆发,有几个原因:
1.摩尔定律,存储量跟上来后,数据量就能够足够大,这时数据所发挥的作用就能成指数倍数地增长。
2.移动互联网,移动互联网时代人是真正的上了网,使得把我们人的数据真正的搜集起来了。
3.传感器技术,几年前我们把物联网炒得不行,现在多少有一点意思了。
我们可以想象这样的场景,以后我们在每件商品上贴一个传感器,你到家乐福买东西,选好东西过安检门时,后台就知道你是谁,买了什么。再和你的支付信息匹配,你手机上就有账单了,点一个确认就完成购物,省去了排队的时间。将来所有的公司,都会是大数据公司。举几个例子:
第一个是中国的风力发电公司,他们现在的问题在于:自己的产品装在哪里?每块叶片的工作情况和寿命是什么样?大数据能帮助解决其了解风力发电量,从而准确的判断市场。还能了解每块叶片的工作情况,从而准确维护,而不是过去一刀切五年一换。
第二个是PRADA,衣服上面有个防盗扣,它里面就装一个传感器,有了它就能知道一件衣服挂在那,被试了多少次,买了多少次。通过大数据的分析,就能明确知道衣服销量是店内陈设的位置不好,还是衣服本身的问题。所以通过传感器,他们的销售好了很多。
第三个例子有点搞,TARGET曾是美国第二大的零售,类似家乐福。他们通过数据分析,怀孕的妇女的购买需求是可以提前预测的,就把相关广告发送给顾客。一次,他们接到一个愤怒父亲的电话,说我这个女儿才15岁,你们给她寄婴幼儿的广告。经理赶紧道歉,当时把他安抚下来了。之后客户回访时,这个父亲反而道歉:“上一次是我错了,我的女儿真的怀孕了。”在大数据时代,数据中心可能比你更了解你。
大数据是机器智能的核心
谷歌的智能汽车,驾驶位是空着的。它上路跑了17万公里,只出了一次事故,还是人开车撞的它。这个项目是谷歌街景项目的延伸,从2010年到2014年,今年推出了真正的无人驾驶汽车。它没有方向盘,也没有刹车和油门,后来根据美国公路局的要求加了一个制动。大数据所做的就是让它更聪明一些,比如前面有一个紧急的事情可以停下来。智能汽车看上去是一个机器人,是一个智能问题,实际上变成数据处理的问题。未来的机器人,可能有一个数据中心,这是我们人真正害怕的东西。
未来是2%(的)人的世界
这是我今天想说的东西,讲了半天机器智能,未来的世界到底是人的世界,还是机器的世界,是不是觉得很可怕?
大家说富士康是血汗工厂,郭台铭先生要引进30万台机器人,有了机器人你卖血汗的机会都没有了。你可以说我读的是高大上的职业,跟卖血汗没有关系,机器不会影响我。事实并非如此,年薪三十万的放射科医生,美国医学院培养近十年才能上岗,专门辨别癌细胞。现在这份高大上的工作,有机器可以取代,而且比人工判断的准确率更高。
你要么当2%,要么当98%。未来世界,我们搞公平一点,征2%的人的税,给98%的人一个社会公平。但你给他们公平没有用,因为那98%的人前景是灰暗的,只需要2%就可以了,不要98%的人。美国采用了转基因技术后,农作物便宜得不得了,几十年之内人的体重一下子就增加了,别的什么东西也没得到。所以如果你现在不成为2%,就会是那98%。
提问:吴军老师强调未来是属于2%的世界,大家都很有危机感,在文学艺术领域,机器人是不是也能够超越人类?
吴军:机器能够使我们的不断地提升效率,但人有两点能力不会被机器人取代,第一个是脑力,第二个是空想能力,也可以说想象力、艺术能力。而我想强调的正是创造力、原创性,这是不管跟什么竞争的最根本的一条能力。
吴甘沙:创新刚才吴博士用了一个词原创性,这是一类,还有一类创新叫做组合式创新,基于现有的技术组建再进一步的创新。从原创新角度来说,基于大数据的智能应该说比较难,科学的发展,也不太可能靠大数据。但是在组合创新这一块,文学、音乐的创作都可以以假乱真,机器编曲能让专业人士以为是巴赫的风格。从这个层面来说,我觉得机器是能够胜任的。
提问:大数据的法律边界在哪里?
吴甘沙:现在大数据大家都在说,但是真正的玩家可能就那么几家,因为他们真正是拥有大数据的,未来如果大数据能够从根本上推动社会的发展,可能还需要数据的流通,就是没有数据但是有数据思维的这些人,他也能够接触到这些数据。数据一流通,就涉及到法律边界的问题,比如说数据拥有权。我在淘宝上进行了一次交易,这个数据是属于淘宝的还是我的?如果我跟我的太太共享一个帐号,后来离婚了,这个数据该怎么分割?如果一个人去世了,那数据遗产该怎么处理?我觉得这个拥有权是第一个问题。第二个就是隐私权,我什么数据不能让别人看。第三个是许可权,就是我什么数据可以给别人看,但是有什么约束,在什么时限、为某种目的你是可以用的,而且这个许可权是可撤消的。第四个是审核权,签订了协议后,你是否按照我们的约定使用我的数据了。最后一个,数据本身具有一种外部性,所谓外部性就是我采集的时候是因为这种目的而采集的,但是未来它可能会用于另外一种目的,我们强调的克强指数,克强指数的三个数据都不是直接关系到经济,但它能反映我们经济的运行情况。这是数据与传统资源不同,例如石油,它的价值在燃烧的一瞬间就完了,而数据是能够反复产生价值的。所以,如果谷歌,FB拥有我大量的数据,它在反复产生价值的过程中,我是不是可以要求有分红权,我觉得这些都是在探讨当中,变率的边界现在还不是特别清楚,但是我觉得未来如果数据充分的流通的话,一定要解决这些问题。
吴军:一方面,谷歌的数据是不介意共享的。另一方面,医疗数据是不太愿意共享,像美国的全国连锁医院,会搭建自己的私有云做这件事。而数据的所有权,中国现很少讨论,美国规定得比较清楚,但各地保存期又不一样,欧洲最严格。比如,在美国到了36个月,邮件是要删除的。这还是在数据没有流通以前,流通后问题更大。第三个方面,虽然现在很多大公司拥有数据,小公司不拥有,但是在做大数据分析和工具的小公司并不少,有的还很成功。在创业上,像这样服务企业数据、团队协同的的大数据的公司也是不错的。
提问:BAT在大数据人工智能运用方面,这三家的实力和未来的前景如何?
吴军:阿里巴巴应该是位置最好,它离商业最近,最容易用大数据变现。数据量来讲,腾讯是最多,但数据是非结构化的,数据使用还有法律问题,而且腾讯自己不是做商业的,变现过程会比较长。百度通过点击的模型提高搜索质量,已经用上了大数据,如果说百度有什么缺失,就是在移动互联网上的进度比另外两家慢了一点。
吴甘沙:我想从数据量来看,我了解到百度的数据量也不小。从基础设施我感觉阿里巴巴这块比较强,尤其是系统。再说机器智能、机器学习这些方面,三家都在做。但我的观察,他们三家的领导在外面讲的话,有不同的侧重点:百度的话非常强调技术,阿里强调生态系统,而腾讯强调一些链接和新的概念。