正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2015-11-17 08:08

IBM新型导航APP:让视觉损伤者“看见”外面的世界,向其他人一样自由漫步

IBM Research scientist Chieko Asakawa demonstrates the new NavCog app at Carnegie Mellon University. (Courtesy Carnegie Mellon)


IBM,这个蓝色巨人近年来在科技领域似乎过于保守。从生产机械制表机开始,直到成为一个集硬件、软件和服务于一身的大型科技企业,IBM在自己的领域显得非常专注,并不轻易进行核心领域之外的其他科研活动。它曾经在存储技术、数字通信技术、半导体芯片技术等方面领先世界,但是也仅仅是浅尝辄止,并没有深耕细作,形成完整的产业链。它更多地是不断完善自己的系统,以服务于政府单位、金融机构和大企业,似乎对个人零售产品不太感兴趣。


即便到了移动互联网时代,也不见得它在个人版APP上的开发有多大的突破。虽然在去年和苹果公司合作开发了10款IOS系统的APP,涉及航空、金融、保险、电信、零售以及政府通信等领域,但是这些APP无一例外全部是企业版本。比如一款叫做Plan Flight的APP,主要用途是供飞行员提前查看航班时刻表、航班计划以及机组人员名单,在飞行中向地勤人员报告遇到的问题,提出最佳燃油使用推荐,很显然这个APP是为航空公司设计的。


服务大企业和大机构是IBM的一贯作风,也是这家企业传承已久的商业传统和文化基因。二战时期,它甚至还制造过枪械武器,当时下订单的是美国国防部。


这是一个足以傲视全球的巨无霸,但是最近它悄悄改变了作风,开始研发一款个人用的APP,说实话,这个APP还不一定有多少人用,但是这个转变无疑是值得期待的。


IBM和卡内基·梅隆大学合作开发个人用APP


华盛顿邮报近期在科技栏目上刊发了一篇短文,介绍了一款可以做盲人眼睛的新型APP,那么这个被叫做NavCog的应用到底如何呢?下面先简单介绍一下。


1、由IBM和卡内基·梅隆大学合作开发。负责这个手机应用开发的工程师来自久负盛名的IBM Research和卡内基-梅隆大学,这个开发工程是双方的合作项目。有意思的是,其中一个主要的工程师,名叫Asakawa的女士,她自己本身就是一个盲人,她对这个应用充满期待和自信,她希望以后能够凭借这个应用在科研楼里自由漫步。


2、它不只可以导航。习惯了手机地图的我们,对于导航功能并不陌生,甚至是司空见惯。可是对于盲人,事情就没有那么简单了。不过,这个应用的构想也是不简单的。


  • 首先,这个应用可以通过语音或者震动两种方式,为盲人提供信息并进行导航;

  • 其次,它可以将盲人的周边环境处理成3D空间模型,并通过超声波提供更准确的定位和导航制导;

  • 第三,为了让盲人知道身边都有谁,这个应用还贴心地提供了人脸扫描功能,并能告诉盲人身边的人的情绪。


当然,导航功能目前已经成熟,而人脸识别还在探索。


3、它暂时依赖蓝牙灯塔提供的信号。应用的运行在目前主要依靠蓝牙灯塔(Bluetooth Beacon),蓝牙灯塔在国内可能不多见,但是在苹果、谷歌等企业已经有相关的产品问世,简而言之,它是一种比较方便的信号传递载体。目前,NavCog的试验主要依赖于遍布校园的蓝牙灯塔,不过根据工程师们的介绍,他们的工作方向是逐渐让应用适应各种环境,适应没有蓝牙灯塔的环境。


蓝牙.jpg

(蓝牙灯塔,图片来源:http://digi.tech.qq.com/a/20150901/013329.htm  )


IBM也许会给人们带来惊喜


如果NavCog的导航和人脸识别系统完善了,那么它将是盲人的一大福音。或许某一天在街头上,你可以看见一个身穿休闲装、戴着耳机悠闲散步、时不时和路上的熟人打招呼的人,她看起来和我们一模一样,谁也不会说她是个盲人。


不过IBM的工程师不满足这些,有了上述功能,工程师可以开发出其他提高辅助认知能力的应用,这些应用可以当做医护人员和气象监测员的助手,甚至它还有可能用到对自闭症的研究中来。


虽然目前的技术水平还没有达到此程度,但是不得不说这是IBM给人们带来的惊喜,一个蕴含着人文关怀的手机应用,一份进军个人版APP领域的华丽开端。


一款可以做盲人眼睛的新型APP


本文所提到的华盛顿邮报文章,我自己将这篇文章翻译出来了,供参考


随着计算机在周边环境下的感知能力的进一步提升,它也在帮助人们更好地感知这个世界。好在人工智能和机器人学等专业的发展,IBM Research和卡内基·梅隆大学的科学家正在为视觉损伤者研究一项让他们能够看见外面的世界的新方法。


这个目标不仅鼓舞人心,还极具创意——建立一个技术平台,让视觉损伤者可以向其他人一样自由漫步。这个工程的第一个尝试是一款叫做NavCog的应用,它可以在IOS系统和安卓系统上使用,这个应用可以通过耳机发出的声音或者让手机震动来为盲人导航(使用者可以选择设定应用为“声音模式”还是“震动模式”)。


就像汽车GPS提供的实时导航一样,这个应用为盲人提供实时的视角。它分析来自人行道上的蓝牙灯塔以及智能手机传感器提供的信号,能让盲人在没有其他人的帮助下自由行动,无论在学校建筑内还是在户外都可以。


当程序能够帮助盲人随时定位、告诉他们所处的方向以及周边环境的其他信息时,好戏就开始了。电子导航程序将手机内对周边环境拍下的照片处理成3D空间模型,以此来作为实时导航的指导。


NavCog工程,是位于Yorktown Heights 的IBM Research和卡内基-梅隆大学的合作项目,它对于工程的主要研究者之一的Chieko Asakawa具有特别的意义,她是IBM的院士以及卡内基-梅隆的客座教授,她是一个盲人。对她而言,利用这个APP帮助她在校园内行走将可能在短时间内变为现实,她戴着耳机,听着从手机里传过来的声音,行走时和别人并非两样。


 “这仅仅是一个开端”,卡内基·梅隆大学机器人研究院的Kris Kitani这样说道。当然,一个主要的目标,是要拓展被蓝牙灯塔覆盖面,目前的试验主要依靠的是大学校园里面的蓝牙灯塔。为了鼓励覆盖,项目科学家将NavCog平台完全开放了,开发者能够自由使用IBM BlueMix cloud上的资源。这使得其他的开发者有能力为系统强化其他方面的功能,并且加快展现出其他物理上的功能。


Kitani说,另一个重要目标,是使系统可以在任何环境,甚至在没有蓝牙灯塔的情况下运行。为了将这个可能性变为现实,学校希望在电子视觉和辅助认知两方面进行提升,开展新的工作。辅助认知这个领域的设立是为了增强盲人正在消失和弱化了的感知能力,从外界重新获得信息。


例如,通过电子辅助视觉系统对照片的处理,可能会发展一个更加精准的,不需要蓝牙灯塔的系统。此外,当电子辅助视觉系统与定位系统结合时,潜在地也就能识别出每天的“地标”。比如,路上一排台阶或者栅栏,这些东西目前并不能被传感器感应。


 “凭借对那些对象的本地化信息的理解,我们正在尝试一项技术,让现实环境更加适合每一个人。我们开展人类智能和机器人技术的研究已经有很长一段时间,我们能更好地完善人们对于周边环境的感知能力。这个开放的平台将扩大全球研究人员合作范围,一个视觉障碍患者观看世界的新时代即将来临。”

——卡内基-梅隆大学机器人学院院长Martial Hebert说。


得利于卡内基-梅隆大学内人工智能和机器人专业的融合,研究者计划在系统内加入其他的功能,使得NavCog不仅仅可以导航。举个例子,面部识别元件将实时提醒你,你正在一个熟人旁边路过。不止如此,传感器还可以识别人们面部表情所反映出来的情绪:因为它可以分析出在你面前匆匆而过的人是笑容满面还是紧锁眉头——这是与学校里其他关于自闭症的部分研究工作有关。研究者同时还可以探索通过电子视觉来判断周围的人的活动,通过超声波技术更加精准的定位。


如Asakawa所说,辅助识别的研究的进步创造出的NavCog应用与IBM Watson机构展示的电子识别是有类似的地方的。在这两个案例中,他们都在不断尝试在确保时效性的前提下提高人类的识别能力。例如,在IBM公司内部,研究者有时候会使用“Watson on my shoulder”这个术语来憧憬IBM Watson的未来。那将是一个连续的、地方化的存在,它可以为所有人提供辅助识别,包括医护人员和气象监测员。


如果一切进展顺利,那么就可以为机器智能和人类智能设想一个高质的反馈回路,在这里,为提升机器能力而发展起来的识别技术,最终也会促进人类能力本身的提升。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: