你不温顺我不主动人机关系究竟要怎样改变呢

2019年04月05日 来源:

技术这个事情,很多时候不是一挥而就的。

更多时候,是大家先看到了一个东西非常美好,结果左发展右发展也发展不起来,在吃瓜大众们兴奋地送上一首《凉凉》以后,弄不好哪天却突然一个胜负手抛出来,一切又都不一样了。

曾的移动通讯、触屏交互莫不如是,今天的3D打印、VR说不定也在重复这个套路。更明显的可能是物联。这个我们念道了好多年,虽然也一直在发展,但始终没有大热的技术,到底在等待甚么呢?

等待AI?但是音箱刮过一阵语音交互的风潮以后,IoT装备搭载语音控制模块也火了起来。可是直到今天,我们好像发现物联还是那个物联,基本没什么变化。

让我们往更深层开个脑洞,“AI of Things”在等待的,可能不仅是语音交互,而是线人鼻口耳协同工作的多模态AI交互。

你不温柔,我不主动:为何我们始终远离IoT?

首先我们要搞懂一件事:为何给装备联的方案推行了这么多年,我们身旁,包括工业和工程领域,真正用到的物联装备还是没有多少?

答案在于,光给机器设备联是没用的。你家的桌椅板凳又不想聊逛淘宝看快手,它们要作甚?

人终究需要的是服务,所以装备仅仅联是没用的,联以后必须能干点甚么才行。这就需要两件事情:

人与装备可交互;

2. 装备能够感知到人的需求。

在触屏、键盘和集成遥控模式,都被证明太麻烦以后,物联开始把眼光投向了能够提供自然交互与感知能力的AI。

机器能够听懂人类说话,并且产生对话并提供服务,仿佛某种意义上从源头解决了物联装备缺少实际价值的为难。因而我们见到了越来越多搭载语他会抱着感恩的心去看待这段故事音交互平台,能够实现对话的物联装备。从电视、冰箱到家居设备,再到各种终端不胜枚举。

但实践下来发现,这类模式问题还是很多:

比如语言控制不如屏幕控制那末精准,很多时候会误判指令和毛病唤醒,比较语言充满了不确定性;

再比如,语音交互的物联设备还是缺少主动服务的能力,只是换了操作方式而已,用户体验没有本质提升。

仅仅是“能听”,并且还常常听错的物联设备,就像是两个人谈恋爱,其中一方历来不看你,不会知冷知热、嘘寒问暖,还常常搞错对方的意思,那另外一方固然表示我懒得理你……

目前来看,把按钮换成了语音命令平台,隐藏的不确定性太多,而实际价值太少,很难成为物联爆发的真正依托。

这类“你不温顺我不主动”的人机关系究竟怎样改变呢?

答案也许是让机器能够听和说以外,还要能看,能感觉,甚至能将五感联系到一起进行思考。

感知到交互:机器的五感俱全

所谓“模态modality”,是德国生理学家赫尔姆霍茨提出一种生物学概念。即生物凭仗感知器官与经验来接受信息的通道,比如人类有视觉模态、听觉模态等等。

后来这个概念引伸到人文科学领域,成为哲学和文学上的一种话语批评方式;而来到机器人和计算机科学领域,就成了机器与物理世界联系的通道。

假如我们把“模态”通俗地理解为感官,那末智能音箱就是只具备听觉模态的物联装备,而加载AI分析能力的摄像头可以视为视觉模态的物联装备。把听觉、视觉乃至更多模态组合到一起,多模态物联也就诞生了。

事实上,在AI研究当中多模态转换是非常普遍的课题。比如一个很出名的AI研究方向是让智能体根据看到的某张图片来生成文字(也有看到文字生成图片和视频的),这就是让AI模型完成在视觉和语义之间的模态转换。

运用到物也转一圈联装备当中,今天主要的AI感知模态有三种:

语音交互,包括语音指令控制、语义理解、多轮对话、NLP、语音精准识别等领域;

2. 机器视觉,包括自然物体识别、人脸识别、肢体动作辨认等;

3. 传感器智能,包括AI对热量、红外捕捉信号、空间信号的浏览与理解。

把这三种东西融会在一起,物联设备就可以在单纯的能听会说之外,同时还用摄像头视察、用传感器判断。而比较前沿的多模态感知研究当中,还包括机器嗅觉,机器触觉和情绪理解等内容。

我们在等待的下一代物联装备,很可能窍门就是把这些模态给揉在一起,完成从多模态感知到多模态交互的体验。用一句我们十分熟习的话说,就是要让机器身上的5感“生态化反”……

今天让人乐观的多模态交互型IoT

又能听,又能看,又有传感器的装备,听上去似乎有点过分乐观了。但好在综合了较多采访与视察之后,我们发现今年确实是值得为多模态物联装备乐观一下的时候。

可以看到,很多双模态交互,甚至多模态混合交互的解决方案都在从实验室里走出来,乃至已经可以在我们生活中看到。这些解决方案更重要价值是作为案例,可以让更多企业、开发者和垂直行业看到多模态物联的可复制价值。

举例来说,离我们最近的多模态AI交互技术投射在物联装备上,大概就是用机器视觉技术进行嘴唇辨认,来分离语音交互指令。我们可以看到很多实验室和科技公司,都在尝试用机器视觉来读取说话人的唇语和动作,从而判断每一个声音指令的来源。

这类技术已在国内被应用到地铁售票解决方案中,通过机器视觉来辨认买票人,从而在地铁站的喧闹环境中完成语音售票。

另一个我们能看到的例子是空调。在一些新的智能空调解决方案中,空调会在语音交互的基础上通过机器视觉来判断用户的位置,提供智能送冷,并且会结合传感器判断屋内温度和湿度,提供更精准的环境方案。

一样是在家电上,今年电视背后的AI平台战打得风生水起,把机器视觉技术引入电视成为了新的趋势。通过机器视觉来让电视视察屋内照明情况、用户与电视的距离,电视可以主动调理屏幕光线强度,输出比较护眼的模式。还有的AI运用是让电视在观察到儿童看电视后主动开启童锁。

在日常生活以外,多模态交互设备也在应用于工业装备中。比如通过给机器设备搭载机器视觉+传感器提供安全正告,和利用机器视觉+故障信号的方式判断装备问题等。

把不同信号模态整合在一起,实现装备的多维感知,今天正在以比较快的速度来到运用市场。

高精度判断用户命令,输出主动服务;提供实时化、弹性化的体验,可以说是AI带来的多模态交互技术放进物联世界中的一张鬼牌。

固然了,还是有几道难关……

按照惯例,最后我们还是要重视任何技术都存在不足。刚刚有一点萌芽的多模态交互+物联固然也不例外。

最核心的一个问题,是我们到底靠甚么实现多模态协同?

目前来看,无论是家电还是工业装备,实现多模态混合的主要方式还是把不同的传感源输入到设备处理中心,启动一定程序来开启相应服务。

换句话说,AI模型本身是没法理解多模态信号的,只是不同的算法启动不同的开关而已。这种“伪AI多模态”的装备也不是不行,只是在实时化和复杂的推理判断上会有心无力。

解决方案可能是一种叫做“多模态深度学习”的技术,让AI智能体本身能够理解多模态信号,从算法本身就容纳听觉、视觉、传感信号进行统一思考。这样可以保证装备高度实时化,并且可以让装备进行多模态协同学习,真正地“聪明”起来。

这要求在算法上对多维度数据的各自表示、融会、对齐有新的突破,今天我们还只能等待学术界的好消息。

另外一个问题,是今天的多模态交互缺少有效的开发平台,开发者和企业很难复制这1模式,来进行独立的物联解决方案开发。固然,目前来看这应当仅仅是个时间问题。

与之相对应的,是在缺乏行业标准、开发基础的前提下,今天开发一个多模态物联项目需要大量的人材本钱和综合开发本钱。并且缺少芯片、专用传感器等后端硬件的支持。这个领域国内有一些芯片和算法公司,但仿佛大部分处在做PPT的画饼阶段。

综合来看,AI带来的多模态想象力,大概确切可以完成一些物联很早就希望实现的东西。但方兴未艾的产业局势,还需要巨头搭建平台、优良案例出现、开发者路径明确等几个环节才能开启下一轮风口。

但无论如何,耳聪目明的机器,已在跑步过来的路上了……

*文章为作者独立观点,不代表虎嗅立场

本文由 脑极体 授权 虎嗅 发表,并经虎嗅。转载此文请于文首标明作者姓名,保持文章完整性(包括虎嗅注及其余作者身份信息),并请附上出处(虎嗅)及本页链接。原文链接:

未依照规范转载者,虎嗅保存追究相应的把握每次的机会权利

7个月宝宝感冒咳嗽流鼻涕怎么办
婴儿感冒咳嗽
儿童咳嗽药排行榜
相关文章
  • 列车停靠时间太短重病乘客未及下车中途死亡
    列车停靠时间太短重病乘客未及下车中途死亡

    列车停靠时间太短 重病乘客未及下车中途死亡昨日上午,一男子在南昌开往北京西的T168次列车上突发癫痫。随后该车经停新乡站时,家属正欲将其抬下车,列车却再度启动。一小时后,列车临时停靠安阳,但该男子已死亡。【8时零5分郑州站】妹妹发现 叫不醒 哥哥...

  • 经济转型缓慢俄政府被指应对乏力
    经济转型缓慢俄政府被指应对乏力

    面对经济衰退,由于缺乏明确的应对危机的政策,俄罗斯政府正饱受指责。经济转型缓慢俄政府被指应对乏力面对经济衰退,由于缺乏明确的应对危机的政策,俄罗斯政府正饱受指责。2014年,俄罗斯经济遭遇了一整年的下滑,卢布又由于油价下跌和西方制裁,大幅贬...

  • 捷克一岁儿童入选最美海尔粉丝成海尔最小粉丝
    捷克一岁儿童入选最美海尔粉丝成海尔最小粉丝

    孩子的世界总是充满好奇,他们总想亲自去体会身边的所有事物。近日,在海尔开展的寻找最美海尔粉丝活动中,一张捷克小朋友和海尔酒柜的合影照片成为众多友的关注焦点。照片中,在欧式装修风格的客厅里,一个小脑袋从柜子旁边探了出来,褐色的头发和棕色...

  • 俄罗斯最大车企再获输血
    俄罗斯最大车企再获输血

    据11月11日出版的《共青团真理报》报道。早在今年春天,他已要求政府向这家本国最大汽车企业提供250亿卢布。据报道,最新的这笔资金将用于安置被伏尔加汽车集团解雇的1.5万名员工。俄政府对伏尔加汽车集团的财政援助总额可能达到550亿卢布,但继续划拨资金...

  • 湖南省委管理干部任前公示公告市民可监督举报
    湖南省委管理干部任前公示公告市民可监督举报

    24日,湖南省委组织部发布省委管理干部任前公示公告,对一批经省委常委会议研究决定的拟任职人选(或提名人选、候选人人选)进行任前公示(名单见表格)。  受理举报时间:5月25日至31日;受理举报单位:省委组织部干部监督处、举报中心;受理地点:省委大院...

  • 广州毕业游指南
    广州毕业游指南

    公园游乐场:越秀公园、珠江夜游、广州动物园、香江野生动物世界等。但怎样在广州玩的开心方便又少花钱呢,下面是本人观查后的一些看法和经验,希望能给将要来广州旅游的朋友有些帮助。1、关于住宿出门在外,住宿可能是头等大事,也是比较花钱的地方。那...