你开车的时候,试过用语音操作你的手机么?
一定没有,因为大多数手机的语音操控根本不能实现连续对话,而且也不能对地图App里的行为进行操作——什么语音助手都不如副驾上坐个人更方便。
不过,这种状况就要改变了。
搜狗地图的一名产品经理,拿着最新版的搜狗地图喊到“汪仔汪仔,我想去颐和园”,随后搜狗地图就开始自己设定路线:
“颐和园在海淀区xx路,去东门可以嘛?”
“我想去北如意门。”
“好的,路线设定完毕。”
“我要走四环。”
“好,走四环,路线已更新完毕。”
“我们顺路加个油。”
“推荐xxx加油站,可顺路加油,已设定为途经点。”
这段连续的语音对话,正是搜狗地图此次发布的新功能——在以往,这往往是一个拿着手机的副驾驶干的活儿,所以这个功能就叫“智能副驾”。
搜狗地图智能副驾的功能完全基于手机,从呼唤“汪仔汪仔”一开始,就全程由语音交互。理论上,这并不是一个全新的产品,而是将语音交互加入到原有的搜狗地图中,但实际中却剩了司机单手操作的很多麻烦。

根据搜狗地图现场介绍,搜狗地图智能副驾能够全语音完美支持各种车内垂直类场景对话,包括语音查地点并发起导航、语音设置途经点、语音设置路线、语音问路况、语音沿途搜、语音查周边以及语音操作地图等。
在导航过程中,当用户问出“前面是否堵车”时,搜狗智能副驾也会给出前方是否为缓行路段的提示,如果用户临时更换地点,也可通过纯语音交互快速重新规划路线。而当用户问到“奥森附近是否有停车场”以及“是否有好吃的地方”时,智能副驾还会根据用户的需求推荐附近的停车场和餐厅,并且告知价格、距离等,通过智能分析对比反馈给用户最合适的选择。
本质上,原有的地图产品加上现在流行的多轮语音对话技术,似乎并不是什么难事儿。但是为了能让这个“虚拟副驾驶”对答如流的像个真的副驾驶,还是有一定难度的。
将AI语音多轮交互加入到地图产品中,其实面临了几个新问题,搜狗地图负责人孔祥来介绍道:
第一个是语音文字命令的转换问题,在车内嘈杂环境、手机语音采样并没有特定优化的前提下,需要优化降噪、纠错等语音识别技术方面的工作;
第二个是语义理解,出于安全考虑,车载环境应该长时间免去手的操作、眼神的注意力,但搜狗此次提出的多轮对话其实相当激进,对语音对话模型提出了更高的要求;
第三个是地图本身方面的数据问题,在多轮对话的要求下,需要将地图数据逻辑重构,建立一个有逻辑的层级,听起来必须要合理。比如当用户喊出去“想去附近的饭馆时”,下一步就是将分好的“菜系”提供到用户面前——“你想吃川菜、还是山东菜?”
不过,虽然命名为“智能副驾”,但开车时进行语音交互,如果这方面的工作有任何一点操作不流畅——出现错误、打断、多余的语音反馈,免不了会让司机大骂“弱智”,并且急切地关掉这个产品。

孔祥来提到——目前,搜狗地图针对地理位置专门优化后语音识别正确率已达97%;搜狗智能导航全程人机对话支持超过10万的语义网络,能够细分场景,精细、准确、可靠地处理对话需求,直达用户意图。
从PingWest品玩(微信号:wepingwest)的试用情况来看,搜狗地图智能副驾确实实现了在一些固定任务的多轮对话,背后也体现出了一定的知识逻辑。
比如“去机场”,智能副驾会立即反馈去“去T1、T2还是T3”,“走机场高速还是走京密路”;但仅限如此,如果天马行空地去问一个它没设定好的任务问题,搜狗地图智能副驾还是会很俏皮的“打哈哈”过去。
在一个传统地图项目上,提出新的语音助手的概念,其实是如今非常显而易见的现象。只不过目前来看,大数据的高德还没有公开披露过将语音赋于地图产品的时间,百度也没有公开提出过相关的计划,而搜狗地图率先提出这样的新进展,是试图从一个小角度割开地图市场的一个豁口。
孔祥来也提到,这个项目的意义也已经不在于去抢占市场份额,获得用户增长。“通过我们在手机上的产品,我们更希望我们的产品获得车厂的认可,我们也有福特这样级别的合作伙伴,在下半年的新车里就能看到我们的产品了。”
孔祥来认为,在车内的语音交互,会构建一种全新的模式。通过这样一个语音的入口,用户在车内导航中可以实现更多的事情;而不是像其他产品在地图上做O2O、接入共享单车等等;这两个做法不是一个维度的事情。
搜狗地图负责人孔祥来提到,此次搜狗地图率先在行业内实现了全程多轮语音交互这一重大突破,主要得益于搜狗优秀的语音识别、语义理解、智能纠错、智能搜索、意图分析等综合技术能力。搜狗每日2.4亿次的语音请求量,积累了大量的语音语料数据,尤其是在噪音环境和口音数据方面更是有着巨大的优势。
谈及对比其他的地图产品,孔祥来认为他们的产品整合冗余度更多,搜狗地图和搜狗语音的团队本就在一起。他提到其他公司的整体战略不一定能照顾到某个具体的产品。
0 条评论
请「登录」后评论