新浪新闻客户端

这个语音技术有点牛:标准英语听不懂,印度英语对答如流

这个语音技术有点牛:标准英语听不懂,印度英语对答如流
2019年10月21日 12:17 新浪网 作者 上海汽车报

  最近,上汽MG HECTOR在印度热得有些过火。3个月,3.1万张定金订单,7000辆新车交付,产品供不应求。据分析,MG HECTOR热销的一个重要原因是,支持印度英语的语音控制i-Smart系统给年轻消费者带来互联网体验。

  这个语音技术有点牛:标准英语听不懂,印度英语对答如流

  这个语音技术有点牛:标准英语听不懂,印度英语对答如流

  混合语音技术的发展使得语音识别技术能够以高性价比的方式在汽车平台实现,达到性能与成本的平衡。斑马智行1.0以语音为核心的交互架构和以地图为桌面的产品理念,让汽车实现了“人在线车在线服务在线”;斑马智行2.0从主驾到副驾的语音交互拓展,搭建车主间的沟通基础设施,推出斑马智行互联认证平台,实现更多的智能设备互联。斑马智行MARS版融合了更多的AI技术,包括语音混合引擎。在语音升级方面,MARS版通过阿里ET与Cerence两大智能语音供应商,形成线上与线下两大语音库。具体而言,离线语音将语料保存到本地,驾驶过程中的弱信号或无信号环境下,也可进行语音识别和对答。本地+云端结合的方式,能满足车主全方位交互需求,功能交互更具情感化。

  这个语音技术有点牛:标准英语听不懂,印度英语对答如流

  一款好的车机语音对汽车而言,显得尤为重要。那什么样的车机语音是好的? Cerence中国创始人兼总裁蒯文瑞给出了他的答案:好的车机应该向空气一样,想得到,用得上,离不开。传统的车机语音都是预设的声音,你最多可以选男声或女声。最新上市的荣威RX5 MAX搭载斑马智行MARS ,引入了由Cerence提供的全球首发车载语音克隆技术,可自定义汽车助理的声音,为RX5 MAX用户提供前所未有的个性化TTS体验 (语音合成)。由用户自己录制的声音,经过云端处理后可输出为你的车机语音声音,你可以用这项技术让你的爱人为你导航,可以让你的爱豆在车上陪你说话,让AI语音变得很温暖。

  从简单的问答式语音交互,再到基于场景的智能交互,最终迈向多模态交互。就像人和人之间面对面交流时会以语言为主,语音交互之外还会辅助以肢体和表情等形式,它们正在悄然发展。随着AI技术的发展和融合算法的进步,人和车的交互还会朝着多模交互的方向发展,即以语音交互为基础,通过触觉、手势、情感和视线等方面的创新集成在一起,使人在车内体验到更愉悦、更安全、获取更多信息和更丰富的娱乐。2019 年 CES 上,除了 Just Talk 这个语音免唤醒功能之外,Cerence 的Dragon Drive 汽车平台推出了新的人工智能功能:凝视检测。根据多模态交互,系统可将眼睛轨迹和头部角度与精确的汽车定位,以及 3D 环境建模相结合,以跟踪用户的注视。当用户查看车辆内外的对象,并随便说出它,比如一家餐厅,人工智能根据 Just Talk 功能和上下文推理,就能很明确地知道用户想知道的是什么。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
权利保护声明页/Notice to Right Holders

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有