新浪新闻客户端

理想发布自动驾驶架构MindVLA,CEO李想:像iPhone4一样重新定义行业

理想发布自动驾驶架构MindVLA,CEO李想:像iPhone4一样重新定义行业
2025年03月18日 16:36 新浪网 作者 资讯动态

   对于用户而言,有MindVLA赋能的车不再只是一个驾驶工具,而是一个能与用户沟通、理解用户意图的智能体。

  3月18日,银柿财经获悉,理想汽车(LI.US)自动驾驶技术研发负责人贾鹏在NVIDIA GTC 2025发表主题演讲《VLA:迈向自动驾驶物理智能体的关键一步》,分享了理想汽车对于下一代自动驾驶技术MindVLA的最新思考和进展。

  演讲画面

  贾鹏在演讲中表示:“MindVLA是机器人大模型,它成功整合了空间智能、语言智能和行为智能,一旦跑通物理世界和数字世界结合的范式后,将有望赋能更多行业。MindVLA将把汽车从单纯的运输工具转变为贴心的专职司机,它能听得懂、看得见、找得到。我们希望MindVLA能为汽车赋予类似人类的认知和适应能力,将其转变为能够思考的智能体。”

  据其介绍,MindVLA不是简单地将端到端模型和VLM模型结合在一起,所有模块都是全新设计。3D空间编码器通过语言模型,和逻辑推理结合在一起后,给出合理的驾驶决策,并输出一组Action Token(动作词元),Action Token指的是对周围环境和自车驾驶行为的编码,并通过Diffusion(扩散模型)进一步优化出最佳的驾驶轨迹,整个推理过程都要发生在车端,并且要做到实时运行。

  MindVLA将为用户带来全新的产品形态和产品体验,有MindVLA赋能的汽车是听得懂、看得见、找得到的专职司机。

  “听得懂”是用户可以通过语音指令改变车辆的路线和行为,例如用户在陌生园区寻找超市,只需要通过理想同学对车辆说:“带我去找超市”,车辆将在没有导航信息的情况下,自主漫游找到目的地;车辆行驶过程中,用户还可以跟理想同学说:“开太快了”“应该走左边这条路”等,MindVLA能够理解并执行这些指令。

  

   “看得见”是指MindVLA具备强大的通识能力,不仅能够认识星巴克、肯德基等不同的商店招牌,当用户在陌生地点找不到车辆时,可以拍一张附近环境的照片发送给车辆,拥有MindVLA赋能的车辆能够搜寻照片中的位置,并自动找到用户。

  “找得到”意味着车辆可以自主地在地库、园区和公共道路上漫游,其中典型应用场景是用户在商场地库找不到车位时,可以跟车辆说:“去找个车位停好”,车辆就会利用强大的空间推理能力自主寻找车位,即便遇到死胡同,车辆也会自如地倒车,重新寻找合适的车位停下,整个过程不依赖地图或导航信息,完全依赖MindVLA的空间理解和逻辑推理能力。

  对于用户而言,有MindVLA赋能的车不再只是一个驾驶工具,而是一个能与用户沟通、理解用户意图的智能体。对于人工智能领域而言,汽车作为物理人工智能的最佳载体,未来探索出物理世界和数字世界结合的范式,将有望赋能多个行业协同发展。

  理想汽车CEO李想在微博发文称,MindVLA的发布是我们通往L4路上最重要的一步。MindVLA能为自动驾驶赋予类似人类的驾驶能力,就像iPhone4重新定义了手机,MindVLA也将重新定义自动驾驶。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

权利保护声明页/Notice to Right Holders
20条评论|22人参与网友评论
最热评论
朝花不夕Fire江西上饶
还是得靠传统模型,端到端的方案感觉不太靠谱
3月18日18:15举报1回复
理想的自动驾驶有望统治全球市场,比特斯拉领先至少九年
3月18日18:15举报1回复
汽车行业的重大进展,很期待全新体验
3月18日18:47举报回复
最新评论
happyendingsforus浙江湖州
这几天净是看PPT讲得天花乱坠?
3月18日18:47举报回复
汽车行业的重大进展,很期待全新体验
3月18日18:47举报回复
梦想遗迹ZZ江苏盐城
自动泊车上路测试的那家公司
3月18日18:45举报回复

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2025 SINA Corporation

All Rights Reserved 新浪公司 版权所有