
机器的归机器,人的归人。
文丨王与桐 宋玮编辑丨王姗姗
余轶南笑起来像韩国硬汉演员马东锡,也像马东锡一样有些江湖气,他穿着老干部夹克,尽管研发了 9 年智驾,他开的车却并不是特斯拉或者新势力,而是迈腾。
江湖气的管理哲学和科研出身的技术底色在余轶南身上共生。他 2012 年博士毕业于中科院自动化所,先是进入百度深度学习研究院当科学家;2015 年,他在博士期间结识、后来成为他在百度主管的余凯说了句 “我们一起去做 AI 芯片吧?”,余轶南就加入了余凯创办的地平线。
在地平线的 9 年里,他从一线技术人员干到了智驾负责人。地平线是一家以芯片、算法和解决方案实现智能驾驶的公司,余轶南负责的智驾业务是地平线现在的核心业务,有一千多人。他要管研发、产品运营、商务管理,在越管越多的工作里不断点多、点杂自己的技能树,比如财务、法务、供应链、谈判。
但余轶南越做 to B 生意越明白,在产业链中只有占据 “链主” 的角色,才能掌握更多的利润和话语权,所以他想做面向 C 端向能完整交付的产品,成为机器人的 “主机厂”。
在 100 天前,他找到有工程落地能力的宋巍,和有产品、用户洞察的赵哲伦一起创立了机器人公司——维他动力(Vita Dynamics)。

从左向右分别是:宋巍、余轶南、赵哲伦
余轶南劝当时地平线同事宋巍一起创业时,也说了一句话:“走吧,我们一起去做机器人。” 此前就职于理想汽车的赵哲伦, 在 2023 年智驾端到端的技术架构出现后就与余轶南一起聊机器人产品构想。
创业仅三个月,维他动力已连续获得两轮融资——今年 1 月,获得由地平线和高瓴创投领投,元璟资本、柏睿资本、百度风投和初心资本跟投的近亿元种子轮融资;最近,他们完成由今日资本和凯辉基金领投、雅瑞资本参投的种子 + 轮融资,累计金额达 2 亿元。
具身智能现阶段还没有形成太多共识,用余轶南的话来描述,正处于 “春秋时代”——百家争鸣,谁也争不出对错。讨论最热闹的是人形机器人进工厂,拧螺丝、分拣电池、搬东西。
余轶南则站在这些讨论声音的对岸。他认为机器人的最大场景并不是工厂——因为机械臂已经够用了——而是个人和家庭,中国有四亿个家庭。其次是服务业,“很多服务场景是需要 24 小时、高质量、一致性的服务”。
更重要的是,他提出人形机器人不应该是机器人的唯一形态,不同场景下的机器人都会有自己形态的最优解。
在与我们交流时,余轶南反复提到两条技术成熟度曲线——难度从简单到复杂,容错率从高到低。所有的场景都可以在这两条线形成的坐标轴上找到自己的位置。AI 在很多领域都已能驾驭复杂需求,但机器人产品的技术成熟度目前还只能做容错率较高的事。
“很多人一想到机器人要把高脚杯放进头顶的碗橱就觉得太难了,实现不了,但我们可以先从简单的任务做起。” 余轶南的想法是,技术是技术,产品是产品。原理性技术还在不断摸高的同时,一些已经成熟的技术则已进入 “产品入场” 阶段——先创造价值,沿途下蛋。
维他动力已确定的首款产品是基于户外场景的四足机器人,预计今年年底发布。更为具体的产品使用画面是:一家人去郊外游玩,机器人会从一辆理想 L9 里跳下来,跟随主人,帮忙背负重物,也能负责记录一家人游玩的精彩瞬间。
第二款规划中的产品将会进入室内场景,用于完成收纳、整理等任务,产品构造是 “机械臂 + 轮式底盘” 的组合,或许还会配以一种布艺外观——目的是以一种更为舒适的形态进入家庭。这款产品的上市日程表定在 “三年之内”。
余轶南希望他们的机器人不要扮演 “入口” 的角色,不做信息、娱乐、广告的平台,尽管那些方向的商业模式看起来更加简单直接;家庭机器人,不需要 “说人话” 和配备显示屏。
最高效的交互,只需要简单的声音、光影和肢体。这背后是余轶南对产品第一性原理的思考:物理世界的归物理世界,数字世界的归数字世界。
赵哲伦给我们分享了一个名叫《齐马蓝》( Zima Blue )的故事,是系列动画片《爱,死亡,机器人》( Love, Death & Robots )中的一集。艺术家齐马是全宇宙最会画画的机器人,他的画中间总是有一个蓝色的色块,这个色块就是 “齐马蓝”。当记者在他生命的终点询问 “齐马蓝” 意义时,齐马给出的答案是:他最开始是一个泳池机清洁机器人,后面他的功能被不断累加,变成了如今的样子,而那个色块是他记忆中泳池的颜色。
故事的结局是,齐马在艺术巅峰时刻拆除了各种功能组件,变回泳池机器人,在泳池里执行着最原始的清洁指令。机器人的形态和功能会随着时间的演进不断变化叠加,现在的人类,正在塑造齐马 1.0 版本。
“端到端出现后我第一反应是:可以搞机器人了!”
晚点:你是什么时候下定决心做机器人创业的?
余轶南:十几年前我就想做机器人,一直找不到天时地利人和的机会。
晚点:想了十几年,为什么是现在?
余轶南:特斯拉端到端的技术架构出来后我的第一反应就是:可以搞机器人了!那会是 2023 年,我约还在理想的哲伦喝酒,他以为我要聊智驾的端到端,结果我大聊机器人。
汽车是四个轮子,运动轨迹相对简单,只有前后和左右,且只在二维平面里。但四足机器人的运动轨迹会有 12 种自由度,比汽车复杂 3 倍,就需要在更高维的空间里做优化。
智能驾驶早期是用结构化白名单的模式,即在交通环境里人工定义很多目标,感知系统针对每个目标去检测、识别,再做环境理解,然后规划。2023 年智驾走向端到端模型后,实现了从传感器输入(sensor in)到控制输出(control out)的自动化决策。2024 年底,智驾又进一步演进为 VLM+VLA(视觉语言模式 + 视觉语言行动模式)的协同框架。
如果还是过去那种靠人工编写规则的传统架构,很难控制复杂的机器,但随着架构演进,机器能自己学习、不用人来写规则,那就有可能实现几十个电机在高维空间的理解、规划、执行。
晚点:李斌刚造车时说造车需要 200 亿元,后来发现远不止这个数。雷军造车时说要 300 亿元。要造出你想要的机器人,需要多少钱?
余轶南:起步阶段,要在五年内实现百万台的量产,投入可能在百亿元级别才能上牌桌,但是这 100 亿元肯定不是单靠融资能得到的,要有先落地的产品,自造血。
晚点:智能驾驶也是机器人的前序,这跟你现在做的 AI+ 机器人有什么本质不同?
余轶南:我们想做一个 AI 原生产品,而不是 something plus(把 AI 能力附着在产品中)。这两者的核心区别是,AI 本质上是有趣的灵魂,把这样的灵魂放在什么躯壳是很关键的。
智驾是把 AI 技术嫁接在一个现有的产品形态——汽车上,而汽车形态在过去一百多年里已经固化了,这个物理躯壳太受限,而 AI 本身的能力更大,所以我决定不能再继续做汽车,而是要完全创造一个新的本体,把 AI 的价值更充分地发挥出来。
晚点:你过去做智能驾驶的经验怎么转移到机器人产品中?
余轶南:汽车和机器人的底层是一样的,都是本体和入口。再往上需要环境感知、环境理解、任务理解、任务拆解、推理、规划、执行、最终是控制,整个链条都非常长。
智能驾驶从分段式走向端到端,再走向 VLA+VLM 的架构,机器人也是差不多的进化路径。
两边技术架构很像,无非是传感器输入的部分不一样,汽车是十几个摄像头和激光雷达,机器人摄像头会少一些,也有激光雷达,还有触觉传感器等;复杂度也有区别,汽车只有两个维度的自由度,但机器人少说 10 来个、多则 60 多个自由度。
但二者整体快慢系统架构的差别是很小的,基本架构在逻辑上是一样的。机器人的运动控制,系统更新频率(指控制器每秒向执行器发送指令的周期)能做到 50 赫兹,也就是 20 毫秒一个周期。汽车在双算力芯片的架构中,一颗芯片上跑慢系统可能跑到 2 到 4 赫兹,另外一颗跑快系统,可能跑 20 到 30 赫兹。
晚点:如果相似度很高,你也会用自动化程度划分机器人的阶段吗?
余轶南:L1 阶段是基于遥控的机器人;L2 阶段是在人的监管下机器人能自主活动;L3 阶段是即使没有人的监管也能自主活动。L3 实现与否主要是责任兜底问题,这和智驾的 L3 概念类似。
大多数人现在对智驾 L3 的定义是接管率,但接管率只是数字。我的定义是从驾驶员的责任转变为保险公司的责任,只要出了事故还是驾驶员负责,那就不是 L3。机器人的 L3 也是类似,如果出了问题还是用户承担,那就不算。
晚点:现在很多机器人已经能做高难度的动作了,在你定义里他们属于什么阶段?
余轶南:很多漂亮的、高难度的动作是靠遥控完成的,本质还是 L1。我们希望做的机器人是 L2 阶段。
晚点:你说的机器人完全自主的 AGI ,会比智能驾驶的 L4 更慢实现吗?
余轶南:我们要把场景都拆开,每个场景有自己的时间轴,比如物流机器人、分拣机器人,L3 已经实现了。
“我造的机器人,是要让人远离数字世界的困扰。”
晚点:你们办公室门口摆了个破旧的瓦力,为什么不是放钢铁侠或者人形机器人?
余轶南:之前地平线公司门口也有一个瓦力,比我们现在这个更大,一米八高,我们为那个瓦力做了环境感知语音交互,它会在我们进门时就打招呼。开始创业后,我看到门口有点空,就想搞个大的瓦力,不过找不到那么大的了。
我觉得 “有趣、有用、有生命力的灵魂” 才是机器人的核心,瓦力就很有生命力。英伟达 GTC 大会压轴的双足机器人,走起路来头一晃一晃,也让人感觉很有生命力,即使背后就是一套算法和轨迹生成的。
晚点:大家现在都争相让机器人进汽车工厂干活,为什么你们不这么干?
余轶南:现在工厂的大部分过程都实现了自动化,即使是日产 1000 台汽车的高效产线,工人数量也并不多,且人的劳动都是轻量级的。所以,用机器人替代工厂里为数不多的工人,去干工人完全胜任的活儿,在商业层面是伪命题。不过这件事在欧美是成立的,欧美劳动力短缺且昂贵。
技术发展到某些阶段需要场景来做验证,拧螺丝、搬东西——这些场景是起到对技术的验证作用。
晚点:特斯拉作为公认的领导者,提出让人形机器人进工厂,所以多数人认为特斯拉的选择就应该是正确的。
余轶南:首先并不能够去证伪说特斯拉是错的。但大家都认为是正确并不一定真的正确。马斯克如今已经是世界级的企业家,如果他要说做机械臂,即使这条路线是对的但听起来不性感,股价可能就一下跌下去 30%。这属于巨头的魔咒——只要出一个低于预期的产品,其他方面会受很大损失。
在我的愿景里,人形机器人绝对不会是唯一的机器人形态,未来各种各样奇奇怪怪好玩的机器人会在大马路上、在你家里、在你的办公室来来回回地走。
晚点:有人认为做人形机器人最合适,因为这个世界上物体尺寸、空间尺寸、东西的位置等设置都是按照人的活动范围和习惯来定的。
余轶南:为什么它一定最合适呢?这种想法不够严谨。很多人这么想是因为人形意味着通用性——可以像人一样在灶台上做饭、可以去铺床单,但这件事本质是机器人能操作的高度是多少、移动能力是怎样的,每个场景都有可能找到与之对应的最优解。
我们看过太多的科幻电影,里面有多少是人形机器人?今天能被记住的其实都不是人形的,比如《星球大战》里的 R2-D2 和球形机器人。《超级陆战队》里的大白属于人形,但它又不属于今天意义的人形。瓦力甚至没有语言,只有一些咿咿呀呀的声音。
晚点:什么情况下你会做人形机器人?
余轶南:当人形机器人被用来追求更高、更快、更强的极致技术时,我会考虑。让人形机器人进行挑战技术高度的比赛,类似汽车行业里的世界一级方程式锦标赛、人类生活里的奥运会,用来挑战人所不能够达到的生理的极限,比如它能跑得比博尔特更快。
但是我对把人形机器人搞成一个产品现在还没太大兴趣。
晚点:在你的构想里,进家场景里,收拾东西、做饭的机器人应该是什么形态?
余轶南:一种既能完成功能又让你感到最舒适的形态。什么样的形态会让人舒适?首先是一个我们经常看到、感到习惯的形态,比如布艺外壳而不是金属外壳,形状可能像圆桶一样,占地面积不要超过扫地机。这样形态的机器人,带着机械臂,也有通用的移动能力,一定比人形机器人好。
我不会给家里买个人形机器人。首先它放哪儿都是个问题,要专门给它做一张床吗?还是说,让它一直站在你家墙边上?我希望机器人用完能被收纳,并不占空间。我做产品的原则之一是,如非必要不增实体。
不管是不是人形,机器人都应该具备三种能力:自然交互、自主移动、自主操作。室内场景对自主移动的需求度不高,轮式底盘又稳定又低成本,占地面积也小,但这种场景对自主操作能力的要求高;户外则相反,对自主移动需求高,但不需要有太高的操作能力。
至于机器人的自然交互,需要有输入、输出的硬件,比如扬声器、传感器,但并不一定非要是有头的形状。

维他动力的室内机器人设计手稿
晚点:你希望你的机器人是一个有用有趣的生活伙伴,而不是入口?
余轶南:人不应该离电子设备太近。
过去两千年人类从来没有像此刻这样被信息灌输,而未来还将出现两种情况:一种是人就只应该进行低成本娱乐,就像《头号玩家》里那样,人只是给算法世界提供数据;另一种是解放了双手的人可以去探索、创造。我们永远期待后者,但社会趋势会往前者走,并且不像《头号玩家》演绎得那么酷,大部分人会被数字洪流带走了,这是很悲哀的事。
如果我们造出的机器人只是给人提供服务,让一部分人远离数字世界的困扰,这是一件好事。
晚点:所以长远来说你真正想解决的问题是什么?
余轶南:让机器的归机器,让人的归人。这也是余凯说过的。或者说,让物理世界的归物理世界,数字世界的归数字世界——让所有的生产作业由机器人去做,同时人不要被别人的算法带进去,而要追求自己想要的东西。
“机器人能不说话,就不要说话。”
晚点:你觉得机器人最好的落地场景是什么?
余轶南:按照市场大小,最大的场景一定是家庭。中国大概有 4 亿家庭,规模非常大。能实现家庭的清洁、收纳、信息整合的家用机器人——知道家里东西在什么地方,并且能为提供服务——这样的机器人一定是世界上规模最大的机器人。再是服务场景,比如各种酒店的前台、咖啡馆的吧台、便利店,都需要机器人,出发点不是成本或者效率,而是能让人获得 24 小时、高质量、一致性的服务。最后是工业场景。
晚点:为什么是收纳和整理,而不是倒茶或做饭?
余轶南:我们考虑两个维度:功能的技术复杂度从低到高,容错率从高到低。拿起一个水瓶再放下是简单操作,现在已经有 95 % 以上的成功率;拿起一个瓶子把瓶盖打开,把水倒入一个杯子里,这个操作是复杂的。没拿住矿泉水瓶,摔到地上,任务失败了但失败成本相对是低的;如果换成玻璃杯、盘子摔到了地上,失败成本就高了。
家庭所有需求都能在由这两个维度构成的坐标系里被平铺开,最早可实现的就是收纳和整理,任务简单且容错率高,比如让机器人从沙发上拿起孩子的玩具收纳到柜子里,这种服务 3 年内就能实现。针对容错率低、更复杂的场景,可能需要等 10 年甚至 15 年。
AI 做复杂的事情是容易的,只要人采集了很多数据教它就能做出来。但 AI 完成低容错率的任务就很难。10 年之前就有很多公司花 3 个月做出了 L4 机器人的 demo 了,但现在还没有落地。
晚点:但你们要推的第一个产品为什么是室外机器人?
余轶南:目前 outdoor 的技术会比 indoor 更成熟。过去 3 年,outdoor 的技术比如运动控制等发展很猛;从去年到 2027 年,indoor 的技术会发展。当学术界在努力工作时,我们应该冷静等一等,基本原理性技术更加成熟,才是产品的入场时间。
晚点:这款室外产品的用户会是谁,要解决他们什么需求?
余轶南:我们把第一款产品定义为有用和有趣。我们聚焦生活状态比较收敛的家庭用户,他们的生活有两个空间:家和车。比如理想车主就是我们圈定的典型用户。
当车停到了景区的停车场,机器人能够自己从后备箱里跳下来,到遛弯、徒步的环境里,负重、陪伴,以及记录精彩瞬间。
晚点:你们还参考了理想汽车的后备箱空间来设计机器人尺寸吗?
余轶南:我们产品尺寸设计,首先是能通过家庭室内的窄道——大概 40 厘米宽;第二个是公园入口等位置的回形栏杆,机器人得自己走过去;第三是从车的后备箱里跳下来以及跳回去的能力——我们按照理想 L9 的后备箱 78 厘米高,设定机器人要跳回 80 厘米高的地方。跳下车和后空翻等单个动作都很简单,但跳回去仍然很难。我们现在还在研发怎么让它跳回后备箱,这里面会涉及优化峰值扭矩和产品重量之间的平衡。
晚点:你们似乎也还比较在乎产品的颜值,这一点很容易被技术型创业者忽视。
余轶南:颜值非常重要,但不是那种酷炫的,而是温和。要让用户感觉我们的户外机器人正义、忠诚、勇敢,室内机器人则是温暖、安全的。

维他动力的室外机器人手稿
我还想做一个软皮肤,但实现起来有难度。我跟从机器人行业招来的人讨论问题,他们会说机器人行业以前从来都不会讨论这些,讨论更多的是功能性,比如需要五指还是抓夹,而我就会关心能不能有软的皮肤,结构是外骨骼还是内骨骼。
今天的机器人某种意义上都是外骨骼,也就是外支撑架构,就像乌龟、螃蟹一样支撑是在外壳上面。但哺乳动物都是内骨骼的架构,皮肤是软性的。所以,做架构设计时就应该先把内部实现好,外在部分则是灵活的、可定制化的。
机器人的内核是 AI + 电子电气架构,本体结构是多样的,外观也是多样的。
晚点:你希望你的机器人有问答交互功能吗?比如要接 DeepSeek 吗 ?
余轶南:我希望机器人能不说话就不要说话。一个机器人,张嘴说人话就破坏了美感。但不说话不代表没有思考逻辑,不代表没有交互。
决定出来创业之后,我重新看了《机器人总动员》,发现整部电影居然是哑剧风格,瓦力和伊娃更多是通过肢体和声音交流。我认为机器人最好的表达方式是用简单的声音和光影,最好的语言是肢体语言。
我们要考虑用户的第一交互优先级。在做智驾时,我们做了很多交互尝试,当时最魔幻的设计是当摄像头检测到车内有人抽烟,车窗就会自动打开,但在后面测试环节总有失误——每当人手一放在嘴边,车就要自动开窗。事实上,开窗本身只需要 “按一下”,这才是开车场景中最天然、优先级最高的交互形式。

具身智能原理性技术与工程化技术的发展周期
" 我需要全栈闭环、全攻全守的特种兵部队。"
晚点:今天你们定位的市场以及产品形态,真的是别的创业公司没看到、只有你看到了?会不会是这个场景根本不存在?
余轶南:去年七月到十月,我跑了 15 家以上机器人公司,没有做 to C 方向的。大家还是觉得做家庭场景很难,但本质他们还是从技术角度出发,而并非从产品或者从用户角度考虑问题:一想到要把高脚杯放进头顶的柜橱就觉得实现不了。但其实把场景拆解之后,就知道有什么可以开始做了。
晚点:机器人的产业链很长,链条上的其他能力如何靠团队补足?你的两位联创是怎么选定的?
余轶南:我们定位自己是机器人的主机厂,所以首先就要有 “车” 而且是辆 “好车”。我们需要从软件到硬件的系统的工程能力,从算法到本体全都能吃下来,把车先造好。宋巍擅长系统工程,哲伦有非常强的用户洞察,懂产品定义和市场营销。
当然,拥有非常强的 AI 团队也是核心能力。现在我自己带 AI 团队,我也最擅长 AI 算法,同时也还在为这个团队找 VP。
晚点:这次创业你有告诉自己一定不要再犯哪些错误吗?
余轶南:一定要保持组织的简洁。今天的组织效率跟过去非常不一样,AI 工具可以在专业领域提高十倍效率,也能让人学习速度大大加快,比如不懂网页前端的人也可以 10 分钟制作出一个公司网页。
这带来的是,一方面纵向上人的效率会提升,横向上学习的范围会扩宽。所以组织里个人能力素质的要求会变强,专业和经验要求会变弱。这种新的组织形态是小而精的,每个人的成本会提高但是总成本会下降,并且能降低沟通损耗。所以最开始投资人问我第一阶段需要多少人,我说 300 人,但现在我觉得也就需要 50 到 70 人。
我们面对的是不确定的市场、不确定的需求和不确定的分工,所以组织形态要能应对这种不确定性带来的风险,在对目标达成共识的情况下,模糊掉所谓的边界和分工。我希望我们的工程师可以既懂下游又懂上游。我需要一个全栈闭环、全攻全守的特种兵部队,能够相互补位。
晚点:你怎么说服优秀的人才加入?现在在技术攀登期,加入创业公司是有波动性的。
余轶南:十年前的我,余凯说一句话我就跟着走了:“我们一块儿出去干一个 AI 芯片吧?” 我的回答自然而然就是:“好的,咱们一块走。” 所以说服优秀的人,首先要有战略共识和共鸣。
现在大家还是对产业未来发展有疑问,以及现在这个阶段是不是适合从大公司或者从研究机构跳出来去做产业界的东西,这也是个疑问。
晚点:你通过什么方式判断人是不是有潜力、是你要找的全攻全守型人才?
余轶南:一个人的潜力其实很大的程度上体现在他做过他过去并不擅长做的事情,但是能够快速钻进去并把这件事情干好。所以我面试时一般会问 “有哪些事情是你不擅长但结果做特别好的?”
晚点:那么,有什么事情是你曾经以为自己不擅长但事后看是做特别好的?
余轶南:我曾经以为我不擅长做 to B 业务,刚开始管理地平线智驾产品时,我第一件事不是跑去做产品的定义和做技术的分析,而是花 3 个月跟我们销售把当时全国五大片区跑一遍,每个片区跑两周。
在不断给客户介绍产品和技术过程中,一次次跟客户把酒言欢、相见恨晚过程中,我对技术、业务的思考就不一样了。
晚点:你身上有一种技术人员罕见的江湖大哥气质,这是那几年与客户把酒言欢历练出来的吗?
余轶南:我在百度工作时还是纯粹的科学家,后来在地平线创业的 9 年,从技术人员变成产品线负责人,再延伸到产品运营、商务管理等等,这一路我点的 “技能树” 又多又杂,财务、法务、供应链、谈判、喝酒,全链条。这次创业,我又学到了新的技能——融资。
晚点:机器人公司的估值正在水涨船高,宇树超 70 亿元,银河通用超 30 亿元,还有很多估值在 10 亿元以上的公司。这么看,你们现在融了 2 亿元并不多。
余轶南:就这个产业未来 50 年真正能产生的价值而言,你列举的这些公司估值都还太低了。机器人产业会比汽车工业规模更大,它对社会底层基础设施会带来巨大变化,影响更为深远。今天在大街上还没有机器人走来走去,但我相信我们的下一代会习惯机器人在大马路上走来走去。
如果这样判断,按目前全世界汽车市场每年的销量大概是 9000 万台来看,未来机器人全球出货量会更大。
晚点:面对越来越多具身智能参与者——车企、科研团队、传统机器人公司,你比较害怕哪一种对手?
余轶南:现在的几类对手:创业公司、中号企业、超级巨头,跟他们的竞争是有时间顺序的。
第一类是创业公司,大家还没搞清方向,处在 “春秋时代”——百花齐放、百家争鸣,你说你的、我说我的,都有自己的逻辑闭环,谁也证明不了谁对谁错。等后面 “战国时代”,所有人战场上见。现在智驾已经处在战国时代,机器人产业还在春秋时代。
还有一波已经在细分市场上取得巨大成功的中号企业,比如扫地机器人、无人机、电动平衡车这样的品类。如果他们转型做智能机器人,可能三年之内会成为我们在战场上直接见面的对手。
晚点:中号的企业如果这一两年内就要进场了,你们怎么防守?
余轶南:我们就轻装上阵。他们一方面要把现有技术做好,还要分一部分资源干新的市场,难度也很大。
第三波是巨头,比如字节、华为、小米、比亚迪、理想这样的公司,他们在自身战场上的仗还没打完,所以会在更晚一些入场。现在机器人市场也还不够大,未来技术成熟、趋势明确,巨头进来就是要抢蛋糕的。
汽车市场大概是 2.5 万亿元规模,而机器人至少要达到 5%~10% 的汽车市场规模,也就是 1250 亿元至 2500 亿元时,巨头才会入场。
晚点:你刚才说三波梯队,很像汽车领域的竞争。
余轶南:我觉得机器人产业的竞争节奏会在汽车和扫地机这两种产品之间——扫地机 6 个月一个迭代,汽车大概 15 个月一个迭代。
晚点:竞争烈度呢,也在这二者之间?
余轶南:还没到那个阶段,大家目前都还处在形成共识的阶段。
晚点:你会担心出现像 DeepSeek 这样的黑马吗?本来大家都还在搞 DAU,突然业内杀出来一个模型能力、技术能力很强的对手,能做出与需求契合度更高的产品?
余轶南:软硬件结合的赛道不会,纯软件赛道很有可能出现。
晚点:这个行业是不是也需要巨头入场,共同培育?
余轶南:肯定是的。华为进入汽车市场,早期的产品可能不行,但它带来了泼天的流量,让小米接住了。用户都跑去看汽车了,手机这种商品就没人关注了。这个就是巨头入场的核心价值。
晚点:所以最可怕的竞争是前面巨头入场带来泼天流量,被另外一家接住了。
余轶南:我们希望汽车是雷总最后一次创业。到时小米真做了机器人,他可能会说,机器人也是一种车。
题图来源:《机器人总动员》

