刚听完理想汽车他们的第二季AI Talk,可以发现李想在第一季宣布理想汽车要成为一家AI公司后,经历130多天的实践和经历,他对于AI有了一些新的认知,也说了一些有趣的观点,分享给大家:
1、李想对于AI的理解,分为了三个层面,首先是信息工具,具备基础的参考价值;当AI继续进化后,就会变成一个辅助工具,比如现在的辅助驾驶或者车上的导航,但本质上还是辅助人类来做一些事。
直到AI到生产工具这个阶段,AI就可以独立代替人类去完成一些工作,具备一定的生产力。
李想对于AI的判断,其实在我看来与他在第一季的时候对于人工智能AGI的理解是一脉相承的,因为在前两个阶段,无论AI还是AGI都是增强人类的能力,而到了第三阶段才会真正具备生产能力,来独立帮助人类完成一些工作。
2、前段时间理想他们向全行业开源了星环OS操作系统,这背后的原因其实很简单,李想说之所以做这件事,主要是因为他们基于Deep seek开源加速了对于语言模型的迭代。
为此,李想就觉得也应该为社会做一些贡献,因此就把他们自研四年的整车操作系统理想星环OS给开源了,而不是更复杂的公司战略层面的考虑。
3、对于VLA,去年我与理想他们算法负责人交流的时候,他们就说已经开始关注和研究了,但在这次的AI Talk上李想算是很具体的讲解了他们在VLA架构上的实践和理解。
李想曾在今年初的分享中表示DeepSeek更像是Linux推出,而他们要去追逐“安卓时刻”。因为在他看来,就像安卓是基于Linux长出来的,而他们也是基于DeepSeek,把VLA中的L(language)做的更好。
在整个VLA架构上,他们先把VL作为基座模型进行训练,这个基座模型是云端的一个32B的大模型,在训练这个模型的时候,除了要引入V(视觉)相关的2D、3D语料和L(语言)语料之外,还要引入VL联合的语料,这是因为人类感知世界也是这样感知的。
接下来,就是将这个云端基座模型通过蒸馏变成一个3.2B的端侧模型、是由8个专家组成的MoE(混合专家模型)模型,并且引入A(行动)的部分,就像我们每个人开车前都要去驾校学开车一样,让整个模型组成为VLA,并且引入diffusion模型,在李想认为这是“司机大模型”,模型参数也会增长到4B。
第三步,对于这个VLA模型做强化,通过RLHF和RL两个方式一起做训练,在我看来就是基于人类真实驾驶数据以及仿真生成数据(世界模型)来对系统做强化学习和对齐。
对于VLA强化的评定标准,李想提出了三个指标,舒适度、是否会发生碰撞以及是否会违反交通规则,总结一句话就是要比人开得好。
但对于这三个标准中的舒适度评价上,我觉得李想有可能为了传播的友好性简化了。因为智驾舒适度这块,仅靠G值并不全面,理想的算法专家也告诉我,他们在做这块时除了考虑G值之外,还会考虑横纵向的导数(曲率)。
这样前三步完成后,VLA模型要真正与人类正常交流,还需要搭建一个Agent(智能体)。当自然语言是短句时,车端的VLA模型就直接处理;如果是复杂的指令,那就需要先到云端基座模型上处理,然后下放到车端进行处理,但这里理想他们必须得做好时延的处理。
4、对于大模型,我听到李想一个有趣的理解。在他看来,当模型能力越强时,就意味着这个模型胡来的可能性就越强(脱离规则或者不可控);所以就需要当模型更强的时候,越需要约束它的能力,像李想说的就是需要更强的职业性,看来李想也已经考虑到了人工智能越轨的问题,并且已经在内部着手工作了。
5、对于人工智能Agent未来的判断,在李想看来并不会出现通用的 Agent(智能体),而是每个专业领域做专业的Agent(智能体)。就像智驾VLA模型一样,它的V、L和A都不一样,每行每业都不一样。对于这个判断,我很认同。
6、目前虽然这样的Agent还没有成为现实,但商业模式李想有可能已经想好了。按照他的理解,“雇”这样一个Agent,有可能花费雇佣人类司机的几分之一成本,比如花费2-3000。但也有可能雇佣这样一个Agent后,车辆保险和补能费用就包含在其中了,说不定会更划算。
7、当被问到“如果没有前面的端到端+VLM,理想能不能直接得到VLA”问题时,李想给于否定的答复,因为在他看来如果没有前面的积累,是无法做到VLA的。就像现在端到端做的很吃力的企业,有可能就是前面规控算法没打好基础。
李想的画外音,有可能就是说之前没做到端到端的车企,就很难一步登天做到VLA(或者也不是真的VLA)。
8、VLA会是智驾行业的终极答案吗?李想对于这个问题是这样认为的,他觉得VLA(司机大模型)能够解决到全自动驾驶,但是否是效率最高的方式,他表示存疑。因为VLA(司机大模型)还是基于Transformer这样子的,那Transformer是不是一个效率最高的一个架构,并不确定。
对于这个问题,我此前也问过很多做智驾的负责人以及企业的CEO,他们告诉我的答案和李想说的差不多。
9、今年就是理想的十周年,当被问到此前十年里有哪些幸福和痛苦的时刻,李想表示幸福的时刻第一次是理想ONE的发布以及上市,第二次是22年发布理想L9时;而痛苦的时刻,就是理想L9上市后出现“理想汽车倒闭”的负面舆情。
最后,对于李想来说,好与坏就是一面硬币的两面,如果只要好的,不要坏的,这样的事情本身就不会存在,因为只有坏的事物,才能让我们知道什么是好的事物。只有好坏都有的人,才是活生生的人;只有好与坏都存在的世界,才是一个有生命力的世界,希望借李想这句话与大家共勉。
总结下来,理想他们的第二季AI Talk依旧干货满满,对于我来说,很受启发。从传播角度来说,这样的传播形式也值得推广,既省成本又有信息密度,比开十场大型发布会更有收获。期待理想他们的第三季AI Talk[嘻嘻]理想ai talk第二季李想谈辅助驾驶到了新十字路口李想说当前竞争环境下要练基本功飞说智行