理想要与特斯拉掰手腕
时间:2024年9月4日来源:华尔街见闻字数:2,251
问:什么才是真正端到端? 詹锟:端到端是一种研发范式,从最开始输入端到最后输出端,中间没有其他过程,用一个模型完整实现。现在理想汽车是一体化OneModel端到端,通过直接传感器输入,模型推理完毕后,直接给到轨迹规划用来控车,这就是一体化端到端。 市面上还有一种端到端,是在中间分两个模型,模型中间以一个信号做桥接,我们认为这不是真正端到端,如果中间加了人为信息消化过程,可能效率不是高,或能力上限受到约束。 郎咸朋:真正做端到端要看两个能力,有没有足够多数据与充足算力,否则我觉得很难做出真正端到端,它是AI训练。 问:现在很多品牌提出自己是引领者,理想汽车也在说已经跻身智驾第一梯队,怎样评价自家端到端技术水平? 郎咸朋:普通消费者不关注技术,而是体验,我们不与谁比。 以前我们为做城市NOA,考虑过用高精地图,后续体验因素决定转做无图,那时无图还是感知、规划、分模块方案,里面有大量人工规则与实车测试。 不说预算投入,时间上就非常困难,如果想将1年四季各种情况都跑一遍,没有1~2年时间不可能实现。我们迭代到端到端+VLM技术架构,这AI方案是自己长出来的。 之前辅助驾驶是系统辅助人开,主体是人,到现在端到端+VLM阶段后,我们认为是变成车自己在开。 训练出完整模型后,模型自己有能力开好车,我监督这个车哪里不行或者有提示需要接管,主体一定是车,人作为监督的辅助角色。 问:端到端研发周期大概多久? 郎咸朋:理想认真做端到端+VLM,是从2023年开始,我们在研发阶段是一个非常小而精的团队,做无图时已经在预研端到端,现在做端到端,实际已经预研下一代技术。当判断条件已经成熟与初步验证成功,会转到量产阶段。 问:端到端最早是特斯拉提出来,我们是不是受到特斯拉启发?我们怎么确定流程一定能跑通? 詹锟:端到端不是特斯拉第一个提出来,2016年英伟达就有一个模型提到这个技术,效果一般只解决特别简单场景,以当时算力与模型规模,大家认为这条路行不通。到2023年,特斯拉在新Transformer架构上,增加超大算力做出来后,在往更有成长方向上推进。 问:理想目前感受自己与特斯拉智驾差距有多大? 郎咸朋:2023年时大概差半年,2024年可能还会再小一点。 技术架构上,我们跟特斯拉没有太大差别,甚至更领先一点,我们有VLM,特斯拉只有端到端。 在中国训练算力与训练数据上,至少从现在看,我们是领先特斯拉,特斯拉在中国还需要部署算力。 我们用上世界模型,可以生成、模拟场景,这是几千万个场景测试,是实现智驾快速迭代最重要、最必要的保证。这种方式进行模型迭代,比原来整车或者路试方式要可靠得多,1年四季各种场景全都可以涵盖。 詹锟:世界模型可以根据当前环境预测未来,能够推理出未来场景。 比如,球滚到路中间,端到端只会刹车,世界模型会想是不是还会有小孩冲出来,它对世界有更宏观综合判断。VLM在我们系统上就是起到这个效果,我们现在模型规模还很小,能力有限。 问:前不久,有人提出500亿做不好智驾的观点,理想对此有什么看法? 郎咸朋:关于500亿,需要判断是一次性投资,还是长期投资,就像今天提到的我们每年都会有10亿美元投资在智驾研发中,如果连续10年,是超过500亿。 端到端+VLM技术架构是一个分水岭,从这一代开始,才是真正用AI方式做。 之前我们还是在用传统方式做智驾,所有产品最终效果,都是有设计在里面,没有设计到的场景可能无法实现。不仅无法实现纯粹数据驱动,人工工作量也大。 一体化端到端模型,在模型结构、模型训练方式上有难度,最大好处是,我们给出数据训练模型,模型输出结果,这样自然而然的AI训练过程。 从我们自己端到端模型看,只需要告诉它,要做与老司机一样的驾驶体验,输入所有理想车主中老司机驾驶数据,它就给你结果。我们数据筛选非常严格,在当时80万车主中,只有3%才是真正的老司机数据。 有了这个前提后,接下来做研发的核心竞争,看是否有更多更好数据和与之配套的算力训练模型。 算力与数据的获取,需要看花多少钱、投入多少资源做。这其中有些东西是用钱买不到的,比如训练数据、训练里程,各家车企有自己资源,相互之间不会互通共享。 另一个需要投资的是算力,我们现在5.39亿EFLOPS算力,到2024年底预计提升至8亿EFLOPS,这是1年20亿人民币开支。 未来进入L4阶段,每年数据与算力呈指数级增长,意味着每年至少需要10亿美元。5年之后,它需要持续迭代,这样量级下,一家企业盈利与利润不能支撑投入,是很困难的。 现在不需要关注投入多少亿做自动驾驶,而是从本质上出发,是否有充分算力与数据支持,再看需要投入多少钱。 问:过去几年,智驾技术经历几次大迭代,类似巨变还会发生吗? 郎咸朋:端到端+VLM双系统,是模拟人类思考认知的架构,我们做AI,最终希望可以实现拟人或者类人。目前AI框架非常合理,很多企业开始尝试跟进。 双系统理论,不仅可以用在自动驾驶,也是未来AI甚至智能机器人的范式。自动驾驶可以说是轮式智能机器人,只是工作范围是道路。 我觉得是有一定的长期行为力,技术发展无穷无尽,我们会保持对先进技术敏捷感知,如果有新的技术,我们也会追踪。 问:端到端量产交付后,能给销量带来多大增量? 郎咸朋:无图NOA全量推送后,近2个月,我们试驾翻了一倍。30万以上车型AD
Max占比达到70%,原先AD Pro会多一些,L9 AD Max甚至占比90%以上。 问:理想汽车对高阶智驾,有没有收费计划?有什么好的商业模式? 郎咸朋:标配与免费,都是理想从第一天开始进入智驾就制定的策略,有监督的自动驾驶对所有AD Max车主都是不收费,它还能为自动驾驶提供更多车辆训练里程。交付量比较好、企业经营稳健,也有足够资源投入智驾研发。