理想AI Talk第二季开启，李想揭秘VLA司机大模型的作用_

理想AI Talk第二季开启，李想揭秘VLA司机大模型的作用

新快报

2025-05-08 14:13

新快报讯记者罗晓彤报道 在科技飞速发展的当下，人工智能正以前所未有的速度重塑着各个行业。理想汽车在“理想AI Talk第二季——理想VLA司机大模型，从动物进化到人类”中重磅推出VLA司机大模型，而理想汽车董事长兼CEO李想重点分享了对于人工智能的最新思考，VLA司机大模型的作用、训练方法和挑战，以及对于创业和个人成长的见解。

对于AI工具，李想分为三个层级，分别是信息工具、辅助工具和生产工具。目前，大多数人将AI作为信息工具使用，但信息工具常伴随大量无效信息、无效结果和无效结论，仅具参考价值。成为辅助工具后，AI可以提升效率，例如现在的辅助驾驶，但仍需人类参与。未来，AI发展为生产工具后，将能独立完成专业任务，显著提升效率与质量。李想认为，当AI发展为生产工具，能独立完成专业任务时，才是其真正的爆发点。

而此番推出的理想VLA司机大模型就尤为重要。据了解，理想汽车自2024年起开展VLA研究，并在多项顶级学术会议上发表论文，夯实了理论基础。对理想汽车而言，未来的VLA就是一个像人类司机一样工作的司机大模型。

不过，VLA的实现并非一蹴而就，而是经历了漫长的进化过程。早期，理想汽车依赖规则算法和高精地图的辅助驾驶，类似“昆虫动物智能”，仅能基于简单规则做出反应。之后，端到端+VLM辅助驾驶技术的应用，使其接近“哺乳动物智能”，但仍存在局限。而VLA迈入的“人类智能”就是第三阶段。它通过3D和2D视觉组合，能完整感知物理世界，还具备语言和思维链推理能力，可理解并执行行动，与人类驾驶方式高度契合。

在训练过程中，VLA模拟人类学习驾驶的步骤，分为预训练、后训练和强化训练。预训练利用大量视觉和语言数据，训练出云端VL基座模型，并转化为车端高效运行的端侧模型，如同人类学习驾驶常识。后训练加入动作数据，让模型学会在复杂交通环境中博弈。强化训练则通过基于人类反馈的强化学习和世界模型训练，实现安全和舒适驾驶，超越人类驾驶水平。最终，VLA司机大模型以“司机Agent”的形态呈现，用户能用自然语言与之沟通，复杂指令由云端和车端协同处理。

当然，除了提升专业能力，VLA司机大模型还需解决安全性和模型黑盒的问题。

为了保障VLA司机大模型能够实现职业司机般的安全和舒适，避免学习加塞等违规行为，理想汽车在强化训练环节投入大量资源，并于2024年底组建超过100人的超级对齐团队，相当于为司机Agent注入职业素养。为解决模型的黑盒问题，理想汽车结合重建和生成两种路径，打造了真实、符合物理世界规律的世界模型，覆盖所有交通参与者和要素，让VLA能在其中验证现实问题，提升问题解决效率，增强用户对智能驾驶的信任。

而理想汽车能取得技术的突破，得益于其扎实的基本功。从研究、研发到能力表达和业务价值转化，李想汽车在每个环节都精心打磨。比如在辅助驾驶技术研发上，面对英伟达芯片的限制，理想汽车凭借自有编译团队和综合技术能力，成功实现芯片高效运行语言模型。同时，借助DeepSeek开源，加速语言能力研发，节省大量时间和成本。但理想汽车并未满足于此，反而加大投入打造自研模型，并开源自研汽车操作系统回馈社会。

成立十年来，理想汽车在创业路上不断成长。李想认为，创业虽充满挑战，但应保持积极心态，将困难视为成长的机遇。他强调关注自我成长，接受自身优缺点，同时重视亲密关系，与家人、同事相互支撑。面对AI的发展，李想认为，在AI面前所有的人性都应被保留，无论好坏，因为一切人性都是文化、生命、性格、能力的特质，也是人类真正的生命力所在。如今理想汽车自研VLA，也意味着理想汽车踏入了人工智能的无人区。当前，辅助驾驶走到了新的十字路口上，理想汽车还需继续挑战成长极限。

责编：辛捷恺

特别声明：以上内容版权均属广东新快报社所有（注明其他来源的内容除外），任何媒体、网站或个人未经本报协议授权不得转载、链接、转贴或以其他方式复制发布/发表。协议授权转载联系：（020）87133906。