新快报讯 记者罗晓彤报道 在科技飞速发展的当下,人工智能正以前所未有的速度重塑着各个行业。理想汽车在“理想AI Talk第二季——理想VLA司机大模型,从动物进化到人类”中重磅推出VLA司机大模型,而理想汽车董事长兼CEO李想重点分享了对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战,以及对于创业和个人成长的见解。
对于AI工具,李想分为三个层级,分别是信息工具、辅助工具和生产工具。目前,大多数人将AI作为信息工具使用,但信息工具常伴随大量无效信息、无效结果和无效结论,仅具参考价值。成为辅助工具后,AI可以提升效率,例如现在的辅助驾驶,但仍需人类参与。未来,AI发展为生产工具后,将能独立完成专业任务,显著提升效率与质量。李想认为,当AI发展为生产工具,能独立完成专业任务时,才是其真正的爆发点。
而此番推出的理想VLA司机大模型就尤为重要。据了解,理想汽车自2024年起开展VLA研究,并在多项顶级学术会议上发表论文,夯实了理论基础。对理想汽车而言, 未来的VLA就是一个像人类司机一样工作的司机大模型。
不过,VLA的实现并非一蹴而就,而是经历了漫长的进化过程。早期,理想汽车依赖规则算法和高精地图的辅助驾驶,类似“昆虫动物智能”,仅能基于简单规则做出反应。之后,端到端+VLM辅助驾驶技术的应用,使其接近“哺乳动物智能”,但仍存在局限。而VLA迈入的“人类智能”就是第三阶段。它通过3D和2D视觉组合,能完整感知物理世界,还具备语言和思维链推理能力,可理解并执行行动,与人类驾驶方式高度契合。
在训练过程中,VLA模拟人类学习驾驶的步骤,分为预训练、后训练和强化训练。预训练利用大量视觉和语言数据,训练出云端VL基座模型,并转化为车端高效运行的端侧模型,如同人类学习驾驶常识。后训练加入动作数据,让模型学会在复杂交通环境中博弈。强化训练则通过基于人类反馈的强化学习和世界模型训练,实现安全和舒适驾驶,超越人类驾驶水平。最终,VLA司机大模型以“司机Agent”的形态呈现,用户能用自然语言与之沟通,复杂指令由云端和车端协同处理。
当然,除了提升专业能力,VLA司机大模型还需解决安全性和模型黑盒的问题。
为了保障VLA司机大模型能够实现职业司机般的安全和舒适,避免学习加塞等违规行为,理想汽车在强化训练环节投入大量资源,并于2024年底组建超过100人的超级对齐团队,相当于为司机Agent注入职业素养。为解决模型的黑盒问题,理想汽车结合重建和生成两种路径,打造了真实、符合物理世界规律的世界模型,覆盖所有交通参与者和要素,让VLA能在其中验证现实问题,提升问题解决效率,增强用户对智能驾驶的信任。
而理想汽车能取得技术的突破,得益于其扎实的基本功。从研究、研发到能力表达和业务价值转化,李想汽车在每个环节都精心打磨。比如在辅助驾驶技术研发上,面对英伟达芯片的限制,理想汽车凭借自有编译团队和综合技术能力,成功实现芯片高效运行语言模型。同时,借助DeepSeek开源,加速语言能力研发,节省大量时间和成本。但理想汽车并未满足于此,反而加大投入打造自研模型,并开源自研汽车操作系统回馈社会。
成立十年来,理想汽车在创业路上不断成长。李想认为,创业虽充满挑战,但应保持积极心态,将困难视为成长的机遇。他强调关注自我成长,接受自身优缺点,同时重视亲密关系,与家人、同事相互支撑。面对AI的发展,李想认为,在AI面前所有的人性都应被保留,无论好坏,因为一切人性都是文化、生命、性格、能力的特质,也是人类真正的生命力所在。如今理想汽车自研VLA,也意味着理想汽车踏入了人工智能的无人区。当前,辅助驾驶走到了新的十字路口上,理想汽车还需继续挑战成长极限。