新快报讯 随着AI技术加速迈向“世界模型”方向,物理世界的高质量交互数据已成为最稀缺的战略资源。5月18日,出行科技与服务公司如祺出行首次向外界完整披露了其AI数据资产版图,从标注数据、行为数据,到合成数据、多模态训练数据集,形成了从数据采集、规模化处理、精准标注到合成数据及多模态处理的全链路数据服务能力。
当前,广东正加速从“世界工厂”向“AI应用第一省”跨越。2025年,全省人工智能核心产业规模突破3000亿元,同比增长超40%,占全国约四分之一;人工智能相关企业达68.6万家,其中智驾企业超过1400家、具身智能企业已达9978家,对AI模型训练必需的优质数据需求极为庞大。
显而易见,如祺出行凭借真实出行场景的长期积累,正以自身优势为基础,加快向大湾区AI行业数据基础设施供应商发展。公开信息显示,如祺数据在大湾区已为腾讯、小马知行、广汽等多家科技及智驾头部企业提供服务。
根据最新财报显示,如祺出行2025年以该业务为主要收入来源的技术服务板块实现营收1.60亿元,同比大增487.4%。截至2026年5月,公司已在广州、上海、重庆、沈阳等城市部署超过300辆智能驾驶数据采集车,每日可产出1600小时、约130TB的合规数据。
更为关键的是,这些数据并非来自实验室或虚拟仿真,而是根植于如祺出行的常态化运营场景。采集车搭载激光雷达、摄像头等多类传感器,在开展出行服务的同时合规采集真实场景中的驾驶行为、人车交互等信息,具备物理世界数据特征,契合当前AI行业,尤其是具身智能、世界模型训练对高质量数据的要求。
行业数据显示,类似的高质量数据全球总量仅约50万小时左右,而头部厂商单年需求量即达百万小时级别,供需极度失衡。在业界普遍将具身智能和世界模型视为“下一个AI主战场”的背景下,这类数据已被视作稀缺性战略资产。
有分析认为,类似如祺出行这样的出行服务平台天然具备生产、积累高价值数据的优势。伴随每年数亿单出行订单和庞大的车辆运行数据,海量司机行车、泊车以及高频交通场景的多模态数据不断涌入平台,并附带“司机决策—车辆响应—环境反馈”的完整链条。
对如祺出行而言,升级“数据集+全栈能力”这一模式,让公司不仅服务智能驾驶,还能向具身智能等高价值赛道延伸,实现数据服务价值链攀升。这也是其区别传统AI数据服务商多聚焦于基础标注的优势。
官方信息显示,如祺出行已在全国布局3大数据服务交付基地,拥有超1500人的服务团队、超1000家BPO合作伙伴及近百万众包资源,每月可提供千万级标注产能,满足高并发任务需求。同时,如祺的合成数据已涵盖不同时段、天气环境及座舱场景,有效弥补真实采集中的盲区;多模态训练数据集则覆盖图像、文本、音频与视频,可直接支持大模型的垂类微调。通过全栈数据服务能力,如祺出行可实现“数据即服务”模式,显著降低客户使用高质量真实数据的门槛。
如祺出行方面表示,正加快将海量真实出行场景数据转化为驱动人工智能迭代的核心资产,向智能驾驶、具身智能、世界模型等前沿领域注入“数据动力”。记者了解到,目前,如祺数据服务已进入智能驾驶、具身智能、大模型、消费电子、医疗等多个领域,客户包括腾讯、小马智行、理想、广汽、火山引擎、百度智能云等头部企业,商业化路径已得到初步验证。
