人工智能

数据军备竞赛:具身智能产业正在经历的关键一跃

ainet.cn   2026年05月26日

新华社旗下中国证券报近日发布深度报道指出:具身智能行业正从实验室走向真实场景,数据成为决定落地成败的关键因素。行业头部数据需求方普遍有全年百万小时级的数据需求,而供给端却面临成本高昂、效率低下、标准缺失等多重瓶颈。这场悄然打响的"数据军备竞赛",正在重塑整个产业的竞争格局。

头部玩家入场:数据赛道已成新战场

2026年4月,具身智能数据赛道迎来密集布局。帕西尼联合京东云、腾讯云、百度智能云共同推出全模态具身智能数据云商城;智元机器人控股的觅蜂科技发布一站式物理AI数据服务平台,计划到2026年和2030年分别实现千万小时级和百亿小时级数据产能。

与此同时,光轮智能宣布完成近10亿元融资,成为具身数据领域首个"独角兽"企业,今年一季度已获得5.5亿元订单。

觅蜂科技CEO姚卯青的判断很直接:"当下正处于数据军备竞赛的起点。"行业头部数据需求方普遍有全年百万小时的数据需求,而供给端却严重滞后。这个缺口有多大?按照传统真机遥操作的效率,百万小时数据意味着数千名工程师连续数月的高强度工作,仅人力成本就高达数亿元。

三条技术路线:谁在重新定义数据采集

面对百万小时级的数据缺口,行业正在探索多条技术路线来突破瓶颈。目前最具代表性的有三条路径,它们代表了从"手工时代"到"工业时代"的不同进化方向。

路线一:无本体穿戴采集

今年4月觅蜂科技发布的MEgo系列是典型代表——包括夹爪造型的手持采集设备MEgo Gripper,以及穿戴在头部和手部的MEgo View采集终端。这些设备不需要机器人本体参与,直接采集人类操作者的动作轨迹和环境信息,再将数据部署至机器人。今年3月鹿明机器人发布的FastUMI同样走这条路线,将单条数据采集时间从传统遥操作所需的50秒缩短至10秒,综合成本降至原来的五分之一。预计无本体方案普及后,采集效率将达到真机采集的两三倍。

路线二:互联网视频预训练

千寻智能选择了一条更独特的路径——基于海量人类互联网视频进行预训练,通过自研设备将数据采集成本降低了90%。这种方式的优势在于数据规模几乎无限,互联网上有数十亿小时的人类操作视频可供挖掘。挑战在于视频数据与机器人动作空间之间存在"语义鸿沟",需要强大的算法能力来提取可用的动作信息。

路线三 · 基元智航核心方案

多视角真实数据工业化采集

这条路线不走"绕开真机"的捷径,而是正面解决真机数据采集的成本和效率问题。通过规模化部署采集设备,同时记录机器人本体的ego视角(第一人称摄像头画面)和第三人称视角(外部固定或移动机位),构建完整的视觉-动作闭环数据。ego视角让模型"看到"机器人自己看到的画面,第三人称视角提供全局空间参照,两者结合才能训练出真正具备空间理解和精细操作能力的VLA模型。

三条路线各有优劣。无本体方案效率最高但数据精度有限,互联网视频方案规模无限但语义对齐难度大,多视角真实数据方案成本相对可控且精度最高——因为训练的是真机在真实场景中执行任务的模型,最直接的数据源永远是真实物理交互。

为什么真实多视角数据不可替代

核心逻辑:VLA模型的训练需要让机器人"看到"自己看到的画面(ego视角),同时理解自身在空间中的位置和姿态(第三人称视角)。单一视角的数据无法提供完整的空间-动作关联,而穿戴式采集虽然高效但丢失了机器人本体的真实感知信息。当模型需要在真实场景中毫秒级做出精确操作时,只有基于真实多视角数据训练的模型才能胜任。

千寻智能的"小墨"能在宁德时代实现全球首条具身智能PACK产线规模化落地、单日效率提升3倍,核心原因之一正是其在数据端的系统性建设——高质量的多视角数据供给,让模型的现场适应能力远超依赖单一数据源的方案。Spirit v1.5在RoboChallenge上超越Pi0.5登顶,底层支撑的同样是数据质量的系统性优势。

但这套能力建设门槛极高。单台人形机器人成本数十万元,采集1万小时数据需上百万元软硬件投入。真实场景环境复杂,需改造场地适配多场景。加之行业标准不统一、数据格式各异、标注规范缺失,大多数中小机器人公司根本无力自建。

标准之争:数据竞赛的下一个制高点

数据规模的竞争只是第一层,更深层的较量在于数据标准。姚卯青指出了行业最紧迫的问题:"首先是行业标准缺失,各家企业生产数据的格式、标注都自成体系,难以互通和复用;二是数据质量参差不齐,标注不规范、质量粗糙问题普遍存在。"大模型由数据驱动,如果输入"垃圾数据",产出的就是"垃圾模型"。

目前关于具身智能数据的选用标准、用量规模以及采集方式,行业内尚未形成统一共识,企业仍处于探索阶段。北京、上海、天津、武汉、无锡等多地虽已建立大规模数据采集工厂,但各自为战,数据孤岛现象严重。

业内投资人的态度很明确:当下资本更看好具备低成本、高效率数据获取方式的企业。谁能同时解决"数据从哪来"和"数据怎么规范"两个问题,谁就有可能在具身智能产业链中占据核心位置——这不是一家公司的竞争力问题,而是整个行业的底座问题。

基元智航:数据基础设施的第三种答案

面对数据军备竞赛,行业需要的不只是更多玩家,更需要一套工业化的数据生产基础设施。基元智航的定位正是如此——不做机器人本体,不做VLA模型,而是为具身智能产业链提供规模化、标准化、低成本的真实多视角数据采集与交付服务。

基元智航的核心方案是ego视角+第三人称视角的双轨真实数据采集。通过规模化部署采集设备,同时记录机器人本体摄像头画面和外部机位视角,为VLA模型提供完整的视觉-动作闭环数据。这套数据直接对应模型的输入需求,避免了从虚拟到现实的精度损失。

通过系统性的采集流程优化和工业化产能建设,基元智航帮助客户节省90%的真机遥操作训练成本。对于中小创业公司而言,这意味着无需自建昂贵的数据团队,就能获得与大厂同等质量的数据资源,将有限资金和人力聚焦于模型创新和场景落地。数据军备竞赛的终局,不是谁采得最多,而是谁能让数据像电力一样即插即用。

数据军备竞赛的赢家,不是采集最多的人,而是让数据成为基础设施的人。

(基元智航)

标签:基元智航 我要反馈 
剑维软件:电子半导体行业的数字化未来
专题报道
2026汉诺威工业博览会专题报道
2026汉诺威工业博览会专题报道

2026年汉诺威工业博览会(Hannover Messe)在德国汉诺威圆满闭幕。作为全球最具影响力的工业技术盛会之一,本... [更多]

2026国际消费类电子产品展览会
2026国际消费类电子产品展览会

2026年1月6-9日,2026国际消费电子展(CES)在美国拉斯维加斯举办。 [更多]

2025全景工博会
2025全景工博会

第二十五届中国国际工业博览会(简称“中国工博会,CIIF”)将于今年9月23至27日在国家会展中心(上海)举行。 [更多]