2026年5月14日深夜,美国加州某处仓库内,三台身高173厘米的人形机器人正有条不紊地从传送带上抓起包裹、扫描条码、翻转标签、放置归位。这个过程持续了整整30个小时,中途没有人类介入,没有远程操控,只有机器人之间自主接力换电的无缝协作。
这不是科幻电影场景,而是一场被全球200万人围观的直播实测。Figure AI公司以这种近乎”硬核”的方式,向世界证明:具身智能正在走出实验室,走进真实的生产场景。
一、30小时直播:一场打破偏见的实测
直播的缘起来自于行业质疑。长期以来,人形机器人领域充斥着精心剪辑的演示视频——机器人完成某个特定动作,画面完美无瑕,但真实场景下的稳定性、长时间运行能力始终是个黑箱。有业内人士直言不讳:”你永远不知道演示背后有多少次失败和人工干预。”
面对这种质疑,Figure AI创始人布雷特·阿德科克选择了一种近乎偏执的回应方式:全程直播,无剪辑,无干预。从5月13日启动到5月15日累计满8小时,原定8小时的测试因机器人全程稳定运行,直接延长为7×24小时不间断直播。
实测数据极具冲击力:
- 效率表现:8小时分拣近万件包裹,平均2.7秒/件,单台效率约为人类分拣员的1.8倍;30小时累计处理超4.5万件,对标熟练工人水平。
- 识别精度:不规则包裹识别率99.7%,条码扫描成功率超95%,失误率低于1%。
- 适配范围:可处理0.5公斤至20公斤全重量段包裹,硬纸箱、软塑料袋、异形箱、带条码或无条码混合包裹”通吃”。
- 自主运维:自主检测电池电量、自主完成更换、自主诊断故障,实现了真正的”无人值守”。
但直播并非完美无瑕。围观的观众注意到了几处违和细节:机器人抓取转身时存在约0.5秒的滞后;偶尔出现的”摸头”动作被质疑是操作员调整AR眼镜视角;部分时段效率波动明显。这些质疑让Figure AI不得不反复强调”全程无遥操作介入”,但拒绝公开后台数据,反而让争议持续发酵。
无论如何,这场直播已经达成了它的核心目的——让市场看到人形机器人在真实工业场景中的实际表现,而不仅仅是精心打磨的演示视频。
二、Helix 02大脑:端到端神经网络驱动全身协同
Figure 03的核心竞争力,藏在它名为Helix 02的”大脑”里。
与传统机器人控制系统不同,Helix 02是一套端到端的视觉运动神经网络。简单来说,它实现了从”看到”到”做到”的直接映射:摄像头捕捉的画面像素,直接输入这个统一神经网络,然后瞬间输出全身数十个关节该如何运动的指令。

这种设计带来了几个关键优势:
去中心化协作:多台机器人之间没有中央控制节点,它们通过运行同一套”视觉-语言-动作”神经网络实现默契配合。就像两个背熟了同一本操作手册的人,看到对方动作就能推断出意图和下一步该做什么,无需”中间人”协调。
摆脱通信依赖:传统机器人系统高度依赖稳定的通信网络,一旦信号中断就会陷入停滞。而Figure 03的端到端架构让每个机器人成为独立决策单元,即使与其他机器人的通信出现问题,也能自主完成任务。
精细化操作能力:借助内置的触觉感知和手掌摄像头,Helix 02能够完成超乎想象的精细动作——从药盒中取出单粒药片、从注射器中精确导出5毫升液体、在杂乱环境中分离小型不规则物体。
技术层面,Helix 02的关键在于全身控制系统System 0。这套系统利用超过1000小时的人类运动数据,结合仿真到现实的强化学习训练,最终用单一神经网络先验替换了此前多达109504行手工编写的C++代码。这意味着机器人从”预设程序驱动”转向了”智能感知驱动”——每一秒都在自主判断该做什么,而非机械执行既定指令。
三、从分拣到制造:具身智能的工业版图
仓库分拣只是具身智能落地的一个切片。在Figure AI的规划中,同一套技术体系可以跨越工业流水线与家庭场景:
- 2026年3月,Figure 03曾在真实家庭厨房中连续4分钟自主完成洗碗机装卸任务,包括将碗碟分类放置进橱柜。
- 2026年5月,机器人进入京东物流亚洲一号仓库进行试点部署。
- 新一代F.04机器人已完成关键设计评审,进入完全设计冻结状态,阿德科克称之为”公司历代最大的一次跨越”。
放眼全球,具身智能的工业落地竞争已全面升温:
特斯拉Optimus Gen-3于2026年5月1日正式量产,上海超级工厂已部署50台用于座椅安装、内饰装配等工序,计划7-8月启动外部交付,设计年产能高达100万台,单台售价4.9万美元。
智元机器人远征A3于2026年5月初实现第10000台下线,从2025年1月千台量产到破万仅用15个月,批量部署汽车、3C、物流领域,端到端作业成功率超99%。
Figure AI自身也在加速:过去120天生产效率提升24倍,从每天生产1台提升到每小时1台,当周产出超55台。资本层面,公司累计融资超10亿美元,估值达390亿美元,投资方包括英伟达、高通、英特尔、微软、OpenAI。
四、商业化拐点:具身智能进入”部署态元年”
30小时直播背后,是一个正在成型的产业共识——2026年成为”具身智能部署态元年”。
从技术维度看,具身智能的核心突破体现在三个层面:
硬件成本下降:Optimus Gen-3成本较原型机下降73%,国产人形机器人核心零部件国产化率已突破70%,成本控制优势显著(远征A3成本约15-20万元)。
软件能力跃升:端到端神经网络架构替代传统模块化控制,机器人从”预设程序驱动”转向”智能感知驱动”,环境适应能力大幅提升。
数据闭环形成:虚拟训练平台通过数字仿真解决数据瓶颈,支撑机器人”大脑”持续演进,形成”硬件制造+数据赋能”闭环。
从市场维度看,物流分拣正在成为具身智能落地的”首个主战场”:星动纪元联合中国邮政在广州邮区中心部署机器人分拣员,每小时最高1200件,效率达人工的85%;银河通用Galbot在北京海淀50平米智能空间中覆盖5000种商品、6000个货道,24小时不间断稳定运行超150天。
当然,挑战依然严峻。在Figure 03的直播中暴露的问题——动作延迟、效率波动、自主决策稳定性——都是具身智能从实验室走向大规模商用必须跨越的鸿沟。有业内人士坦言:”机器人自主、自觉地完成任务,没有人在背后遥控,目前在复杂场景还做不到。” 焊接、拉高压线等特种作业场景中,远程操作仍是主流。
五、劳动力重构:机器”打工人”时代来临?
30小时直播结束后,阿德科克在公司内部会议上说了一句话:”我们不会就此停下,接下来是24/7直播!”
这句宣言背后,是一个正在逼近的现实:当人形机器人能够稳定地”自主上班”,物流分拣乃至整个制造业的劳动力格局或将迎来深刻重构。
从成本角度测算,Figure 03的单台效率约为人类分拣员的1.8倍,且可实现7×24小时不间断运行,这意味着单台机器人可替代2-3名全职员工的全天工作量。按其售价和运维成本计算,经济账正在变得可行。
但替代不会一蹴而就。现阶段的人形机器人更适合处理标准化程度较高、环境相对简单的任务,如仓库分拣、流水线装配等。真正复杂、非结构化的场景,如随机应变处理突发事件、应对特殊规格物件,仍需要人类介入。
更值得关注的是,具身智能的落地正在催生新的职业机会——机器人运维工程师、数据标注员、人机协作培训师等新岗位正在浮现。技术革命从来不只是简单的岗位替代,而是生产关系的重新配置。
结语
30小时直播画上句号,但具身智能的商业化长征才刚刚开始。
Figure 03的表现证明,人形机器人已经具备在真实工业场景中稳定运行的初步能力。但这仅仅是起点——从”能用”到”好用”,从”好用”到”规模化”,还有漫长的路要走。
当机器学会自主上班,当”打工人”不再需要工资和社保,制造业的劳动力格局终将迎来重构。而这一天,或许比大多数人想象的更近。
关键词: 具身智能、人形机器人、商业化落地、仓库自动化、Figure AI、Helix 02、工业机器人、劳动力替代
延伸阅读:
- 特斯拉Optimus Gen-3量产启动:百万产能规划背后的产业逻辑
- 中国具身智能首条万台级产线落地:国产供应链的崛起时刻
- 从Figure到智元:人形机器人商业化路径对比分析

发表回复