Figure 03直播30小时：具身智能从"PPT演示"迈入"工厂实战" - AI视野

2026年5月14日深夜，美国加州某处仓库内，三台身高173厘米的人形机器人正有条不紊地从传送带上抓起包裹、扫描条码、翻转标签、放置归位。这个过程持续了整整30个小时，中途没有人类介入，没有远程操控，只有机器人之间自主接力换电的无缝协作。

这不是科幻电影场景，而是一场被全球200万人围观的直播实测。Figure AI公司以这种近乎”硬核”的方式，向世界证明：具身智能正在走出实验室，走进真实的生产场景。

一、30小时直播：一场打破偏见的实测

直播的缘起来自于行业质疑。长期以来，人形机器人领域充斥着精心剪辑的演示视频——机器人完成某个特定动作，画面完美无瑕，但真实场景下的稳定性、长时间运行能力始终是个黑箱。有业内人士直言不讳：”你永远不知道演示背后有多少次失败和人工干预。”

面对这种质疑，Figure AI创始人布雷特·阿德科克选择了一种近乎偏执的回应方式：全程直播，无剪辑，无干预。从5月13日启动到5月15日累计满8小时，原定8小时的测试因机器人全程稳定运行，直接延长为7×24小时不间断直播。

实测数据极具冲击力：

效率表现：8小时分拣近万件包裹，平均2.7秒/件，单台效率约为人类分拣员的1.8倍；30小时累计处理超4.5万件，对标熟练工人水平。
识别精度：不规则包裹识别率99.7%，条码扫描成功率超95%，失误率低于1%。
适配范围：可处理0.5公斤至20公斤全重量段包裹，硬纸箱、软塑料袋、异形箱、带条码或无条码混合包裹”通吃”。
自主运维：自主检测电池电量、自主完成更换、自主诊断故障，实现了真正的”无人值守”。

但直播并非完美无瑕。围观的观众注意到了几处违和细节：机器人抓取转身时存在约0.5秒的滞后；偶尔出现的”摸头”动作被质疑是操作员调整AR眼镜视角；部分时段效率波动明显。这些质疑让Figure AI不得不反复强调”全程无遥操作介入”，但拒绝公开后台数据，反而让争议持续发酵。

无论如何，这场直播已经达成了它的核心目的——让市场看到人形机器人在真实工业场景中的实际表现，而不仅仅是精心打磨的演示视频。

二、Helix 02大脑：端到端神经网络驱动全身协同

Figure 03的核心竞争力，藏在它名为Helix 02的”大脑”里。

与传统机器人控制系统不同，Helix 02是一套端到端的视觉运动神经网络。简单来说，它实现了从”看到”到”做到”的直接映射：摄像头捕捉的画面像素，直接输入这个统一神经网络，然后瞬间输出全身数十个关节该如何运动的指令。

这种设计带来了几个关键优势：

去中心化协作：多台机器人之间没有中央控制节点，它们通过运行同一套”视觉-语言-动作”神经网络实现默契配合。就像两个背熟了同一本操作手册的人，看到对方动作就能推断出意图和下一步该做什么，无需”中间人”协调。

摆脱通信依赖：传统机器人系统高度依赖稳定的通信网络，一旦信号中断就会陷入停滞。而Figure 03的端到端架构让每个机器人成为独立决策单元，即使与其他机器人的通信出现问题，也能自主完成任务。

精细化操作能力：借助内置的触觉感知和手掌摄像头，Helix 02能够完成超乎想象的精细动作——从药盒中取出单粒药片、从注射器中精确导出5毫升液体、在杂乱环境中分离小型不规则物体。

技术层面，Helix 02的关键在于全身控制系统System 0。这套系统利用超过1000小时的人类运动数据，结合仿真到现实的强化学习训练，最终用单一神经网络先验替换了此前多达109504行手工编写的C++代码。这意味着机器人从”预设程序驱动”转向了”智能感知驱动”——每一秒都在自主判断该做什么，而非机械执行既定指令。

三、从分拣到制造：具身智能的工业版图

仓库分拣只是具身智能落地的一个切片。在Figure AI的规划中，同一套技术体系可以跨越工业流水线与家庭场景：

2026年3月，Figure 03曾在真实家庭厨房中连续4分钟自主完成洗碗机装卸任务，包括将碗碟分类放置进橱柜。
2026年5月，机器人进入京东物流亚洲一号仓库进行试点部署。
新一代F.04机器人已完成关键设计评审，进入完全设计冻结状态，阿德科克称之为”公司历代最大的一次跨越”。

放眼全球，具身智能的工业落地竞争已全面升温：

特斯拉Optimus Gen-3于2026年5月1日正式量产，上海超级工厂已部署50台用于座椅安装、内饰装配等工序，计划7-8月启动外部交付，设计年产能高达100万台，单台售价4.9万美元。

智元机器人远征A3于2026年5月初实现第10000台下线，从2025年1月千台量产到破万仅用15个月，批量部署汽车、3C、物流领域，端到端作业成功率超99%。

Figure AI自身也在加速：过去120天生产效率提升24倍，从每天生产1台提升到每小时1台，当周产出超55台。资本层面，公司累计融资超10亿美元，估值达390亿美元，投资方包括英伟达、高通、英特尔、微软、OpenAI。

四、商业化拐点：具身智能进入”部署态元年”

30小时直播背后，是一个正在成型的产业共识——2026年成为”具身智能部署态元年”。

从技术维度看，具身智能的核心突破体现在三个层面：

硬件成本下降：Optimus Gen-3成本较原型机下降73%，国产人形机器人核心零部件国产化率已突破70%，成本控制优势显著（远征A3成本约15-20万元）。

软件能力跃升：端到端神经网络架构替代传统模块化控制，机器人从”预设程序驱动”转向”智能感知驱动”，环境适应能力大幅提升。

数据闭环形成：虚拟训练平台通过数字仿真解决数据瓶颈，支撑机器人”大脑”持续演进，形成”硬件制造+数据赋能”闭环。

从市场维度看，物流分拣正在成为具身智能落地的”首个主战场”：星动纪元联合中国邮政在广州邮区中心部署机器人分拣员，每小时最高1200件，效率达人工的85%；银河通用Galbot在北京海淀50平米智能空间中覆盖5000种商品、6000个货道，24小时不间断稳定运行超150天。

当然，挑战依然严峻。在Figure 03的直播中暴露的问题——动作延迟、效率波动、自主决策稳定性——都是具身智能从实验室走向大规模商用必须跨越的鸿沟。有业内人士坦言：”机器人自主、自觉地完成任务，没有人在背后遥控，目前在复杂场景还做不到。” 焊接、拉高压线等特种作业场景中，远程操作仍是主流。

五、劳动力重构：机器”打工人”时代来临？

30小时直播结束后，阿德科克在公司内部会议上说了一句话：”我们不会就此停下，接下来是24/7直播！”

这句宣言背后，是一个正在逼近的现实：当人形机器人能够稳定地”自主上班”，物流分拣乃至整个制造业的劳动力格局或将迎来深刻重构。

从成本角度测算，Figure 03的单台效率约为人类分拣员的1.8倍，且可实现7×24小时不间断运行，这意味着单台机器人可替代2-3名全职员工的全天工作量。按其售价和运维成本计算，经济账正在变得可行。

但替代不会一蹴而就。现阶段的人形机器人更适合处理标准化程度较高、环境相对简单的任务，如仓库分拣、流水线装配等。真正复杂、非结构化的场景，如随机应变处理突发事件、应对特殊规格物件，仍需要人类介入。

更值得关注的是，具身智能的落地正在催生新的职业机会——机器人运维工程师、数据标注员、人机协作培训师等新岗位正在浮现。技术革命从来不只是简单的岗位替代，而是生产关系的重新配置。

结语

30小时直播画上句号，但具身智能的商业化长征才刚刚开始。

Figure 03的表现证明，人形机器人已经具备在真实工业场景中稳定运行的初步能力。但这仅仅是起点——从”能用”到”好用”，从”好用”到”规模化”，还有漫长的路要走。

当机器学会自主上班，当”打工人”不再需要工资和社保，制造业的劳动力格局终将迎来重构。而这一天，或许比大多数人想象的更近。

关键词： 具身智能、人形机器人、商业化落地、仓库自动化、Figure AI、Helix 02、工业机器人、劳动力替代

延伸阅读：

特斯拉Optimus Gen-3量产启动：百万产能规划背后的产业逻辑
中国具身智能首条万台级产线落地：国产供应链的崛起时刻
从Figure到智元：人形机器人商业化路径对比分析

Figure 03直播30小时：具身智能从”PPT演示”迈入”工厂实战”

一、30小时直播：一场打破偏见的实测

二、Helix 02大脑：端到端神经网络驱动全身协同

三、从分拣到制造：具身智能的工业版图

四、商业化拐点：具身智能进入”部署态元年”

五、劳动力重构：机器”打工人”时代来临？

结语

评论

发表回复 取消回复

更多文章

币安钱包新增功能对链上用户有哪些帮助

AI推理网络革命：为什么万卡集群的瓶颈不在GPU，而在网线

加密货币支付赛道为何重新受到资本关注

币安Launchpad项目还有暴富机会吗

发表回复取消回复