作者： admin

人形机器人半程马拉松4月19日北京开赛：70支队伍同场竞技，具身智能运动能力迎来实战检验
一、机器人跑马拉松：看似简单实则艰难

为什么是21公里？

半程马拉松的21.0975公里，对人类跑者而言已是极限挑战，对机器人来说更是难上加难。

首先是人形机器人与传统机器人的本质区别。传统工业机械臂固定在工位上工作，运行环境高度可控；而人形机器人需要面对复杂多变的真实环境——不平整的路面、随时出现的障碍物、忽高忽低的地形变化。这些在工厂里不存在的挑战，在马拉松赛道上比比皆是。

其次是能耗管理的难题。人类跑者可以在途中补充能量，但机器人只能依靠自带电池完成全程。如何在保证动力输出的同时优化能耗，如何在电量告急时做出最优决策，都是机器人需要解决的难题。

更关键的是运动控制的稳定性。人形双足行走本身就是机器人领域的皇冠难题，需要在毫秒级别内完成姿态调整、步态规划、平衡控制。一个微小的失误——踩到石子、踏空台阶、失去平衡——都可能导致机器人摔倒，而一旦摔倒，在没有外力帮助下自主站起继续奔跑，目前仍是行业难题。

宇树H1：10米/秒的速度担当

在已公布的参赛阵容中，宇树科技的人形机器人H1备受瞩目。这款机器人曾在测试中创下百米跑10米/秒的惊人速度，刷新了人形机器人的世界纪录。

宇树H1的核心技术亮点在于其全尺寸人形纯电驱设计。整机运动能力可达360°/s，关节扭矩密度为130N·m/kg，最大关节扭矩可达360N·m，爆发力强、响应速度快。这些参数意味着H1不仅能快速奔跑，还能在突发情况下迅速做出姿态调整。

更值得关注的是H1的自主避障能力。通过深度相机和激光雷达的融合感知，H1能够实时构建周围环境的三维地图，在发现障碍物时自动规划绕行路径。这意味着在马拉松赛道上，H1有更大的机会在复杂地形中安全通过。

二、70支队伍背后的产业生态

赛队构成：从头部企业到科研院所

本届马拉松的70余支参赛队伍，呈现出多元化的特点：

头部企业：宇树科技、智元机器人、傅利叶智能、星动纪元等国内头部机器人企业悉数参赛。这些企业拥有成熟的研发团队和完整的技术链条，其参赛机器人代表了国内人形机器人的最高水平。

科研院所：清华大学、北京理工大学、上海交通大学等高校团队也携自研机器人参赛。这些团队往往在某一细分技术上有独到见解，如双足行走算法、环境感知融合等。

创新企业：一些初创公司同样跃跃欲试，希望借助马拉松舞台展示自己的技术实力。对于这些企业而言，这不仅是技术验证的机会，更是品牌曝光的绝佳窗口。

国际选手：据组委会透露，本届赛事还邀请了来自美国、日本、韩国的机器人团队参赛，这使得北京亦庄马拉松真正成为了一场全球性的机器人竞技盛会。

技术路线：百家争鸣

参赛队伍的技术路线呈现出明显的差异化：

在驱动方式上，有的采用电机驱动，有的尝试液压驱动，还有的探索电液混合方案。不同技术路线各有优劣：电机驱动响应快、控制精度高，但爆发力相对有限；液压驱动爆发力强，但系统复杂、维护困难。

在感知方案上，有的依赖视觉主导，有的采用激光雷达为主，还有的强调多传感器融合。不同的感知策略决定了机器人对复杂环境的适应能力。

在AI大脑上，有的采用端侧AI芯片实现本地决策，有的通过5G网络实现云端协同，还有的探索边云协同的混合架构。AI能力的差异直接决定了机器人的自主性水平。

三、赛事设置的深层意义

自主导航组：具身智能的真正考验

本届赛事最大的创新在于设立了自主导航组，约占参赛队伍的40%。与遥控组由人类操作员实时控制不同，自主导航组的机器人需要完全依靠自身能力完成比赛。

这意味着机器人需要具备：

环境感知能力：通过摄像头、激光雷达、IMU等多种传感器，实时感知赛道环境，识别道路边界、障碍物、地形变化。

路径规划能力：在感知的基础上，快速计算最优行走路径，避开障碍，选择最适合的地形通过。

运动控制能力：根据地形变化实时调整步态，保持平衡，稳定前进。这需要在毫秒级别内完成从感知到决策再到执行的闭环。

故障恢复能力：一旦摔倒或遇到意外，机器人需要自主判断情况，尝试重新站起继续前进。

这些能力，正是具身智能的核心所在。与简单的对话助手、图像生成不同，具身智能要求AI能够理解物理世界、在真实环境中执行动作。这不仅是技术问题，更是认知问题——机器人需要像人类一样，理解“走在什么样的地面上”“怎样跨越这个台阶”“如何避免踩空”。

双组别设置：兼顾竞技与展示

赛事设置自主导航与遥控双组别，体现了赛事组织者的务实考量。

遥控组的存在，让更多技术尚不成熟的企业和研究团队能够参与进来，展示自己的成果。这有助于扩大赛事影响力，推动更多力量投入到具身智能的研发中。

同时，自主导航组的设置，保证了赛事的专业性和竞技性。那些真正具备自主能力的机器人，将在激烈竞争中脱颖而出，证明自己的技术实力。

四、具身智能：从实验室到真实场景

为什么马拉松重要？

人形机器人跑马拉松，本质上是一次大规模的真实场景测试。

在实验室里，研究人员可以在受控环境中测试机器人的各项能力；但再精确的模拟，也无法完全复现真实世界的复杂性。赛道上的一块小石子、地面的一条裂缝、意想不到的光线变化——这些在实验室里难以模拟的干扰因素，在马拉松赛道上都会真实出现。

通过马拉松，研发团队能够发现机器人从未暴露的弱点，找到改进的方向。更重要的是，这种实地的、长时间的、压力测试，能够验证机器人的稳定性和可靠性——这正是具身智能能否真正落地应用的关键。

从实验室到落地：具身智能的产业化之路

马拉松赛事的背后，是具身智能产业化的加速推进。

在工业领域，具身智能正在改变生产制造的方式。以智元机器人为例，其发布的全系列具身智能产品已覆盖工业、家庭、医疗等多个场景。在汽车总装线上，智元的机器人能够完成复杂的装配任务，精度达到0.01mm；在3C产品生产线上，换型时间缩短80%，大大提升了生产效率。

在服务领域，具身智能同样展现出巨大潜力。普渡机器人近日启用了全球首个商用服务机器人体验中心，围绕餐饮、酒店、工业、零售等场景构建了可触摸、可互动的沉浸式应用环境。这是服务机器人从产品销售向体验经济转型的标志。

在家用领域，虽然完全自主的家务机器人仍较遥远，但辅助型机器人已经开始进入家庭。助老助残机器人、陪伴机器人、教育机器人——这些产品形态虽然还不完美，但代表着具身智能走向日常生活的方向。

五、技术瓶颈与突破方向

当前的核心挑战

尽管进步显著，人形机器人要真正走进千家万户，仍面临诸多挑战：

运动控制的精细化：当前的人形机器人在平坦地面上行走已相对稳定，但在复杂地形——楼梯、斜坡、泥泞地面、狭窄空间——的表现仍有待提升。尤其是在长时间运动后的疲劳累积、状态漂移问题，目前尚未很好解决。

能耗与续航：21公里的马拉松对机器人续航是极大考验。高性能电机、高算力芯片都是耗电大户，如何在保证性能的同时优化能耗，是所有参赛队伍面临的共同难题。

自主决策的可靠性：在真实环境中，机器人需要处理各种预料之外的情况。当传感器失效、当判断失误、当意外发生，机器人能否做出正确反应？这种“边缘情况”的处理能力，目前仍是具身智能的短板。

成本控制：高端人形机器人的成本仍然高昂，宇树H1售价约几十万元，大多数家庭难以承受。成本的大幅下降，是具身智能普及的前提条件。

突破方向展望

针对这些挑战，业界正在多个方向寻求突破：

VLA模型：视觉-语言-动作（Vision-Language-Action）模型的发展，让机器人能够像人类一样理解指令、感知环境、执行动作。通过海量数据训练，VLA模型能够将视觉感知、语言理解与运动控制有机结合，提升机器人在复杂环境中的适应能力。

端侧AI芯片：轻量级端侧推理芯片的发展，让机器人在边缘侧实时处理物理反馈成为可能。在功耗低于10W的情况下实现30Tops以上的算力，为机器人的本地化智能提供了硬件基础。

多模态感知融合：整合视觉、触觉、力觉等多种感知方式，让机器人能够更全面地理解环境。单纯依靠视觉的方案在光线变化、遮挡等情况下表现受限，而多模态融合能够大幅提升感知的鲁棒性。

强化学习：通过强化学习，机器人能够从无数次模拟和真实尝试中自主学习最优策略。这种数据驱动的方法，有望弥补传统控制方法在应对复杂场景时的不足。

六、机器人马拉松的意义：超越比赛本身

推动技术进步

机器人马拉松的首要意义，在于推动技术进步。赛事设置了明确的目标——让机器人在21公里赛道上安全、稳定、快速地完成比赛——这为技术研发提供了清晰的方向。

参赛队伍为了赢得比赛，会全力以赴研发新技术、验证新方案。这些研发投入，最终会转化为行业的技术进步。即使没有获胜的队伍，也能在比赛中发现自身短板，明确改进方向。

促进产业协同

马拉松赛事还为产业链上下游提供了交流合作的平台。机器人企业、芯片厂商、传感器供应商、AI算法公司、软件开发商——各方力量在赛事中汇聚，碰撞出合作的火花。

有企业负责人表示，参加马拉松不仅是为了比赛，更是为了与同行交流、与供应商对接、了解行业最新动态。这种非正式的交流，往往能带来意想不到的合作机会。

普及公众认知

更重要的是，机器人马拉松向公众展示了具身智能的发展现状。

对于大多数人而言，机器人仍停留在科幻电影中的印象——要么是超能陆战队里的大白，要么是终结者里的T-800。真实的具身智能发展到什么程度？还有多远要走？这些问题，大多数人并不了解。

通过马拉松直播、媒体报道、线下观赛，公众能够直观地看到机器人的能力边界：它能做什么？不能做什么？困难在哪里？进步有多快？这种认知的普及，对于推动社会接受具身智能产品、为产业发展营造良好环境，都具有重要意义。

结语

4月19日的北京亦庄，70余支人形机器人赛队即将用21公里的奔跑，回答一个关乎未来的问题：具身智能，距离真正改变我们的生活还有多远？

这不是一场简单的比赛，而是具身智能产业的一次集体亮相。从顶尖企业到科研院所，从成熟方案到创新探索，这场赛事汇聚了中国具身智能的力量，也折射出行业的现状与方向。

无论最终谁能夺冠，这场马拉松的意义都已超越比赛本身。它是一次技术检验，一次产业协同，一次公众科普，更是中国具身智能发展历程中值得铭记的里程碑。

当机器人真正能够稳定、自如地在复杂环境中行走、奔跑、作业，我们有理由相信，一个真正的人机共存时代正在加速到来。

相关阅读
2026年4月19日

斯坦福2026AI指数报告发布：中美AI差距仅剩2.7%，中国全面反包美国

一、2.7%差距背后：一部中国AI三年逆袭史

性能跃升：从望尘莫及到毫厘之间

斯坦福报告的核心数据揭示了中美AI实力的根本性逆转。截至2026年3月，美国顶尖模型Claude Opus 4.6的Elo评分为1503分，而中国顶尖模型Dola-Seed 2.0 Preview得分1464分，两者差距仅39分，折合百分比仅为2.7%。

这一数字的背后，是中国AI三年来的跨越式发展轨迹：

2023年：中美顶级模型在MMLU、MATH、HumanEval等核心基准测试中，差距高达17.5至31.6个百分点。那时，国产大模型还在为“接近GPT-4水平”而努力。

2024年底：差距迅速缩小至0.3至3.7个百分点。中国模型开始在全球评测榜单上崭露头角，但美国仍保持着明显的领先优势。

2025年2月：DeepSeek-R1横空出世，首次在多项测试中与美国头部模型打平，震惊业界。

2026年3月：阿里Qwen3.5-Max在全球盲测中以1464分超越GPT-5.4，位列全球第五。在Arena排行榜上，中美模型反复换位、轮流领跑已成常态。

在细分领域，中国模型已实现全面领先。阿里Qwen3.5在τ-bench测试中以68.4%的任务成功率位列全球第三，MMLU-Pro测试准确率达87.8%，媲美Gemini 3.1 Pro和Claude Opus 4.6。DeepSeek-V3.2周调用量突破1.02万亿Token，跻身全球前六。

产业爆发：应用落地全面领跑

中国AI的优势不仅体现在模型性能上，更体现在产业应用的广度和深度上。

2026年3月，中国大模型周调用量达4.69万亿Token，同比增长320%，连续两周超过美国的4.21万亿。更令人瞩目的是，字节豆包月活用户突破3.15亿，阿里千问MAU达2.03亿，增速552%，位居全球第一。

在工业领域，中国工业机器人装机量占全球54%，AI与制造业深度融合，智能工厂、柔性生产已成为常态。智能工厂的良品率提升25%、生产效率提升40%、能耗降低18%，2026年工业AI渗透率超过55%，而美国仅为32%。

在民生领域，AI政务、AI教育、AI医疗、AI交通全面普及。中国AI渗透率达88%，远超全球平均水平。从“AI陪伴机器人”守护独居老人，到无人值守便民服务站全面铺开，科技正以最接地气的方式改变着每个人的生活。

科研创新：论文专利全球领先

中国在AI科研产出上同样展现出强劲实力。报告显示，中国AI论文发表数量、引用频次、专利产出总量均位居世界第一。

2025年，中国AI相关学术论文占全球总量的41%，高被引论文数量超越美国；AI专利申请量占全球45%，连续五年位居首位。清华、北大、浙大等高校，与阿里、字节、DeepSeek等企业联动，形成了“产学研”一体化创新体系。

在全球AI开源生态中，中国同样占据主导地位。中国开源模型数量、开发者活跃度、社区贡献度均超越美国，成为全球AI开源的核心引擎。自Gemma初代发布以来，系列累计下载量超过4亿次，社区衍生版本超过10万个——而中国开发者贡献了其中相当大比例。

二、全球AI机构格局：中国军团强势崛起

机构排名历史性突破

斯坦福报告显示，在全球前20大AI机构排名中，中国占据11家，美国9家，中国首次在这项数据上超越美国。这一历史性突破，标志着中国AI整体实力的跃升。

从具体排名来看：

阿里：以11个重要模型位列全球第三，仅次于OpenAI的19个和Google的12个
DeepSeek：凭借V3.2等明星模型跻身全球前十
MiniMax：开源M2.7引爆全球开发者社区
智谱AI：GLM-5.1编程能力首超GPT-5.4
字节跳动：豆包日均Token使用量突破120万亿

这意味着，在全球AI”六强争霸”的格局中，中国已占据两席——DeepSeek和阿里巴巴，与OpenAI、Google、Anthropic、xAI同台竞技。

开源生态“东移”趋势

开源社区的格局变化同样值得关注。中国开源模型不仅在国内普及，更横扫硅谷，成为海外企业的“性价比之选”。

OpenRouter数据显示，国产大模型的海外开发者占比高达47%，中国本土开发者仅占6%。Shopify切换至Qwen后，每年节省500万美元；爱彼迎联创公开称赞其“又好又快又便宜”。

智谱GLM的定价更是令业界震动——再度提价10%后，国产大模型首次在核心场景实现与海外头部厂商的价格对齐。一年前，国产大模型厂商还在以降价90%以上争夺市场份额；如今，定价逻辑已从“降价换市场”转向“性能锚定价格”。

三、实力对比：全方位透视中美AI

技术维度

指标	美国	中国	态势
顶级模型性能	1503分	1464分	差距2.7%
开源模型数量	约40%	约45%	中国领先
AI论文发表量	约35%	41%	中国领先
AI专利申请量	约38%	45%	中国领先
高被引论文数	落后	领先	中国领先

产业维度

指标	美国	中国	态势
工业机器人装机量占比	约17%	54%	中国领先
AI渗透率	约45%	88%	中国领先
大模型周调用量	4.21万亿	4.69万亿	中国领先
AI企业应用采用率	50%	55%	中国领先
AI产业规模	全球第二	全球第一	中国领先

生态维度

指标	美国	中国	态势
全球AI机构Top20数量	9家	11家	中国领先
开源模型海外开发者占比	约40%	47%	中国领先
顶级AI科学家数量	约50%	约35%	美国领先
AI芯片自主化率	约85%	约38%	美国领先

四、正视差距：2.7%之外的三大挑战

尽管成绩斐然，斯坦福报告同样客观指出了中国AI发展面临的三大挑战：

高端芯片差距

尽管昇腾芯片实现突破，但英伟达H100、H200仍领先1-2代，高端GPU全球垄断格局未破。中国AI芯片在工艺、性能、生态上仍有差距，高端算力依赖进口的局面尚未完全扭转。

截至2026年，全球顶尖AI科学家中，美国仍占50%以上；基础研究、原创算法方面，美国仍保持着一定的优势。

基础研究积累

大模型架构、注意力机制、训练方法等底层创新，目前仍主要来自美国科技巨头。中国在“从0到1”的原创突破上，仍需持续投入。

人才储备厚度

高端AI人才的数量和质量，直接决定着AI发展的后劲。虽然中国每年培养大量AI专业毕业生，但在顶尖人才占比上，与美国仍有差距。

五、未来展望：2.7%之后的三大方向

性能全面反超

中国模型迭代速度领先美国1.5倍，2026年Q3-Q4，字节、阿里、DeepSeek将发布新一代旗舰模型。依托端云协同、稀疏计算、多模态融合技术，有望全面超越美国顶尖模型，2.7%的差距将彻底逆转。

技术原创引领

2026年中国聚焦AI Agent、具身智能、神经符号融合三大方向，已有12项原创技术进入全球前列。未来三年，将在芯片、框架、算法三大底层实现突破，国产AI芯片自主化率有望达到38%。

全球生态主导

中国开源模型已成为全球主流，2026-2027年将推进”AI全球普惠计划”，向发展中国家开放技术、共享生态。依托”一带一路”，中国AI标准、技术、应用将走向全球，构建”中国研发、全球应用”的新体系。

结语

2.7%的差距，既是过去努力的成果，更是未来冲刺的起点。

这份斯坦福报告，用最权威的数据印证了一个事实：中国AI不再是“追赶者”，而是“并跑者”，正在成为“领跑者”。从“跟跑”到“并跑”再到“局部领跑”，中国AI用三年时间完成了别人十年走过的路。

这不是偶然爆发的昙花一现，而是厚积薄发的必然结果。海量应用场景的滋养、完整产业链的支撑、高效政策环境的引导、无数科研工作者的坚守——这些因素共同铸就了中国AI的今天。

当全球AI进入“双雄并峙”的新纪元，中国正以自信的姿态、开放的胸怀、创新的活力，向世界展示着属于自己的AI力量。未来已来，唯变不变；中国AI的故事，才刚刚开始。

AI算力军备竞赛：千亿资本流向何方？

2026年4月，全球AI算力市场迎来标志性时刻：英伟达Blackwell GPU云端现货租赁价格，从两个月前的2.75美元/小时飙升至4.08美元/小时，涨幅高达48%。

这不是简单的价格调整，而是AI产业格局的深刻转变：算力已从”配套资源”升级为”核心硬通货”。

一、价格狂飙：算力进入稀缺时代

1.1 全球GPU涨价潮

2026年以来，AI算力市场经历了多轮涨价潮：

GPU型号	2025年10月价格	2026年3月价格	涨幅
H100（年约）	$1.70/小时	$2.35/小时	38%
Blackwell B200	$2.75/小时	$4.08/小时	48%
国内H100月租	约3.5万元	突破5万元	43%+

按此价格计算，单台Blackwell GPU单日租赁成本逼近100美元，全年满负荷运行费用高达3.5万美元。高端算力，正式告别”白菜价”时代。

更值得关注的是供需失衡：

主流云厂商高端GPU算力长期无货
部分企业将H100合约租期延长至2028年
H100、H200现货库存不足10%
高端算力机柜出租率逼近98%

1.2 供需撕裂：需求爆发，供给受限

算力价格暴涨的核心，是供需两端的彻底撕裂。

需求侧：AI应用普及，算力消耗暴增369倍

摩根大通预测，中国推理算力Token消费量将从2025年的10千万亿，暴涨至2030年的3900千万亿，增幅高达369倍。

AI Agent成为算力消耗的核心推手。相比传统聊天机器人，OpenClaw等智能Agent单次任务Token消耗量是其10-100倍，且部署后24小时持续运行。

OpenAI API吞吐量达每分钟150亿Token，推理Token年增幅高达320倍。

供给侧：芯片+电力双重瓶颈

Blackwell GPU交付周期拉长至6-7个月
台积电CoWoS封装年产能固定65万片
Rubin芯片因HBM4认证问题量产延迟
美国数据中心项目30%-50%延期

2026年国内AI算力需求4423 EFLOPS，供给仅1590 EFLOPS，缺口超2800 EFLOPS。

二、资本狂潮：千亿资金押注算力

2.1 全球AI资本支出：7250亿美元

摩根大通最新报告显示，2026年全球与AI相关的资本支出预计达到7250亿美元，其中算力基础设施占比超过60%。

四大科技巨头2026年资本开支合计约6300亿美元：

企业	2026年资本开支	重点方向
亚马逊	2000亿美元	AWS算力扩张+Trainium2自研
谷歌	1700-1850亿美元	TPU v6量产+Gemini全场景
微软	1050-1800亿美元	Azure超算+OpenAI深度绑定
Meta	1150-1350亿美元	Llama训练设施+1GW数据中心

这是什么概念？6300亿美元超过瑞典全年GDP，单家投入均超千亿美元，算力基建周期至少到2027年底，无短期退潮风险。

2.2 AI企业融资：Anthropic 300亿美元

资本不仅流向硬件基础设施，也涌向AI企业本身。

2026年2月，Anthropic宣布完成300亿美元G轮融资，投后估值达3800亿美元。仅仅几周后，多家风投机构主动报价8000亿美元估值——比此前的3800亿翻了一倍多。

Anthropic年收入从2025年底的90亿美元飙升至300亿美元，四个月增长233%。

Claude Code编程助手年化收入达25亿美元，成为AI工具商业化的标杆案例。

2.3 微软：算力版图持续扩张

微软在算力领域的布局尤为激进：

接盘OpenAI挪威Stargate项目：租赁3万块英伟达GPU，园区规模230兆瓦
自建数据中心：Azure超算集群持续扩张
垂直整合：从芯片（与英伟达合作）到算力（自建+租赁）到应用（Copilot）

“算力就是AI时代的石油，谁掌握算力，谁就掌握未来。”——这句话正在成为现实。

三、产业链解析：钱流向哪里？

3.1 芯片：英伟达的垄断与挑战

英伟达在高端AI芯片市场占据80%以上份额，H100/H200成为”硬通货”。

但供给瓶颈重重：

台积电CoWoS封装产能是核心瓶颈
2026年月产能约12万片
即便2027年扩产至20万片，仍存在15%-20%供需缺口

H100停产传闻背后：

对华实质出货全面停摆
产能向Blackwell系列战略转移
国产替代加速：华为昇腾、寒武纪等芯片年产能新增超50万片

3.2 存储：HBM价格暴涨5倍

AI服务器对存储的需求远超传统服务器：

单台AI服务器对DRAM需求是传统服务器的8-10倍
对NAND Flash需求达3倍
2026年一季度DRAM合约价同比涨幅达400%
NAND闪存合约价同比涨幅达500%

服务器DRAM主流颗粒现货均价报37美元/片，较2025年6月低点上涨逾5倍。

3.3 基础设施：电力成为新瓶颈

算力扩张遭遇电力天花板：

美国2026年原计划上线16GW数据中心容量，30%-50%项目延期
预计2027年全球AI数据中心需68GW电力，接近2022年加州总用电量
高压变压器全球缺口30%+，短缺将持续至2029年

清洁能源+算力成为新趋势：

微软接盘的Stargate项目位于挪威，充分利用当地水电资源；Meta计划建设10座天然气发电厂为数据中心供电。

四、商业模式重构：从”卖算力”到”卖Token”

4.1 新旧模式对比

算力供需失衡，不仅推高价格，更彻底改写行业商业模式。

维度	传统模式	新模式
收入来源	硬件折旧+电力成本	Token分成+模型服务
估值体系	市盈率（P/E）	市销率（P/S）
客户关系	一次性租赁	持续服务绑定
盈利空间	有限	打开

东吴证券指出： 行业正从”卖算力”升级为”卖Token”，完成从一次性收入到持续服务性收入的质变。

4.2 企业业绩爆发

新模式下，企业业绩迎来爆发式增长：

协创数据：2026年一季度归母净利润预盈6.5-8.5亿元，同比暴涨284%-402%
智谱API：一季度价格累计上调83%，但调用量不降反增
CoreWeave：GPU资产2.5年回本，客户合同平均4年

4.3 行业格局重塑

“有算力者为王“的时代已经到来：

资金雄厚的科技巨头提前签订3-5年算力长约
中小企业难以获取高端算力，被迫转向模型轻量化或接受巨头投资
行业呈现”算力垄断”趋势

OpenAI为节省GPU资源关闭Sora视频生成服务；Anthropic高峰时段压缩Claude用户配额——头部AI企业纷纷”勒紧裤腰带”。

五、投资机遇：结构性行情下的机会

5.1 算力产业链全景图

环节	核心标的	投资逻辑
芯片设计	英伟达、AMD、华为昇腾	高壁垒，垄断格局
芯片制造	台积电、三星	先进制程供不应求
封装测试	日月光、长电科技	CoWoS产能扩张受益
存储芯片	三星、SK海力士、美光	HBM需求爆发
光模块	中际旭创、天孚通信	算力互联核心组件
散热系统	英维克、申菱环境	液冷渗透率提升
电力设备	特变电工、国电南瑞	电力基建受益

5.2 国产替代：算力自主可控

在中美科技博弈背景下，算力自主可控成为刚需：

华为昇腾950PR/950DT发布，性能对标H100
国产AI芯片市场份额提升至25%+
2028年我国AI芯片市场规模预计超一万亿元

5.3 风险提示

算力投资需关注以下风险：

估值风险：部分算力标的估值偏高
技术迭代风险：新一代芯片发布可能影响现有产品竞争力
政策风险：美国出口管制政策变化
供需改善风险：2027-2028年供给释放可能缓解紧缺

结语：算力，AI时代的核心资产

2026年，AI算力市场经历了从”过剩”到”稀缺”的历史性转折。

Blackwell GPU租赁价两个月暴涨48%，英伟达H100/H200一卡难求，四大科技巨头6300亿美元军备竞赛——这些事件共同指向一个事实：算力已成为AI时代的核心资产。

供需失衡不会在短期内缓解。摩根大通预测，高端算力紧缺局面将持续至2029年。这是一场结构性短缺，而非周期性波动。

对于投资者而言，算力板块拥有”需求刚性+供给刚性“双重支撑，景气度有望持续数年。但分化将加剧——真正掌握核心技术、具备产能优势的龙头企业，将享受估值溢价。

当算力成为”硬通货”，谁能拿到更多GPU，谁就能在AI时代占据先机。

2026年4月18日

AI制药新纪元：从实验室到临床的跨越
一款新药从实验室到上市，需要多长时间？

传统的答案是：10-15年，数十亿美元投入，90%以上的临床失败率。这是制药行业著名的”双十定律”，也是人类攻克疾病道路上的最大障碍。

但现在，AI正在从根上改写这个答案。

2026年，谷歌DeepMind旗下Isomorphic Labs宣布与礼来、强生达成深度合作，推动全球首个AI全流程设计的药物首次进入大规模临床试验。这不是对现有药物的简单优化，而是AI从靶点结构出发，从零设计的全新分子。

AI制药，不再只是”辅助工具”，而是”核心引擎”。

一、颠覆时刻：AI如何重塑药物研发

1.1 从”十年磨一药”到”数月出成果”

传统药物研发是一场”时间与金钱的豪赌”：
- 一款新药从靶点发现到上市，平均需要10-15年
- 研发成本动辄数十亿美元
- 临床失败率高达90%以上
- 无数候选分子在体外实验中表现优异，却因各种问题折戟
AI的介入，正在改变这个游戏规则：
- AI能在数天内完成过去需要数月的”虚拟筛选”
- 从靶点结构解析到先导化合物优化，研发周期压缩到以月为单位
- 大幅降低试错成本，让更多潜在药物进入临床
以英矽智能的Rentosertib为例，从靶点发现到进入II期临床，仅用时不到4年——而传统模式下，这个过程通常需要7-10年。

1.2 从”单点优化”到”全局设计”

传统药物设计往往只聚焦”药物与靶点的结合亲和力”单一指标，相当于只看钥匙能不能插进锁孔，却忽略了：
- 钥匙是否耐用？
- 会不会开错其他锁？
- 能不能批量生产？
AI制药则不同。Isomorphic Labs的IsoDDE引擎，在分子设计阶段就同时纳入：
- 成药性：药物能否被人体吸收、代谢
- 合成可行性：药物能否规模化生产
- 脱靶风险：药物是否会影响其他靶点
- 药代动力学：药物在体内的吸收、分布、代谢、排泄
从源头规避传统研发的高频失败点，让进入临床的分子更具成药潜力。

1.3 AI制药的技术演进

AI制药的技术发展经历了三个阶段：

第一阶段（2018-2022）：单点突破

以AlphaFold为代表，AI在蛋白质结构预测领域取得突破。AlphaFold已预测超过2亿种蛋白质结构，为药物靶点研究提供了前所未有的工具。

第二阶段（2022-2025）：端到端探索

英矽智能、晶泰科技等企业开始探索从靶点发现到分子设计的一体化AI解决方案。英矽智能的PandaOmics平台，将从靶点发现到PCC提名的周期缩短至18个月以内。

第三阶段（2026-至今）：临床验证

AI设计的药物进入大规模临床试验，验证AI全流程设计药物的临床可行性。礼来、强生等跨国药企全面拥抱AI制药，标志着行业进入新的发展阶段。

二、里程碑事件：AI制药进入临床元年

2.1 全球首个AI全流程药物临床试验

2026年，Isomorphic Labs宣布与礼来、强生达成深度合作，标志着AI制药进入临床元年。

此次进入临床的首款AI设计药物，是一款针对慢性肾病的小分子抑制剂。在I期临床试验中，该药物展现出了优异的安全性与符合预期的药代动力学特征。

这意味着什么？

这是全球首个由AI从靶点结构出发、从零设计的全新分子进入临床——不是对现有药物的改良，而是真正意义上的”AI造药”。

礼来与强生的合作，将全面覆盖小分子与生物制剂两大领域，靶点涵盖癌症、自身免疫病、代谢性疾病等全球高发疾病。AI制药不再是小众技术，而是成为跨国药企的核心研发引擎。

2.2 英矽智能：从中国走向全球

英矽智能是中国AI制药的代表企业。2026年，其核心产品Rentosertib（ISM001-055）在特发性肺纤维化（IPF）的IIa期临床中显示出明确疗效，并推进至III期。

这是全球首个由生成式AI发现并推进至临床III期的TNIK抑制剂，不仅验证了AI在难成药靶点上的攻坚能力，更确立了”端到端”AI药物发现模式在全球的可行性。

2026年，英矽智能登陆港交所主板，成为中国首家以生成式AI驱动药物研发为核心业务的上市公司，市值一度高达195亿港元。

2.3 晶泰科技：AI+量子物理的结合

晶泰科技采用”量子物理+AI+云计算”的技术路线，在药物研发领域走出独特道路。

其智能药物研发平台已成功赋能超过200个早期药物发现项目。其中与礼来合作的口服小分子GLP-1受体激动剂项目，2026年上半年已确认PCC，并计划于同年提交IND（新药临床试验申请）。

晶泰科技内部数据显示，其与实测值的相关性系数（R²）已提升至0.85以上，显著降低了湿实验筛选的成本与盲目性。

三、技术突破：AI制药的核心能力

3.1 蛋白质结构预测：从AlphaFold到AlphaFold3

AlphaFold是AI制药领域的里程碑式突破。2024年发布的AlphaFold3，进一步将预测范围扩展到DNA、RNA等生物分子。

AlphaFold的意义在于：大幅降低药物靶点研究的门槛。

传统方式下，确定一个蛋白质的三维结构可能需要数年时间和数百万美元；AlphaFold可以在数小时内完成预测，且准确率接近实验水平。

这对中小型药企和科研机构意义重大——他们无需建设昂贵的结构生物学实验室，就能开展高质量的药物研发工作。

3.2 生成式AI：从”找药”到”造药”

如果说AlphaFold解决了”靶点长什么样”的问题，生成式AI则解决了”怎么设计药物分子”的问题。

英矽智能的Chemistry42平台，采用扩散模型进行抗体设计，支持按表位和框架进行条件控制。小分子设计平台升级了Alchemistry 2.0引擎，结合分子动力学模拟，大幅提升了结合亲和力预测的精度。

更值得关注的是”零样本”能力。Chai-2模型实现零样本抗体设计，面对全新靶点蛋白，能直接根据三维结构从头生成全新抗体，将成功率从不足0.1%提升至16%，效率飞跃百倍。

3.3 多智能体：从”单兵作战”到”军团协作”

传统药物研发流程中，靶点发现、分子设计、临床试验等环节相互割裂，信息传递效率低下。

AI制药正在构建”多智能体”平台，将不同环节的专业智能体整合成”首席智能体科学家军团”。这些智能体不再”各自为战”，而是分工协同，在知识图谱约束下进行推理规划。

这种”人机共生”的研发范式，正在重塑药物发现的效率天花板。

四、市场格局：AI制药的万亿赛道

4.1 全球AI制药市场规模

2026年全球AI制药市场规模约120亿美元，预计2030年将突破500亿美元，年复合增长率超过40%。

4.2 中国AI制药：快速崛起的第二极

中国AI制药行业2026年被认为是从技术验证迈向商业化兑现的关键之年。

核心数据：
- 中国AI核心产业规模预计突破1.2万亿元
- AI企业数量超过6000家
- 国产开源大模型全球累计下载量突破100亿次
- 中国已成为AI专利最大拥有国
在政策层面，2026年4月，国家药品监督管理局药品审评中心（CDE）正式发布《人工智能辅助药物研发申报资料指导原则（试行）》修订版，首次明确AI生成药物在IND申报中关于算法可解释性、数据溯源性以及模型验证的具体技术要求。

这是中国AI制药合规化的”破冰时刻”。

4.3 资本涌入：AI制药融资再创新高

2026年以来，AI制药领域融资持续火爆：
- 晶泰科技与DoveTree授权合作：约59.9亿美元
- 英矽智能港交所上市：市值一度达195亿港元
- 纽瑞特医疗核药融资：10亿元E轮
- 2026年H1 AI制药融资：约120亿元人民币
根据动脉网数据，2026年上半年，AI制药领域融资总额同比增长35%，头部企业如晶泰科技、英矽智能的股价表现强劲，反映出二级市场对AI制药商业模式盈利能力的认可。

五、挑战与展望

5.1 当前面临的挑战

尽管进展显著，AI制药仍面临三大核心挑战：

1. 数据质量与可得性

AI模型的训练需要大量高质量数据，但制药行业的数据往往分散在不同企业、机构，且存在格式不统一、质量参差不齐的问题。

2. 监管不确定性

各国药品监管机构对AI设计的药物尚未建立完善的审批标准。CDE新发布的指导原则是重要进步，但仍需进一步细化。

3. 技术局限

AI在分子设计环节表现出色，但在”成药性”预测、临床试验设计等方面仍有局限。AI设计的分子能否在人体中表现出预期效果，仍需要大量实验验证。

5.2 未来展望：人机共生的药物研发时代

展望未来，AI制药将经历三个阶段：

近期（2026-2028）：单点深化

AI在靶点发现、分子设计等单点环节持续深化，效率优势进一步显现。AI设计的药物陆续进入II、III期临床，初步验证商业化可行性。

中期（2028-2030）：全流程融合

AI深度融入药物研发全流程，从靶点发现到临床试验，实现端到端智能化。人机协同成为主流研发范式。

远期（2030+）：范式革命

AI从”工具”升级为”创新伙伴”，不仅执行人类指令，更能提出创新性的药物设计思路。药物研发进入真正的”AI驱动”时代。

结语：让每一种疾病都有药可医

2026年，AI制药进入临床元年。这不仅是技术的突破，更是人类对抗疾病历程中的重要里程碑。

传统”双十定律”（十年、十亿美元研发一款新药）的牢笼，正在被AI撬动。英矽智能18个月完成靶点发现到PCC提名，晶泰科技将预测准确率提升至0.85以上，Isomorphic Labs的AI设计药物进入临床试验——这些不再是PPT上的概念，而是真实发生的进步。

AI的价值，从来不是替代药物研发科学家，而是把科学家从海量的筛选、试错中解放出来，让他们聚焦真正的医学创新与临床转化。

让每一种疾病都有药可医——这个愿景正在因为AI而变得更加真实。
2026年4月18日

具身智能规模化落地元年：从展品到商品的跨越

2026年4月，上海某3C电子工厂的生产线上，一台人形机器人正在完成精密装配任务。8小时工作制，2283次任务操作，零失误。

这不是演示视频，而是真实的生产场景。这台来自智元机器人的”精灵G2″机器人，标志着具身智能正式从”展品”变成了”商品”。

工信部数据显示，截至2026年3月，国内人形机器人整机企业已超过140家，发布产品达330款。行业从”实验室炫技、Demo展示”，进入”工程化、场景化竞争的下半场”。

2026年，被业界定义为具身智能”部署态元年”。

一、转折时刻：从”能走路”到”能干活”

1.1 行业进入下半场

回顾具身智能的发展历程，2024年到2025年初，行业的焦点还在比拼机器人走路是否自然。如今，人形机器人已能完成”飞檐走壁”般的高难度动作。

“本体灵活性已达到实用化阶段，接下来要比的，是谁的干活能力更强。”智元机器人联合创始人、总裁兼CTO彭志辉（稚晖君）在2026人形机器人与具身智能标准化（HEIS）年会上表示，”不仅在国内比，更要与海外头部企业比，看谁能在’部署态’真正落地。”

这个转变的核心逻辑是：AI要实现最大化的通用性和兼容性，终端形态大概率要长得像人。正如整个物理世界——从门把手高度到工具形态——都是为人类身体设计的，人形机器人是物理世界的”通用接口”。

1.2 “沿途下蛋”的商业策略

面对复杂的物理世界约束，智元总结出一套可落地的工程范式——“一体三智”。

所谓”一体”，即机器人本体。在数字世界，代码跑错了可以重启；但在物理世界，有物理成本、失效成本。本体设计绝非简单的硬件堆叠，而是可靠性工程、供应链工程和安全工程的综合体。

“三智”则是指：

运动智能：基础智能，承担执行器功能
交互智能：高阶智能，提供服务生产力
作业智能：高阶智能，提供劳动生产力

在场景落地策略上，彭志辉提出了”沿途下蛋”的思路。他将任务维度划分为”场景复杂度”和”任务复杂度”，认为当前人形机器人的最佳切入点是——“在简单场景做复杂任务”。

比如在结构化的工厂环境里，执行高自由度、高维感知的复杂操作。相比自动驾驶”在复杂环境下做简单任务”，人形机器人的终局是”在复杂环境下完成复杂任务”，但这需要循序渐进。

二、技术突破：从”大脑”到”小脑”的全面进化

2.1 具身基座大模型：机器人的”大脑”

2026年4月，智元机器人发布新一代具身基座大模型GO-2，首次在统一架构中打通从逻辑推理到精准动作执行的”最后一公里”。

GO-2支持千台级机器人协同训练，训练效率提升约10倍。这意味着机器人的”大脑”不仅能理解指令，还能将指令转化为精确的身体动作。

更值得关注的是智元同步开源的AGIBOT WORLD 2026数据集——这是业界最大的真机数据集，所有数据均采集自商业空间、酒店、家居等100%真实世界场景，涵盖遮挡、光照变化等随机干扰因素。

相比模拟数据训练的机器人，基于真实数据训练的具身智能，在复杂场景下的泛化能力显著提升。

2.2 世界模型：让机器人拥有”物理直觉”

除了具身基座大模型，世界模型是另一条关键技术路线。

智元发布的GE-Sim 2.0世界模型，首次构建可交互、可训练的”物理进化引擎”。机器人可以在模拟环境中完成大规模闭环训练，大幅降低对真实物理试错的依赖。

为什么要训练世界模型？

因为让AI理解物理规律——重力、材质、空间关系——是机器人不再”犯傻”的关键。传统的机器人依赖预设程序，面对非结构化环境往往束手无策；具备世界模型的机器人，能够理解”这个杯子是玻璃的，轻拿轻放”，而不是机械地执行”拿起杯子”。

OpenAI调整Sora团队方向、杨立昆和李飞飞等顶尖学者创办世界模型公司——这些动向都表明，物理AI正在成为AI竞争的下一战场。

2.3 硬件进化：从”能用”到”好用”

软件进化之外，硬件层面的突破同样关键。

2026年4月，智元一口气发布4款本体新品：

远征A3：综合能力最强全尺寸人形整机，整机重量从行业普遍的70多公斤降至50公斤，双电池包支持热插拔，连续工作8-10小时
灵犀X3：面向人形交互服务场景，预计2026年年底上市
精灵G2系列：面向工业搬运拆码垛场景
酷拓D2系列：四足机器人，面向物流搬运、工业巡检等场景

灵巧手的突破尤为关键。彭志辉指出，工业场景中接近80%人类做得很好、但自动化做不好的工序，都和触觉强相关。”装配工人通过手感把零件拼起来，’咔嚓一声’觉得装好了——这种信号如何用数字描述？这是行业面临的瓶颈之一。”

三、商业化落地：从”烧钱”到”赚钱”

3.1 工业场景：率先突破

目前，具身智能商业化落地最成熟的场景是工业制造。

典型案例：

智元”精灵G2″在3C工厂8小时完成2283次任务，零失误
优必选Walker S系列已批量进入富士康、比亚迪、极氪等头部制造企业，单台机器人作业成功率99%
Figure AI的F.02机器人在宝马工厂连续运行11个月，完成10小时轮班，累计运行1250多小时
银河通用Galbot S1双臂最大持续负载50公斤，已在宁德时代产线实现零遥操、全自主作业

为什么工业场景率先突破？

工业场景具备三大优势：

环境相对结构化：工厂生产线虽然复杂，但相对可控
任务相对标准化：装配、搬运、质检等任务有明确的流程
ROI容易计算：一台机器人替代几个工位，价值可量化

3.2 从”单点突破”到”规模化复制”

2026年，具身智能正在从单点突破走向规模化复制。

优艾智合是工业领域出身的机器人代表企业，截至2026年，已累计超过800个工业具身智能场景落地案例，覆盖半导体、能源化工、锂电、3C制造等多个领域，服务全球400余家行业头部客户。2025年营收达3.4亿元，目前已递交IPO招股书，计划港股上市。

智平方与惠科股份达成的5亿元大单，覆盖仓储物流、上下料、装配到质检全流程，成为半导体显示行业首个大规模具身智能应用项目。

星动纪元与顺丰深度合作，在物流集散中心实现分拣、扫码、供件全流程覆盖，推动仓储、快递中转等环节的规模化应用。

3.3 “部署态元年”的市场规模

根据《中国人工智能产业发展指数报告》，2025年中国具身智能市场规模约380亿元，预计2026年将突破600亿元，年增长率超过58%。

更长期来看，具身智能的想象空间是万亿级别的。彭志辉判断：”未来人形机器人走进家庭时，产业规模将是’手机数量乘以汽车价格’的级别。”

四、投资机遇：产业链全景梳理

4.1 上游：核心零部件

具身智能产业链的最上游是核心零部件，这也是当前资本最关注的环节：

细分领域	主要玩家	投资价值
减速器	绿的谐波、国茂股份	谐波减速器价值量高，国产替代空间大
伺服系统	汇川技术、禾川科技	运动控制核心，毛利率较高
传感器	速腾聚创、帕西尼感知	力传感器国产化率低，壁垒高
灵巧手	智元自研、追觅	触觉感知是差异化关键

2026年一季度，速腾聚创机器人业务销量达18.55万台，同比大增1458.8%，销量占比达56.2%，首次超过车载激光雷达业务。”高级驾驶辅助系统（ADAS）+机器人”双轮驱动战略取得结构性突破。

4.2 中游：整机厂商

整机厂商是具身智能产业的核心，包括：

人形整机：智元机器人、优必选、Figure AI、特斯拉Optimus
工业机器人：ABB、库卡、国产替代
服务机器人：普渡科技、擎朗智能

2026年，智元机器人第10000台通用具身机器人远征A3正式下线，从千台到万台的突破仅用时3个多月，量产速度创全球纪录。

4.3 下游：场景应用

下游场景应用可分为三大方向：

工业制造：3C电子、汽车总装、锂电池
物流仓储：分拣、搬运、上架
商业服务：酒店、餐饮、医疗辅助

工信部日前批准发布的《YD/T 6770—2026 人工智能关键基础技术具身智能基准测试方法》，将于2026年6月1日正式实施，从环境、任务、能力、考核、安全伦理五大核心维度，构建覆盖全链路的产业级验证体系。

行业标准的落地，标志着具身智能从”技术验证”走向”产业规范化”。

五、挑战与展望

5.1 当前的三大挑战

尽管进展显著，具身智能仍面临三大核心挑战：

1. 泛化能力不足

当前的人形机器人，在特定场景下表现优异，但面对非结构化环境（如陌生家庭、复杂户外）的能力仍然有限。”左手换右手”这种对人类简单的动作，对机器人仍是难题。

2. 成本依然偏高

一台人形机器人的售价仍在数十万到上百万元，远未达到大规模普及的临界点。降本路径包括：核心零部件国产化、规模化生产、供应链优化。

3. 数据闭环待完善

具身智能需要大量真实场景数据进行训练，但数据采集成本高、效率低。智元开源AGIBOT WORLD数据集，是解决这一问题的重要尝试。

5.2 2026-2030年发展路线图

智元提出的XYZ曲线框架，为行业发展提供了清晰的演进坐标：

X曲线（2022-2025年）：开发尝鲜期，完成从原型到规模量产的关键跨越
Y曲线（2026-2030年）：部署成长期，部署态数据飞轮驱动生产力持续逼近人类水平
Z曲线（2030年以后）：部署普及期，机器人在制造、物流、服务等领域生产力全面超越人类

2026年的目标是：在首批部署态场景完成万台部署，成功跨越百亿营收门槛。

结语：机器人时代真的来了

2026年，具身智能进入”部署态元年”。这不仅是一个时间节点，更是行业从”技术驱动”转向”需求驱动”的标志。

当人形机器人开始在工厂里8小时零失误工作，当具身智能模型开始理解”玻璃杯要轻拿轻放”，我们正在见证一个全新时代的开启。

机器人不再是展品，而是商品。具身智能不再只是概念，而是正在发生的现在。

2026年4月18日

AI智能体平台横评：OpenClaw vs Claude Managed Agents vs Hermes，谁将定义数字员工时代？

2026年，AI智能体（Agent）赛道的竞争格局正在悄然生变。当大模型的参数竞赛告一段落，业界目光转向了更务实的问题：谁能真正把AI从”聊天工具”变成”数字员工”？

答案并非只有一个。OpenClaw、Claude Managed Agents、Hermes Agent——这三款目前最受关注的AI智能体平台，正以截然不同的路径切入市场。它们不是同一赛道上的竞争对手，而是面向不同用户群体、提供差异化价值的解决方案。

本文将深度横评三大平台，解析它们的技术架构、核心优势与竞争策略。

AI智能体技术架构对比 - OpenClaw、Claude、Hermes三平台技术维度

一、格局重塑：三大平台的三条路径

1.1 OpenClaw：开源世界的”瑞士军刀”

OpenClaw从诞生之初就定位清晰——自托管、本地优先的开源AI Agent网关。

它不是传统意义上的聊天机器人，而是一个能把大语言模型变成”能动手做事”的助手的框架。通过Gateway架构和丰富的Skills生态，OpenClaw让AI帮你回微信、发邮件、操作数据库、定时执行任务——这些能力被整合在一起，形成了一套完整的自动化工作流。

几个核心数据足以说明它的地位：

GitHub Star：34万+（截至2026年4月）
支持平台：20+通讯渠道（WhatsApp、Telegram、Discord、微信等）
支持模型：25+AI模型（Claude、GPT、DeepSeek等）
最新版本：2026.4.5（4月5日发布，全模态能力+AI记忆系统）

OpenClaw最大的优势在于生态成熟度。多年的积累让它拥有了庞大的社区Skills库——超过3000个社区构建的扩展插件，覆盖邮件、日历、网页自动化、交易等场景。对于”数据不能上云”的企业来说，OpenClaw的本地优先特性是无可替代的选择。

但值得注意的是，2026年2月，OpenClaw创始人Peter Steinberger宣布加入OpenAI，项目正在向开源基金会过渡。这一变化对OpenClaw的长期发展走向，值得持续关注。

1.2 Claude Managed Agents：企业级的”交钥匙”方案

Anthropic在2026年4月8日发布的Claude Managed Agents，走的完全是另一条路。

它不是框架，甚至不是一个具体的Agent产品。用Anthropic自己的话说，它是一个**”meta-harness”**——一个托管在云端的Agent基础设施层。

传统开发Agent时，你需要自己搭建三样东西：

Harness（编排层）：管理任务调度和执行流程
Session（会话状态）：维护对话上下文
Sandbox（执行环境）：隔离运行，保证安全

这三层既复杂又容易出问题，是很多团队迟迟无法把Agent投入生产的主要原因。Claude Managed Agents的做法是：这三层我全部帮你托管了。

Anthropic的”三层解耦架构”如下：

Session层：append-only的完整操作日志
Harness层：调用Claude的编排循环，由Anthropic托管和优化
Sandbox层：隔离的执行环境

最关键的定价：$0.08/小时运行时费用。这意味着企业不再需要雇一个运维团队来维护Agent基础设施，也不需要担心扩缩容问题。对于想快速上线Agent但又没有运维能力的中型企业来说，这个诱惑力是巨大的。

1.3 Hermes Agent：自我进化的技术新锐

Hermes Agent代表了另一种方向——自我进化。

与OpenClaw依赖人工编写的静态Skills不同，Hermes Agent能通过使用过程中的反馈自动改进技能结构。它不是简单地把对话存起来，而是会主动理解、关联、优化记忆结构。

GitHub数据显示，Hermes Agent在发布两个月内就斩获了7万+星标，增长速度惊人。”越用越聪明”的概念在开发者圈子里极具吸引力——想象一下，你部署了一个Agent，它不需要你教，自己就能学会新技能。

但Hermes的问题在于生态积累尚浅。OpenClaw的34万+Star、3000+Skills生态，是短期之内Hermes难以超越的护城河。

二、技术架构深度对比

2.1 记忆系统：谁更”记事儿”？

记忆系统是AI智能体最核心的能力之一。它决定了Agent能否跨越会话保持上下文理解，真正成为用户的”专属助手”。

维度	OpenClaw	Claude Managed Agents	Hermes Agent
记忆类型	会话级+持久存储	全托管Session日志	工作记忆+长期记忆+技能记忆
跨会话记忆	需配置外部存储	原生支持	原生支持，自动进化
记忆检索	基于向量检索	Anthropic托管	语义搜索+关联召回
用户画像	基础支持	企业级用户管理	自动构建用户模型

2.2 技能生态：多才多艺的比拼

技能（Skills）决定了Agent能完成多少任务，是衡量平台实用性的关键指标。

维度	OpenClaw	Claude Managed Agents	Hermes Agent
技能来源	社区Skills+自定义	官方托管API	自动生成+手动创建
技能进化	手动更新	版本管理	使用中自动改进
工具隔离	沙箱机制	企业级隔离	内置安全沙盒
技能生态	丰富（3000+）	起步阶段	快速增长

2.3 部署与运维：谁更”省心”？

对于企业来说，部署和运维成本往往是选择平台的关键因素。

维度	OpenClaw	Claude Managed Agents	Hermes Agent
部署方式	自托管（本地/云）	完全托管	自托管（轻量）
运维成本	中等（需维护）	低（Anthropic托管）	低（$5 VPS即可）
数据控制	完全自主	依赖Anthropic	完全自主
扩展性	手动配置	自动扩缩容	垂直扩展

如果你最怕麻烦，Claude Managed Agents肯定是首选——完全托管，零运维。但如果你对数据隐私有要求，或者想省钱，OpenClaw和Hermes的自托管路线更适合你。

三、竞争格局：错位竞争还是正面交锋？

3.1 Claude Managed Agents不会”杀死”OpenClaw

很多人看到”Managed”就觉得这是要干掉所有开源框架，其实不然。

Claude Managed Agents瞄准的是企业级托管市场。它的目标用户是那些”想快速上线AI Agent但不想自建基础设施”的中大型企业。对于这些企业来说，$0.08/小时的定价、自动扩缩容、企业级安全，都是非常有吸引力的。

但OpenClaw的核心用户是什么人？是开发者、技术爱好者、以及对数据隐私有极致要求的企业。这些人要么喜欢折腾，要么数据不能上云——Claude Managed Agents再强，也满足不了他们的需求。

结论：两者更多是错位竞争，而非直接对抗。

3.2 Hermes才是OpenClaw的真正威胁

真正对OpenClaw构成直接威胁的，其实是Hermes Agent。

为什么？因为两者的定位几乎完全重叠：

✅ 都是开源免费
✅ 都是自托管
✅ 目标用户都是开发者和技术爱好者

而且Hermes还有一个杀手锏——“自我进化”。这个概念在开发者圈子里非常有吸引力。想象一下，你部署了一个Agent，它不需要你教，自己就能学会新技能、越用越聪明——这比OpenClaw的”静态Skills”模式听起来酷多了。

但OpenClaw也不是没有机会。它的34万+Star生态、成熟的Gateway架构、丰富的Skills库，都是短期之内Hermes难以超越的护城河。

四、落地场景：谁更适合你的需求？

4.1 OpenClaw适合的场景

数据 sovereignty 要求高：金融、医疗、政务等行业，数据不能上云
需要丰富的第三方集成：3000+Skills覆盖几乎所有常见应用
追求模型灵活性：想在不同模型之间切换（Claude、GPT、DeepSeek等）
技术能力强：有Node.js运维经验，能够处理复杂配置

4.2 Claude Managed Agents适合的场景

快速上线：没有运维团队，想快速部署Agent能力
企业合规要求：需要Anthropic级别的安全和合规保障
规模化管理：需要管理大量企业用户和会话

4.3 Hermes Agent适合的场景

追求前沿体验：想体验”自我进化”的智能体
技术爱好者：愿意折腾，但预算有限
长周期任务：需要Agent在长期使用中不断学习和优化

五、2026展望：智能体赛道的三大趋势

5.1 从”对话框”到”数字员工”

AI智能体正在完成从”聊天工具”到”数字员工”的质变。不再是简单的问答，而是能够自主规划、执行复杂任务的智能助手。

OpenClaw的Gateway架构、Claude Managed Agents的托管编排、Hermes的自我进化——三条技术路线都在推动这一进程。

5.2 企业级市场加速爆发

Claude Managed Agents的推出，标志着AI智能体正式进入企业级市场的争夺战。$0.08/小时的价格，对于中型企业来说是可以接受的。

预计到2026年底，40%的大型企业将部署AI智能体，覆盖自动办公、代码开发、数据分析等场景。

5.3 开源与闭源的长期博弈

OpenClaw的开源路线和Claude Managed Agents的闭源路线，代表了两种不同的价值观。

开源的优势在于灵活性、透明度和社区驱动；闭源的优势在于稳定性、企业级支持和商业可持续性。两者将长期并存，而非简单的你死我活。

结语：选择比努力更重要

回到文章开头的问题：谁能真正定义数字员工时代？

答案或许不是某一个平台，而是整个智能体生态的成熟。OpenClaw、Claude Managed Agents、Hermes Agent，各有所长，各有适用场景。

对于企业来说，选择比努力更重要。根据自身的需求（数据安全要求、技术能力、预算规模、落地场景），选择最适合自己的平台，才是明智之举。

2026年，AI智能体元年已至。无论你选择哪条路，现在都是入场的最佳时机。

2026年4月18日

AI眼镜赛道爆发：华为、阿里、小米集体卡位，2026年智能穿戴新战场
巨头扎堆：华为、阿里、小米集体卡位

先看华为。4月13日，华为官方宣布AI眼镜将于4月20日正式发布，搭载鸿蒙操作系统，支持跨端协同和拍摄功能。鸿蒙生态的加持，意味着这款眼镜不只是单独的设备，而是华为全场景智慧生态的重要一环。

再看阿里。4月10日，千问AI眼镜S1已开启全渠道预约，4月15日现货发售。相比华为的产品，千问眼镜更侧重于AI交互能力，内置通义千问大模型，支持实时翻译、语音助手、智能问答等功能。

小米虽然尚未发布新品，但内部研发早已不是秘密。小米AI眼镜的传闻已经持续数月，据悉将深度整合小爱同学和米家智能生态。

百度的小度AI眼镜、理想汽车的理想AI眼镜……加上苹果首款智能眼镜进入密集测试阶段，整个赛道呈现出”全员备战”的态势。

市场规模：322%增长背后的爆发前夜

巨头们的集体入场并非盲目押注，而是基于对市场空间的清醒判断。

数据显示，2025年全球AI眼镜出货量达870万台，同比大增322%。其中，Meta凭借Ray-Ban智能眼镜占据85%的市场份额，是当之无愧的领导者。但这个数字意味着，AI眼镜已经走过了”概念验证”阶段，开始进入真正的商业化轨道。

中国市场的增速同样惊人。2025年中国智能眼镜市场出货量达246万台，同比增长87.1%。尽管绝对数量与全球市场相比仍有差距，但增速证明了国内消费者对这类产品的接受度正在快速提升。

业界普遍认为，2026年有望成为AI眼镜的关键转折点。目前市面上的主流产品大多属于”无显示”类型——它们能听、能说、能拍照，但无法在眼前”显示”信息。而”带显示”版本才是被普遍认为是”下一代计算平台”的产品形态。

从”无显示”到”带显示”：谁先突破？

“无显示”和”带显示”的区别，说白了就是：前者只是”听得见的助手”，后者是”看得见的助手”。

无显示眼镜的代表是Meta Ray-Ban智能眼镜。它可以听音乐、打电话、拍照、语音助手，但显示信息需要配合手机。这种设计的优点是体积轻巧、续航较长、价格相对亲民。

带显示眼镜则更进一步。它可以在镜片上叠加虚拟画面，实现导航、信息提示、翻译字幕等功能。苹果Vision Pro虽然功能强大，但体积和重量仍是问题。真正能像普通眼镜一样日常佩戴的带显示AI眼镜，目前尚未出现。

谁能在带显示版本上率先突破，谁就能占据下一个计算平台的入口。这也是为什么华为、小米、苹果等巨头都在这一方向上押下重注。

技术挑战：轻量化与功能性的平衡

AI眼镜的研发，面临着”既要又要”的矛盾。

既要轻便：眼镜是随身佩戴的物件，太重太厚都会影响佩戴体验，用户接受度会大幅下降。

又要有用：电池续航、散热、显示效果、音频质量、麦克风收音……每一项都不能有明显短板，否则就只是”噱头”而非”刚需”。

这两个目标的平衡，正是AI眼镜研发的核心难点。Meta Ray-Ban之所以能卖得好，正是因为它在轻便和功能性之间找到了一个合理的平衡点。

华为选择搭载鸿蒙系统，或许是想通过系统优化来提升效率，在有限的硬件条件下实现更好的体验。阿里则选择将通义千问大模型深度集成，发挥AI交互的优势。不同的技术路线，折射出不同厂商对用户需求的理解。

供应链暗战：核心元器件争夺白热化

巨头们的集体入场，让AI眼镜的供应链争夺日趋白热化。

Micro LED、光波导镜片、定制芯片……这些核心元器件正在成为抢手货。有消息称，部分厂商已经开始向供应链下单，预订2026年上半年的产能。

更重要的是，AI眼镜对芯片的功耗控制提出了更高要求。传统手机芯片的功耗动辄数瓦，而眼镜能承载的功耗可能只有几百毫瓦。芯片厂商正在为这一新场景研发专用解决方案。

在这场供应链暗战中，谁能抢先锁定优质供应商，谁就能在产品上市时间上占据先机。

应用场景：从尝鲜到刚需还有多远？

对于普通消费者而言，AI眼镜目前更多是”尝鲜”而非”刚需”。

目前最实用的场景包括：骑行时的导航和通话、烹饪时的语音食谱、旅行时的实时翻译……这些场景确实能带来便利，但并非”不可替代”。

真正能让AI眼镜成为刚需的，是”带显示”+强AI能力的结合。想象一下，走在街上，眼前实时浮现导航箭头；和外国人交流时，字幕自动出现在视野中；开会时，发言内容实时转写成文字……这些场景一旦成熟，AI眼镜的渗透率将大幅提升。

从”工具”到”平台”的跃迁，需要的不只是硬件突破，更需要杀手级应用的诞生。Meta押注的是AI社交，苹果押注的是空间计算，华为押注的是鸿蒙生态……不同的押注方向，将决定最终的市场格局。

写在最后：2026年，见证历史

2026年的AI眼镜赛道，像极了2019年的折叠屏手机——技术日趋成熟，玩家纷纷入局，消费者开始关注，但真正的爆发还在酝酿之中。

巨头们的集体卡位，供应链的加速布局，应用场景的持续拓展……这些信号都在指向同一个结论：AI眼镜不是一个”伪需求”，而是下一个计算平台的雏形。

当然，最终谁能胜出，现在还言之过早。但有一点可以确定：2026年的AI眼镜赛道，注定精彩纷呈。

相关阅读：
2026年4月17日
国产AI大模型全球崛起：DeepSeek V4即将发布、HappyHorse登顶全球视频榜
2026年4月，注定是国产AI发展史上值得铭记的一个月。就在全球目光聚焦GPT-6和Claude Opus 4.7的同时，国产大模型也在悄悄干着让硅谷有些紧张的事。

HappyHorse登顶全球视频榜：国产AI视频技术断层领先

4月15日，阿里ATH创新事业部研发的HappyHorse-1.0视频生成模型，在权威评测平台Artificial Analysis视频竞技场排行榜中登顶全球榜首。

这个成绩的分量有多重？HappyHorse以更高Elo分数压过了字节跳动的Seedance 2.0、Google的Veo 3 Fast等强劲对手——这两款产品一个是国内AI视频领域的头部玩家，一个是硅谷巨头的最新力作。能在这场正面交锋中胜出，意味着国产AI视频技术已经实现了断层式领先。

更值得关注的是，这不是PPT发布。HappyHorse目前已处于内测阶段，近期将开放API。对于开发者和创作者而言，这意味着又一款强大的国产视频生成工具即将进入实用阶段。

国产AI视频的崛起并非偶然。从阿里此前的Wan2.7-Video到字节的Seedance系列，国产厂商在视频生成领域持续深耕，在可控性、高清输出、长视频生成等关键能力上不断突破。HappyHorse的登顶，是多年技术积累的集中爆发。

DeepSeek V4确认4月下旬发布：万亿参数+全栈国产

如果说HappyHorse代表了国产在垂直领域的突破，那么DeepSeek V4则承载着国产大模型在通用能力上的野心。

4月13日，DeepSeek创始人梁文锋在内部沟通中正式确认，新一代旗舰模型V4将于2026年4月下旬全球发布。核心参数已经曝光：参数规模达万亿级，采用Ultra-MoE稀疏激活架构，但单次推理仅激活约130亿参数——性能拉满的同时，功耗控制得死死的。

最具里程碑意义的是全栈国产化适配。DeepSeek V4全程基于华为昇腾950PR芯片完成训练与推理，全面迁移至华为CANN框架，彻底摆脱了对英伟达CUDA生态的依赖。这是全球首款完全基于国产芯片训练优化的万亿级旗舰大模型。

训练成本的对比更加震撼：DeepSeek V4的训练成本仅为520万美元，是GPT-4的1/20。高性价比+完全自主可控，这正是DeepSeek一贯的技术路线。

上下文窗口扩展至256K Token，是V3的两倍；推理速度提升35倍，能耗降低40%。这些数字背后，是国产团队在算法优化和硬件适配上的双重突破。

中国AI大模型周调用量连续五周超越美国

Hard数据背后，是实际使用量的支撑。

根据OpenRouter最新周度数据，全球AI大模型周调用量达到27万亿Token，环比增长18.9%。其中，中国AI大模型的周调用量突破12.96万亿Token，环比暴涨31.48%，连续第五周超越美国（3.03万亿Token），领先优势扩大至4.27倍。

更让市场意外的是，在全球最热门的开源AI智能体Hermes Agent调用量排行中，前三名全是中国的模型。这意味着全球开发者和用户正在用脚投票，选择中国的AI服务。

阿里通义千问Qwen3.6 Plus以4.6万亿Token登顶全球榜首，全球调用量前六名被中国模型包揽。这一格局的形成，标志着国产大模型已经获得了全球市场的认可。

国产算力闭环：华为昇腾910B跑通GLM-5.1

大模型的能力突破，离不开底层算力的支撑。

智谱发布的GLM-5.1旗舰模型同样传来好消息：在SWE-bench Pro基准测试中，GLM-5.1取得58.4分，超越Claude Opus 4.6（57.3分）和GPT-5.4（57.7分）。该模型可连续工作8小时自主完成软件工程任务，全程无需人类介入。

更重要的是，GLM-5.1完全基于华为昇腾910B芯片训练，未使用任何英伟达GPU。国产算力+国产模型完整闭环首次跑通，这意味着什么？

意味着即使在极端情况下失去外部芯片供应，国产大模型的研发和生产不会受到根本性影响。芯片这个”卡脖子”的问题，正在被一步步攻克。

数据显示，智谱API价格一季度累计上涨83%，但调用量却暴涨400%，完成从”聊天玩具”到”生产力引擎”的跃迁。用户愿意为真正的价值付费，这才是技术实力的最好证明。

华为新一代算力芯片：性能达英伟达H20的2.87倍

底层硬件层面，国产芯片也在加速追赶。

华为发布的新一代高性能算力芯片，经权威机构实测，AI计算性能达到英伟达H20的2.87倍。该芯片在FP4低精度推理场景中优势显著，能耗较同类产品降低超30%，可有效支撑金融风控、医疗影像分析、智能制造等高负载场景。

赛迪研究院预测，2026年我国智能算力占比将突破35%。在高端算力芯片90%依赖进口的背景下，华为新一代芯片的发布，标志着国产AI芯片的重要突破。中国AI产业正在摆脱对单一算力路径的依赖。

写在最后：国产AI的底气从何而来

写到这里，可能有人要问：国产大模型和GPT系列相比，到底谁更强？

这个问题本身就值得商榷。AI竞争不是零和游戏。GPT-6强不强？强。但它服务的是全球市场，用的是美元定价，对中国开发者有使用门槛。国产大模型行不行？行。中文理解更好、成本更低、本地化服务更贴心，更重要的是——完全自主可控。

从DeepSeek V4的全栈国产化，到HappyHorse登顶全球视频榜，再到国产大模型连续五周超越美国的调用量——这些不是PPT上的数字，是几百万开发者和用户用实际行动投票的结果。

2026年的国产AI，值得认真看一眼。

相关阅读：
2026年4月17日
GPT-6正式发布：参数量达5-6万亿、支持200万Token上下文，性能提升40%
2026年4月14日，OpenAI正式发布了代号”Spud（土豆）”的新一代旗舰模型GPT-6。这个代号据说源于研究团队在得克萨斯州Stargate数据中心连续数月靠土豆泥续命的趣闻——一个耗资超20亿美元、参数5-6万亿的超级工程，代号却朴素到近乎自嘲。

核心参数：从”能用”到”无限”的跨越

GPT-6的核心参数确实令人震撼。

参数量达到5-6万亿，采用混合专家（MoE）架构设计。这意味着模型虽然庞大，但通过稀疏激活机制，实际推理时只调用部分专家网络，在性能和成本之间取得了精妙的平衡。

更令人惊叹的是200万Token的上下文窗口支持。什么概念？这相当于能一口气读完两部《三体》全集，或者同时处理一个中型代码仓库的所有历史版本。这意味着GPT-6在处理长文档理解、复杂代码库分析、多轮对话一致性等场景时，将拥有前所未有的能力。

官方数据显示，GPT-6在代码编写、推理分析、智能体任务上的性能较GPT-5.4提升约40%。这个幅度的提升，放在大模型迭代史上都属于重量级。

技术架构：Symphony架构的融合美学

GPT-6采用了全新的Symphony架构设计，这是OpenAI在架构层面的又一次创新。

Symphony架构的核心特点在于”原生多模态统一”。不同于上一代模型需要多个专用模块分别处理文本、图像、音频，GPT-6从底层设计就实现了多模态的原生融合。文本生成、图像理解、声音处理不再是被”拼接”在一起的功能，而是真正在同一个语义空间中进行协同。

据透露，Symphony架构采用了层次化注意力机制，能够高效处理超长序列的同时保持对关键信息的精准捕捉。这正是支撑200万Token超长上下文的底层技术基础。

定价策略：略涨但仍有竞争力

GPT-6的定价延续了OpenAI一贯的风格——不便宜，但比Claude Opus系列亲民得多。

输入$2.5/MTok，与GPT-5.4持平；输出$12/MTok，比GPT-5.4微涨$2。在闭源旗舰阵营中，这个价格有一定竞争力，但远不是最便宜的选择。相比之下，Claude Opus 4.7的输入$5/MTok、输出$25/MTok，足足贵了一倍多。

当然，最终的价格竞争力还要看实际表现。GPT-6能否在4月14日发布后，从Claude Opus 4.7手中夺回综合第一的位置？LMArena排行榜上，Opus 4.6已经稳坐了两个月的王座，这场龙虎斗才刚刚开始。

API开放时间：6月见分晓

尽管发布会引发轰动，但普通开发者还需要耐心等待。官方透露，GPT-6的API预计要到6月才向公众开放。这意味着：

第一，GPT-6发布后的两个月内，主要是OpenAI的合作伙伴和企业用户在测试和适配；
第二，真正的开放API竞争将在6月展开，届时各家的定价策略、实际性能对比都将更加清晰；
第三，对于国内开发者而言，API访问的政策和可用性仍是未知数。

内部定位：AGI的最后一公里

一个值得玩味的细节是，OpenAI内部将GPT-6定位为”AGI的最后一公里”。

这一定位的含义可以从几个层面理解：首先，从技术能力上看，GPT-6在代码、推理、Agent任务上的大幅提升，意味着AI已经能够在相当程度上”自主完成复杂任务”；其次，从架构设计上看，200万Token的上下文窗口让AI能够”记住”更多、更长的任务信息；最后，从应用场景上看，GPT-6有望在软件工程、科学研究、复杂决策等领域实现真正的”AI代理”能力。

当然，”AGI”这个词汇在行业内始终存在争议。但无可否认的是，GPT-6代表了大模型发展的一个新高度。

训练投入：20亿美元与10万张H100

GPT-6的研发投入同样令人咋舌。

OpenAI透露，GPT-6的预训练于3月17日完成，整个研发周期历时18个月。训练过程中，动用了约10万张H100 GPU，总耗资超过20亿美元。这个数字意味着什么？

作为对比，OpenAI此前完成1220亿美元融资，其中相当一部分正是用于GPT-6的研发。大规模资本投入+顶尖硬件配置+长期研发周期，共同铸就了这款被寄予厚望的旗舰产品。

竞争格局：GPT-6 vs Claude Opus 4.7

GPT-6发布后，最直接的竞争对手当属Anthropic的Claude Opus 4.7。

从已知信息来看，两款旗舰模型各有侧重：GPT-6的优势在于超长上下文和多模态原生融合，以及相对更亲民的定价；Claude Opus 4.7则在编程能力的第三方测试中表现更为稳定，视觉理解方面的突破也更为显著。

真正的较量将在API开放后展开。届时，开发者社区会用自己的实测数据给出答案。

写在最后

GPT-6的发布，标志着大模型竞争正式进入”万亿参数+百万Token”的新阶段。这个阶段的竞争，已经不仅仅是参数规模的堆砌，更是对架构创新、训练效率、推理成本的全方位考验。

对于整个AI行业而言，GPT-6的发布是一个重要的节点。它预示着AI能力的边界正在被进一步拓展，也为接下来半年的技术竞争设定了新的基准线。

至于能否真的成为”AGI最后一公里”，时间会给出答案。

相关阅读：
2026年4月17日
Claude Opus 4.7发布：视觉识别准确率跃升至98.5%，编程效率提升3倍
2026年4月16日，Anthropic正式发布了新一代旗舰大模型Claude Opus 4.7。从官方公布的数据来看，这次更新的力度远超市场预期——视觉识别准确率从54.5%飙升至98.5%，生产代码任务完成量是上代的3倍，编码评估解决率整体提升13%。这款被业界视为”AGI最后冲刺”的新模型，究竟带来了哪些突破？

视觉能力：从”能看”到”看懂”的质变

如果要从Opus 4.7的诸多升级中挑选最亮眼的一项，视觉能力的飞跃当之无愧。

Anthropic在官方公告中专门提到了XBOW视觉敏锐度基准测试。Opus 4.6在这项测试中的得分是54.5%，而到了Opus 4.7，这一数字直接跳到了98.5%。这个提升幅度，放在AI模型的迭代历史里都算得上罕见。

从具体能力来看，Opus 4.7支持最高约375万像素的图像输入，长边最长可达2576像素，是上一代的3倍以上。这意味着什么？如果你给它一张密密麻麻的复杂截图，或者一张包含大量数字的财务报表，它不仅能看清每一个细节，还能准确提取和理解其中的信息。

对于需要处理设计稿、产品原型、复杂文档的用户来说，这一次升级几乎等于打开了一扇新门。设计师可以直接上传整张设计稿询问布局问题，产品经理能够一键解析原型图的结构逻辑，财务人员可以快速提取报表中的关键数据。

编程能力：从”辅助工具”到”代码伙伴”

另一个让开发者兴奋不已的突破，是Opus 4.7在软件工程方向的全面提升。

官方给出的测试数据极具说服力：在CursorBench测试中，Opus 4.7的得分从58%提升到70%，进步了12个百分点；在Rakuten-SWE-Bench测试中，它完成的生产任务数量是Opus 4.6的3倍；在涵盖93项编码任务的综合基准中，解决率提升了13%，其中有4项任务是Opus 4.6和Sonnet 4.6都无法完成的，这次被成功攻克。

Anthropic在公告中用一个案例来说明Opus 4.7的能力上限：它自主构建了一个完整的Rust语言文字转语音引擎，包含神经网络模型、SIMD内核优化，还配了一个可以运行在浏览器里的演示程序，最后用语音识别器自己验证输出结果是否正确。公司评价称，这相当于一位高级工程师几个月的工作量。

当然，这类描述在AI公司的发布稿中并不罕见，实际使用效果因人而异。但从第三方测试数据来看，Opus 4.7的编程能力确实迈上了一个新台阶。

指令遵循：更严格带来的”甜蜜烦恼”

Opus 4.7在指令遵循方面也有显著改善。简单来说，用户说什么，模型就做什么，不会自作主张地跳过步骤或宽松解释意图。

但这里有一个需要留意的地方：Anthropic专门在发布文档中提醒用户，之前针对Opus 4.6编写的提示词，在4.7上可能会产生意想不到的结果。原因正是指令遵循更严格了——旧版本会灵活变通甚至忽略的指令，新版本会一字不差地执行，反而可能导致输出与预期不符。如果开发者正在使用API，切换到4.7之前最好重新检查和调整一下提示词。

这个”副作用”看似麻烦，实际上反映的是Anthropic对模型可控性的极致追求。更严格的指令遵循，意味着AI的行为更加可预测，更适合在对准确性要求严苛的生产环境中部署。

记忆能力：长任务终于”靠得住”

在多会话的长期工作场景中，Opus 4.7的记忆能力也得到了实质性改进。它更擅长利用基于文件系统的记忆机制，能在跨越多次对话的长时间工作中记住关键信息，下次启动任务时不需要重新交代大量背景。

这对于需要AI持续参与的项目型工作尤为实用。比如一个持续推进几周的代码项目，或者需要多次迭代的长篇文档撰写工作，每次重新打开对话时，不必再把上下文背景重新粘贴一遍，AI已经自动”记住”了。

Claude Code同步升级：新增代码超级审查

与Opus 4.7同步发布的，还有一系列Claude Code（面向开发者的编程工具）更新。

最引人注目的是新增的”/ultrareview”指令。开启这个模式后，Claude会以”专业代码审查员”的视角通读整个代码改动，标记出技术审核人员会关注的问题，而不仅仅是表面的语法错误或风格问题。Pro版和Max版用户每月可以免费使用3次。

此外，之前只对团队版和企业版用户开放的”自动模式”（Auto模式），这次正式向Max订阅用户开放。在这个模式下，Claude可以自主做出更多决策，减少频繁打断用户确认的次数，同时比完全跳过权限控制的模式更加安全可控。

安全机制：Project Glasswing的首款落地产品

Opus 4.7是”Project Glasswing”计划下第一款应用新网络安全保障措施的模型。训练过程中，Anthropic专门尝试削弱模型在网络攻击方向的能力，同时部署了自动检测高风险网络安全请求的拦截机制。

如果是有合法需求的安全专业人员，可以通过新推出的”Cyber Verification Program”（网络安全验证计划）申请使用相关功能，绕过部分限制。

这一机制背后折射出一个现实：随着AI模型能力越来越强，如何防止它被用于网络攻击，已经成为主流AI公司必须面对的课题。Anthropic选择了一种更为审慎的路径——既保证模型能力的领先，又为高风险能力设置了专门的”阀门”。

定价：维持不变，但分词器有变化

对于开发者来说，一个好消息是：Opus 4.7的定价与上代完全相同——输入每百万token收费5美元，输出每百万token收费25美元。

但有一个需要留意的变化：Opus 4.7换用了新的分词器，相同内容可能比之前消耗更多token，大约是原来的1.0到1.35倍。换句话说，名义上价格没变，但实际上同样的任务可能会花更多钱。Anthropic建议用户在实际流量中测量差异，并通过调整”effort”参数和任务预算来控制成本。

目前，Claude Opus 4.7可以通过Claude的所有产品线使用，也支持Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry等云平台的API接入。

写在最后

Anthropic这次的发布时间点耐人寻味——就在谷歌、OpenAI都在加速发布新版本的当口，Opus 4.7选择了悄悄亮相，但用硬核数据说话。视觉能力近乎翻倍式的提升，加上编程任务3倍的效率增长，让它在当前这批主流模型中稳稳站住了旗舰级的位置。

对于开发者而言，这或许意味着一个全新的编程范式正在到来——当AI不仅能写代码，还能看懂设计稿、理解复杂图表、自主完成代码审查时，”AI编程助手”这个概念本身，正在被重新定义。

相关阅读：
2026年4月17日

作者： admin

一、机器人跑马拉松：看似简单实则艰难

为什么是21公里？

宇树H1：10米/秒的速度担当

二、70支队伍背后的产业生态

赛队构成：从头部企业到科研院所

技术路线：百家争鸣

三、赛事设置的深层意义

自主导航组：具身智能的真正考验

双组别设置：兼顾竞技与展示

四、具身智能：从实验室到真实场景

为什么马拉松重要？

从实验室到落地：具身智能的产业化之路

五、技术瓶颈与突破方向

当前的核心挑战

突破方向展望

六、机器人马拉松的意义：超越比赛本身

推动技术进步

促进产业协同

普及公众认知

结语

相关阅读

一、2.7%差距背后：一部中国AI三年逆袭史

性能跃升：从望尘莫及到毫厘之间

产业爆发：应用落地全面领跑

科研创新：论文专利全球领先

二、全球AI机构格局：中国军团强势崛起

机构排名历史性突破

开源生态“东移”趋势

三、实力对比：全方位透视中美AI

技术维度

产业维度

生态维度

四、正视差距：2.7%之外的三大挑战

高端芯片差距

基础研究积累

人才储备厚度

五、未来展望：2.7%之后的三大方向

性能全面反超

技术原创引领

全球生态主导

结语

相关阅读

一、价格狂飙：算力进入稀缺时代

1.1 全球GPU涨价潮

1.2 供需撕裂：需求爆发，供给受限

二、资本狂潮：千亿资金押注算力

2.1 全球AI资本支出：7250亿美元

2.2 AI企业融资：Anthropic 300亿美元

2.3 微软：算力版图持续扩张

三、产业链解析：钱流向哪里？

3.1 芯片：英伟达的垄断与挑战

3.2 存储：HBM价格暴涨5倍

3.3 基础设施：电力成为新瓶颈

四、商业模式重构：从”卖算力”到”卖Token”

4.1 新旧模式对比

4.2 企业业绩爆发

4.3 行业格局重塑

五、投资机遇：结构性行情下的机会

5.1 算力产业链全景图

5.2 国产替代：算力自主可控

5.3 风险提示

结语：算力，AI时代的核心资产

一、颠覆时刻：AI如何重塑药物研发

1.1 从”十年磨一药”到”数月出成果”

1.2 从”单点优化”到”全局设计”

1.3 AI制药的技术演进

二、里程碑事件：AI制药进入临床元年

2.1 全球首个AI全流程药物临床试验

2.2 英矽智能：从中国走向全球

2.3 晶泰科技：AI+量子物理的结合

三、技术突破：AI制药的核心能力

3.1 蛋白质结构预测：从AlphaFold到AlphaFold3

3.2 生成式AI：从”找药”到”造药”

3.3 多智能体：从”单兵作战”到”军团协作”

四、市场格局：AI制药的万亿赛道

4.1 全球AI制药市场规模

4.2 中国AI制药：快速崛起的第二极

4.3 资本涌入：AI制药融资再创新高

五、挑战与展望