作者: admin

  • 人形机器人半程马拉松4月19日北京开赛:70支队伍同场竞技,具身智能运动能力迎来实战检验

    人形机器人半程马拉松4月19日北京开赛:70支队伍同场竞技,具身智能运动能力迎来实战检验

    一、机器人跑马拉松:看似简单实则艰难

    为什么是21公里?

    半程马拉松的21.0975公里,对人类跑者而言已是极限挑战,对机器人来说更是难上加难。

    首先是人形机器人与传统机器人的本质区别。传统工业机械臂固定在工位上工作,运行环境高度可控;而人形机器人需要面对复杂多变的真实环境——不平整的路面、随时出现的障碍物、忽高忽低的地形变化。这些在工厂里不存在的挑战,在马拉松赛道上比比皆是。

    其次是能耗管理的难题。人类跑者可以在途中补充能量,但机器人只能依靠自带电池完成全程。如何在保证动力输出的同时优化能耗,如何在电量告急时做出最优决策,都是机器人需要解决的难题。

    更关键的是运动控制的稳定性。人形双足行走本身就是机器人领域的皇冠难题,需要在毫秒级别内完成姿态调整、步态规划、平衡控制。一个微小的失误——踩到石子、踏空台阶、失去平衡——都可能导致机器人摔倒,而一旦摔倒,在没有外力帮助下自主站起继续奔跑,目前仍是行业难题。

    人形机器人运动控制四大核心模块:双足行走、环境感知、能耗管理、运动规划

    宇树H1:10米/秒的速度担当

    在已公布的参赛阵容中,宇树科技的人形机器人H1备受瞩目。这款机器人曾在测试中创下百米跑10米/秒的惊人速度,刷新了人形机器人的世界纪录。

    宇树H1的核心技术亮点在于其全尺寸人形纯电驱设计。整机运动能力可达360°/s,关节扭矩密度为130N·m/kg,最大关节扭矩可达360N·m,爆发力强、响应速度快。这些参数意味着H1不仅能快速奔跑,还能在突发情况下迅速做出姿态调整。

    更值得关注的是H1的自主避障能力。通过深度相机和激光雷达的融合感知,H1能够实时构建周围环境的三维地图,在发现障碍物时自动规划绕行路径。这意味着在马拉松赛道上,H1有更大的机会在复杂地形中安全通过。

    二、70支队伍背后的产业生态

    赛队构成:从头部企业到科研院所

    本届马拉松的70余支参赛队伍,呈现出多元化的特点:

    头部企业:宇树科技、智元机器人、傅利叶智能、星动纪元等国内头部机器人企业悉数参赛。这些企业拥有成熟的研发团队和完整的技术链条,其参赛机器人代表了国内人形机器人的最高水平。

    科研院所:清华大学、北京理工大学、上海交通大学等高校团队也携自研机器人参赛。这些团队往往在某一细分技术上有独到见解,如双足行走算法、环境感知融合等。

    创新企业:一些初创公司同样跃跃欲试,希望借助马拉松舞台展示自己的技术实力。对于这些企业而言,这不仅是技术验证的机会,更是品牌曝光的绝佳窗口。

    国际选手:据组委会透露,本届赛事还邀请了来自美国、日本、韩国的机器人团队参赛,这使得北京亦庄马拉松真正成为了一场全球性的机器人竞技盛会。

    技术路线:百家争鸣

    参赛队伍的技术路线呈现出明显的差异化:

    在驱动方式上,有的采用电机驱动,有的尝试液压驱动,还有的探索电液混合方案。不同技术路线各有优劣:电机驱动响应快、控制精度高,但爆发力相对有限;液压驱动爆发力强,但系统复杂、维护困难。

    在感知方案上,有的依赖视觉主导,有的采用激光雷达为主,还有的强调多传感器融合。不同的感知策略决定了机器人对复杂环境的适应能力。

    在AI大脑上,有的采用端侧AI芯片实现本地决策,有的通过5G网络实现云端协同,还有的探索边云协同的混合架构。AI能力的差异直接决定了机器人的自主性水平。

    三、赛事设置的深层意义

    自主导航组:具身智能的真正考验

    本届赛事最大的创新在于设立了自主导航组,约占参赛队伍的40%。与遥控组由人类操作员实时控制不同,自主导航组的机器人需要完全依靠自身能力完成比赛。

    这意味着机器人需要具备:

    环境感知能力:通过摄像头、激光雷达、IMU等多种传感器,实时感知赛道环境,识别道路边界、障碍物、地形变化。

    路径规划能力:在感知的基础上,快速计算最优行走路径,避开障碍,选择最适合的地形通过。

    运动控制能力:根据地形变化实时调整步态,保持平衡,稳定前进。这需要在毫秒级别内完成从感知到决策再到执行的闭环。

    故障恢复能力:一旦摔倒或遇到意外,机器人需要自主判断情况,尝试重新站起继续前进。

    这些能力,正是具身智能的核心所在。与简单的对话助手、图像生成不同,具身智能要求AI能够理解物理世界、在真实环境中执行动作。这不仅是技术问题,更是认知问题——机器人需要像人类一样,理解“走在什么样的地面上”“怎样跨越这个台阶”“如何避免踩空”。

    双组别设置:兼顾竞技与展示

    赛事设置自主导航与遥控双组别,体现了赛事组织者的务实考量。

    遥控组的存在,让更多技术尚不成熟的企业和研究团队能够参与进来,展示自己的成果。这有助于扩大赛事影响力,推动更多力量投入到具身智能的研发中。

    同时,自主导航组的设置,保证了赛事的专业性和竞技性。那些真正具备自主能力的机器人,将在激烈竞争中脱颖而出,证明自己的技术实力。

    四、具身智能:从实验室到真实场景

    为什么马拉松重要?

    人形机器人跑马拉松,本质上是一次大规模的真实场景测试。

    在实验室里,研究人员可以在受控环境中测试机器人的各项能力;但再精确的模拟,也无法完全复现真实世界的复杂性。赛道上的一块小石子、地面的一条裂缝、意想不到的光线变化——这些在实验室里难以模拟的干扰因素,在马拉松赛道上都会真实出现。

    通过马拉松,研发团队能够发现机器人从未暴露的弱点,找到改进的方向。更重要的是,这种实地的、长时间的、压力测试,能够验证机器人的稳定性和可靠性——这正是具身智能能否真正落地应用的关键。

    从实验室到落地:具身智能的产业化之路

    马拉松赛事的背后,是具身智能产业化的加速推进。

    在工业领域,具身智能正在改变生产制造的方式。以智元机器人为例,其发布的全系列具身智能产品已覆盖工业、家庭、医疗等多个场景。在汽车总装线上,智元的机器人能够完成复杂的装配任务,精度达到0.01mm;在3C产品生产线上,换型时间缩短80%,大大提升了生产效率。

    在服务领域,具身智能同样展现出巨大潜力。普渡机器人近日启用了全球首个商用服务机器人体验中心,围绕餐饮、酒店、工业、零售等场景构建了可触摸、可互动的沉浸式应用环境。这是服务机器人从产品销售向体验经济转型的标志。

    在家用领域,虽然完全自主的家务机器人仍较遥远,但辅助型机器人已经开始进入家庭。助老助残机器人、陪伴机器人、教育机器人——这些产品形态虽然还不完美,但代表着具身智能走向日常生活的方向。

    五、技术瓶颈与突破方向

    当前的核心挑战

    尽管进步显著,人形机器人要真正走进千家万户,仍面临诸多挑战:

    运动控制的精细化:当前的人形机器人在平坦地面上行走已相对稳定,但在复杂地形——楼梯、斜坡、泥泞地面、狭窄空间——的表现仍有待提升。尤其是在长时间运动后的疲劳累积、状态漂移问题,目前尚未很好解决。

    能耗与续航:21公里的马拉松对机器人续航是极大考验。高性能电机、高算力芯片都是耗电大户,如何在保证性能的同时优化能耗,是所有参赛队伍面临的共同难题。

    自主决策的可靠性:在真实环境中,机器人需要处理各种预料之外的情况。当传感器失效、当判断失误、当意外发生,机器人能否做出正确反应?这种“边缘情况”的处理能力,目前仍是具身智能的短板。

    成本控制:高端人形机器人的成本仍然高昂,宇树H1售价约几十万元,大多数家庭难以承受。成本的大幅下降,是具身智能普及的前提条件。

    突破方向展望

    针对这些挑战,业界正在多个方向寻求突破:

    VLA模型:视觉-语言-动作(Vision-Language-Action)模型的发展,让机器人能够像人类一样理解指令、感知环境、执行动作。通过海量数据训练,VLA模型能够将视觉感知、语言理解与运动控制有机结合,提升机器人在复杂环境中的适应能力。

    端侧AI芯片:轻量级端侧推理芯片的发展,让机器人在边缘侧实时处理物理反馈成为可能。在功耗低于10W的情况下实现30Tops以上的算力,为机器人的本地化智能提供了硬件基础。

    多模态感知融合:整合视觉、触觉、力觉等多种感知方式,让机器人能够更全面地理解环境。单纯依靠视觉的方案在光线变化、遮挡等情况下表现受限,而多模态融合能够大幅提升感知的鲁棒性。

    强化学习:通过强化学习,机器人能够从无数次模拟和真实尝试中自主学习最优策略。这种数据驱动的方法,有望弥补传统控制方法在应对复杂场景时的不足。

    六、机器人马拉松的意义:超越比赛本身

    推动技术进步

    机器人马拉松的首要意义,在于推动技术进步。赛事设置了明确的目标——让机器人在21公里赛道上安全、稳定、快速地完成比赛——这为技术研发提供了清晰的方向。

    参赛队伍为了赢得比赛,会全力以赴研发新技术、验证新方案。这些研发投入,最终会转化为行业的技术进步。即使没有获胜的队伍,也能在比赛中发现自身短板,明确改进方向。

    促进产业协同

    马拉松赛事还为产业链上下游提供了交流合作的平台。机器人企业、芯片厂商、传感器供应商、AI算法公司、软件开发商——各方力量在赛事中汇聚,碰撞出合作的火花。

    有企业负责人表示,参加马拉松不仅是为了比赛,更是为了与同行交流、与供应商对接、了解行业最新动态。这种非正式的交流,往往能带来意想不到的合作机会。

    普及公众认知

    更重要的是,机器人马拉松向公众展示了具身智能的发展现状。

    对于大多数人而言,机器人仍停留在科幻电影中的印象——要么是超能陆战队里的大白,要么是终结者里的T-800。真实的具身智能发展到什么程度?还有多远要走?这些问题,大多数人并不了解。

    通过马拉松直播、媒体报道、线下观赛,公众能够直观地看到机器人的能力边界:它能做什么?不能做什么?困难在哪里?进步有多快?这种认知的普及,对于推动社会接受具身智能产品、为产业发展营造良好环境,都具有重要意义。

    结语

    4月19日的北京亦庄,70余支人形机器人赛队即将用21公里的奔跑,回答一个关乎未来的问题:具身智能,距离真正改变我们的生活还有多远?

    这不是一场简单的比赛,而是具身智能产业的一次集体亮相。从顶尖企业到科研院所,从成熟方案到创新探索,这场赛事汇聚了中国具身智能的力量,也折射出行业的现状与方向。

    无论最终谁能夺冠,这场马拉松的意义都已超越比赛本身。它是一次技术检验,一次产业协同,一次公众科普,更是中国具身智能发展历程中值得铭记的里程碑。

    当机器人真正能够稳定、自如地在复杂环境中行走、奔跑、作业,我们有理由相信,一个真正的人机共存时代正在加速到来。

    相关阅读

  • 斯坦福2026AI指数报告发布:中美AI差距仅剩2.7%,中国全面反包美国

    斯坦福2026AI指数报告发布:中美AI差距仅剩2.7%,中国全面反包美国

    一、2.7%差距背后:一部中国AI三年逆袭史

    性能跃升:从望尘莫及到毫厘之间

    斯坦福报告的核心数据揭示了中美AI实力的根本性逆转。截至2026年3月,美国顶尖模型Claude Opus 4.6的Elo评分为1503分,而中国顶尖模型Dola-Seed 2.0 Preview得分1464分,两者差距仅39分,折合百分比仅为2.7%。

    这一数字的背后,是中国AI三年来的跨越式发展轨迹:

    2023年:中美顶级模型在MMLU、MATH、HumanEval等核心基准测试中,差距高达17.5至31.6个百分点。那时,国产大模型还在为“接近GPT-4水平”而努力。

    2024年底:差距迅速缩小至0.3至3.7个百分点。中国模型开始在全球评测榜单上崭露头角,但美国仍保持着明显的领先优势。

    2025年2月:DeepSeek-R1横空出世,首次在多项测试中与美国头部模型打平,震惊业界。

    2026年3月:阿里Qwen3.5-Max在全球盲测中以1464分超越GPT-5.4,位列全球第五。在Arena排行榜上,中美模型反复换位、轮流领跑已成常态。

    在细分领域,中国模型已实现全面领先。阿里Qwen3.5在τ-bench测试中以68.4%的任务成功率位列全球第三,MMLU-Pro测试准确率达87.8%,媲美Gemini 3.1 Pro和Claude Opus 4.6。DeepSeek-V3.2周调用量突破1.02万亿Token,跻身全球前六。

    中美AI实力多维度对比数据图表

    产业爆发:应用落地全面领跑

    中国AI的优势不仅体现在模型性能上,更体现在产业应用的广度和深度上。

    2026年3月,中国大模型周调用量达4.69万亿Token,同比增长320%,连续两周超过美国的4.21万亿。更令人瞩目的是,字节豆包月活用户突破3.15亿,阿里千问MAU达2.03亿,增速552%,位居全球第一。

    在工业领域,中国工业机器人装机量占全球54%,AI与制造业深度融合,智能工厂、柔性生产已成为常态。智能工厂的良品率提升25%、生产效率提升40%、能耗降低18%,2026年工业AI渗透率超过55%,而美国仅为32%。

    在民生领域,AI政务、AI教育、AI医疗、AI交通全面普及。中国AI渗透率达88%,远超全球平均水平。从“AI陪伴机器人”守护独居老人,到无人值守便民服务站全面铺开,科技正以最接地气的方式改变着每个人的生活。

    科研创新:论文专利全球领先

    中国在AI科研产出上同样展现出强劲实力。报告显示,中国AI论文发表数量、引用频次、专利产出总量均位居世界第一。

    2025年,中国AI相关学术论文占全球总量的41%,高被引论文数量超越美国;AI专利申请量占全球45%,连续五年位居首位。清华、北大、浙大等高校,与阿里、字节、DeepSeek等企业联动,形成了“产学研”一体化创新体系。

    在全球AI开源生态中,中国同样占据主导地位。中国开源模型数量、开发者活跃度、社区贡献度均超越美国,成为全球AI开源的核心引擎。自Gemma初代发布以来,系列累计下载量超过4亿次,社区衍生版本超过10万个——而中国开发者贡献了其中相当大比例。

    二、全球AI机构格局:中国军团强势崛起

    机构排名历史性突破

    斯坦福报告显示,在全球前20大AI机构排名中,中国占据11家,美国9家,中国首次在这项数据上超越美国。这一历史性突破,标志着中国AI整体实力的跃升。

    从具体排名来看:

    • 阿里:以11个重要模型位列全球第三,仅次于OpenAI的19个和Google的12个
    • DeepSeek:凭借V3.2等明星模型跻身全球前十
    • MiniMax:开源M2.7引爆全球开发者社区
    • 智谱AI:GLM-5.1编程能力首超GPT-5.4
    • 字节跳动:豆包日均Token使用量突破120万亿

    这意味着,在全球AI”六强争霸”的格局中,中国已占据两席——DeepSeek和阿里巴巴,与OpenAI、Google、Anthropic、xAI同台竞技。

    开源生态“东移”趋势

    开源社区的格局变化同样值得关注。中国开源模型不仅在国内普及,更横扫硅谷,成为海外企业的“性价比之选”。

    OpenRouter数据显示,国产大模型的海外开发者占比高达47%,中国本土开发者仅占6%。Shopify切换至Qwen后,每年节省500万美元;爱彼迎联创公开称赞其“又好又快又便宜”。

    智谱GLM的定价更是令业界震动——再度提价10%后,国产大模型首次在核心场景实现与海外头部厂商的价格对齐。一年前,国产大模型厂商还在以降价90%以上争夺市场份额;如今,定价逻辑已从“降价换市场”转向“性能锚定价格”。

    三、实力对比:全方位透视中美AI

    技术维度

    指标美国中国态势
    顶级模型性能1503分1464分差距2.7%
    开源模型数量约40%约45%中国领先
    AI论文发表量约35%41%中国领先
    AI专利申请量约38%45%中国领先
    高被引论文数落后领先中国领先

    产业维度

    指标美国中国态势
    工业机器人装机量占比约17%54%中国领先
    AI渗透率约45%88%中国领先
    大模型周调用量4.21万亿4.69万亿中国领先
    AI企业应用采用率50%55%中国领先
    AI产业规模全球第二全球第一中国领先

    生态维度

    指标美国中国态势
    全球AI机构Top20数量9家11家中国领先
    开源模型海外开发者占比约40%47%中国领先
    顶级AI科学家数量约50%约35%美国领先
    AI芯片自主化率约85%约38%美国领先

    四、正视差距:2.7%之外的三大挑战

    尽管成绩斐然,斯坦福报告同样客观指出了中国AI发展面临的三大挑战:

    高端芯片差距

    尽管昇腾芯片实现突破,但英伟达H100、H200仍领先1-2代,高端GPU全球垄断格局未破。中国AI芯片在工艺、性能、生态上仍有差距,高端算力依赖进口的局面尚未完全扭转。

    截至2026年,全球顶尖AI科学家中,美国仍占50%以上;基础研究、原创算法方面,美国仍保持着一定的优势。

    基础研究积累

    大模型架构、注意力机制、训练方法等底层创新,目前仍主要来自美国科技巨头。中国在“从0到1”的原创突破上,仍需持续投入。

    人才储备厚度

    高端AI人才的数量和质量,直接决定着AI发展的后劲。虽然中国每年培养大量AI专业毕业生,但在顶尖人才占比上,与美国仍有差距。

    五、未来展望:2.7%之后的三大方向

    性能全面反超

    中国模型迭代速度领先美国1.5倍,2026年Q3-Q4,字节、阿里、DeepSeek将发布新一代旗舰模型。依托端云协同、稀疏计算、多模态融合技术,有望全面超越美国顶尖模型,2.7%的差距将彻底逆转。

    技术原创引领

    2026年中国聚焦AI Agent、具身智能、神经符号融合三大方向,已有12项原创技术进入全球前列。未来三年,将在芯片、框架、算法三大底层实现突破,国产AI芯片自主化率有望达到38%。

    全球生态主导

    中国开源模型已成为全球主流,2026-2027年将推进”AI全球普惠计划”,向发展中国家开放技术、共享生态。依托”一带一路”,中国AI标准、技术、应用将走向全球,构建”中国研发、全球应用”的新体系。

    结语

    2.7%的差距,既是过去努力的成果,更是未来冲刺的起点。

    这份斯坦福报告,用最权威的数据印证了一个事实:中国AI不再是“追赶者”,而是“并跑者”,正在成为“领跑者”。从“跟跑”到“并跑”再到“局部领跑”,中国AI用三年时间完成了别人十年走过的路。

    这不是偶然爆发的昙花一现,而是厚积薄发的必然结果。海量应用场景的滋养、完整产业链的支撑、高效政策环境的引导、无数科研工作者的坚守——这些因素共同铸就了中国AI的今天。

    当全球AI进入“双雄并峙”的新纪元,中国正以自信的姿态、开放的胸怀、创新的活力,向世界展示着属于自己的AI力量。未来已来,唯变不变;中国AI的故事,才刚刚开始。

    相关阅读

  • AI算力军备竞赛:千亿资本流向何方?

    AI算力军备竞赛:千亿资本流向何方?

    2026年4月,全球AI算力市场迎来标志性时刻:英伟达Blackwell GPU云端现货租赁价格,从两个月前的2.75美元/小时飙升至4.08美元/小时,涨幅高达48%。

    这不是简单的价格调整,而是AI产业格局的深刻转变:算力已从”配套资源”升级为”核心硬通货”

    AI算力产业链全景 - 从芯片设计到散热电力的完整链条

    一、价格狂飙:算力进入稀缺时代

    1.1 全球GPU涨价潮

    2026年以来,AI算力市场经历了多轮涨价潮:

    GPU型号2025年10月价格2026年3月价格涨幅
    H100(年约)$1.70/小时$2.35/小时38%
    Blackwell B200$2.75/小时$4.08/小时48%
    国内H100月租约3.5万元突破5万元43%+

    按此价格计算,单台Blackwell GPU单日租赁成本逼近100美元,全年满负荷运行费用高达3.5万美元。高端算力,正式告别”白菜价”时代。

    更值得关注的是供需失衡:

    • 主流云厂商高端GPU算力长期无货
    • 部分企业将H100合约租期延长至2028年
    • H100、H200现货库存不足10%
    • 高端算力机柜出租率逼近98%

    1.2 供需撕裂:需求爆发,供给受限

    算力价格暴涨的核心,是供需两端的彻底撕裂。

    需求侧:AI应用普及,算力消耗暴增369倍

    摩根大通预测,中国推理算力Token消费量将从2025年的10千万亿,暴涨至2030年的3900千万亿,增幅高达369倍

    AI Agent成为算力消耗的核心推手。相比传统聊天机器人,OpenClaw等智能Agent单次任务Token消耗量是其10-100倍,且部署后24小时持续运行。

    OpenAI API吞吐量达每分钟150亿Token,推理Token年增幅高达320倍。

    供给侧:芯片+电力双重瓶颈

    • Blackwell GPU交付周期拉长至6-7个月
    • 台积电CoWoS封装年产能固定65万片
    • Rubin芯片因HBM4认证问题量产延迟
    • 美国数据中心项目30%-50%延期

    2026年国内AI算力需求4423 EFLOPS,供给仅1590 EFLOPS,缺口超2800 EFLOPS

    二、资本狂潮:千亿资金押注算力

    2.1 全球AI资本支出:7250亿美元

    摩根大通最新报告显示,2026年全球与AI相关的资本支出预计达到7250亿美元,其中算力基础设施占比超过60%。

    四大科技巨头2026年资本开支合计约6300亿美元

    企业2026年资本开支重点方向
    亚马逊2000亿美元AWS算力扩张+Trainium2自研
    谷歌1700-1850亿美元TPU v6量产+Gemini全场景
    微软1050-1800亿美元Azure超算+OpenAI深度绑定
    Meta1150-1350亿美元Llama训练设施+1GW数据中心

    这是什么概念?6300亿美元超过瑞典全年GDP,单家投入均超千亿美元,算力基建周期至少到2027年底,无短期退潮风险。

    2.2 AI企业融资:Anthropic 300亿美元

    资本不仅流向硬件基础设施,也涌向AI企业本身。

    2026年2月,Anthropic宣布完成300亿美元G轮融资,投后估值达3800亿美元。仅仅几周后,多家风投机构主动报价8000亿美元估值——比此前的3800亿翻了一倍多。

    Anthropic年收入从2025年底的90亿美元飙升至300亿美元,四个月增长233%。

    Claude Code编程助手年化收入达25亿美元,成为AI工具商业化的标杆案例。

    2.3 微软:算力版图持续扩张

    微软在算力领域的布局尤为激进:

    • 接盘OpenAI挪威Stargate项目:租赁3万块英伟达GPU,园区规模230兆瓦
    • 自建数据中心:Azure超算集群持续扩张
    • 垂直整合:从芯片(与英伟达合作)到算力(自建+租赁)到应用(Copilot)

    “算力就是AI时代的石油,谁掌握算力,谁就掌握未来。”——这句话正在成为现实。

    三、产业链解析:钱流向哪里?

    3.1 芯片:英伟达的垄断与挑战

    英伟达在高端AI芯片市场占据80%以上份额,H100/H200成为”硬通货”。

    但供给瓶颈重重:

    • 台积电CoWoS封装产能是核心瓶颈
    • 2026年月产能约12万片
    • 即便2027年扩产至20万片,仍存在15%-20%供需缺口

    H100停产传闻背后:

    • 对华实质出货全面停摆
    • 产能向Blackwell系列战略转移
    • 国产替代加速:华为昇腾、寒武纪等芯片年产能新增超50万片

    3.2 存储:HBM价格暴涨5倍

    AI服务器对存储的需求远超传统服务器:

    • 单台AI服务器对DRAM需求是传统服务器的8-10倍
    • 对NAND Flash需求达3倍
    • 2026年一季度DRAM合约价同比涨幅达400%
    • NAND闪存合约价同比涨幅达500%

    服务器DRAM主流颗粒现货均价报37美元/片,较2025年6月低点上涨逾5倍

    3.3 基础设施:电力成为新瓶颈

    算力扩张遭遇电力天花板:

    • 美国2026年原计划上线16GW数据中心容量,30%-50%项目延期
    • 预计2027年全球AI数据中心需68GW电力,接近2022年加州总用电量
    • 高压变压器全球缺口30%+,短缺将持续至2029年

    清洁能源+算力成为新趋势:

    微软接盘的Stargate项目位于挪威,充分利用当地水电资源;Meta计划建设10座天然气发电厂为数据中心供电。

    四、商业模式重构:从”卖算力”到”卖Token”

    4.1 新旧模式对比

    算力供需失衡,不仅推高价格,更彻底改写行业商业模式。

    维度传统模式新模式
    收入来源硬件折旧+电力成本Token分成+模型服务
    估值体系市盈率(P/E)市销率(P/S)
    客户关系一次性租赁持续服务绑定
    盈利空间有限打开

    东吴证券指出: 行业正从”卖算力”升级为”卖Token”,完成从一次性收入到持续服务性收入的质变。

    4.2 企业业绩爆发

    新模式下,企业业绩迎来爆发式增长:

    • 协创数据:2026年一季度归母净利润预盈6.5-8.5亿元,同比暴涨284%-402%
    • 智谱API:一季度价格累计上调83%,但调用量不降反增
    • CoreWeave:GPU资产2.5年回本,客户合同平均4年

    4.3 行业格局重塑

    有算力者为王“的时代已经到来:

    • 资金雄厚的科技巨头提前签订3-5年算力长约
    • 中小企业难以获取高端算力,被迫转向模型轻量化或接受巨头投资
    • 行业呈现”算力垄断”趋势

    OpenAI为节省GPU资源关闭Sora视频生成服务;Anthropic高峰时段压缩Claude用户配额——头部AI企业纷纷”勒紧裤腰带”

    五、投资机遇:结构性行情下的机会

    5.1 算力产业链全景图

    环节核心标的投资逻辑
    芯片设计英伟达、AMD、华为昇腾高壁垒,垄断格局
    芯片制造台积电、三星先进制程供不应求
    封装测试日月光、长电科技CoWoS产能扩张受益
    存储芯片三星、SK海力士、美光HBM需求爆发
    光模块中际旭创、天孚通信算力互联核心组件
    散热系统英维克、申菱环境液冷渗透率提升
    电力设备特变电工、国电南瑞电力基建受益

    5.2 国产替代:算力自主可控

    在中美科技博弈背景下,算力自主可控成为刚需

    • 华为昇腾950PR/950DT发布,性能对标H100
    • 国产AI芯片市场份额提升至25%+
    • 2028年我国AI芯片市场规模预计超一万亿元

    5.3 风险提示

    算力投资需关注以下风险:

    • 估值风险:部分算力标的估值偏高
    • 技术迭代风险:新一代芯片发布可能影响现有产品竞争力
    • 政策风险:美国出口管制政策变化
    • 供需改善风险:2027-2028年供给释放可能缓解紧缺

    结语:算力,AI时代的核心资产

    2026年,AI算力市场经历了从”过剩”到”稀缺”的历史性转折。

    Blackwell GPU租赁价两个月暴涨48%,英伟达H100/H200一卡难求,四大科技巨头6300亿美元军备竞赛——这些事件共同指向一个事实:算力已成为AI时代的核心资产

    供需失衡不会在短期内缓解。摩根大通预测,高端算力紧缺局面将持续至2029年。这是一场结构性短缺,而非周期性波动。

    对于投资者而言,算力板块拥有”需求刚性+供给刚性“双重支撑,景气度有望持续数年。但分化将加剧——真正掌握核心技术、具备产能优势的龙头企业,将享受估值溢价。

    当算力成为”硬通货”,谁能拿到更多GPU,谁就能在AI时代占据先机。

  • AI制药新纪元:从实验室到临床的跨越

    AI制药新纪元:从实验室到临床的跨越

    一款新药从实验室到上市,需要多长时间?

    传统的答案是:10-15年,数十亿美元投入,90%以上的临床失败率。这是制药行业著名的”双十定律”,也是人类攻克疾病道路上的最大障碍。

    但现在,AI正在从根上改写这个答案。

    2026年,谷歌DeepMind旗下Isomorphic Labs宣布与礼来、强生达成深度合作,推动全球首个AI全流程设计的药物首次进入大规模临床试验。这不是对现有药物的简单优化,而是AI从靶点结构出发,从零设计的全新分子。

    AI制药,不再只是”辅助工具”,而是”核心引擎”。

    AI制药端到端流程 - 靶点发现到临床试验的完整路径

    一、颠覆时刻:AI如何重塑药物研发

    1.1 从”十年磨一药”到”数月出成果”

    传统药物研发是一场”时间与金钱的豪赌”:

    • 一款新药从靶点发现到上市,平均需要10-15年
    • 研发成本动辄数十亿美元
    • 临床失败率高达90%以上
    • 无数候选分子在体外实验中表现优异,却因各种问题折戟

    AI的介入,正在改变这个游戏规则:

    • AI能在数天内完成过去需要数月的”虚拟筛选”
    • 从靶点结构解析到先导化合物优化,研发周期压缩到以月为单位
    • 大幅降低试错成本,让更多潜在药物进入临床

    以英矽智能的Rentosertib为例,从靶点发现到进入II期临床,仅用时不到4年——而传统模式下,这个过程通常需要7-10年。

    1.2 从”单点优化”到”全局设计”

    传统药物设计往往只聚焦”药物与靶点的结合亲和力”单一指标,相当于只看钥匙能不能插进锁孔,却忽略了:

    • 钥匙是否耐用?
    • 会不会开错其他锁?
    • 能不能批量生产?

    AI制药则不同。Isomorphic Labs的IsoDDE引擎,在分子设计阶段就同时纳入:

    • 成药性:药物能否被人体吸收、代谢
    • 合成可行性:药物能否规模化生产
    • 脱靶风险:药物是否会影响其他靶点
    • 药代动力学:药物在体内的吸收、分布、代谢、排泄

    从源头规避传统研发的高频失败点,让进入临床的分子更具成药潜力

    1.3 AI制药的技术演进

    AI制药的技术发展经历了三个阶段:

    第一阶段(2018-2022):单点突破

    以AlphaFold为代表,AI在蛋白质结构预测领域取得突破。AlphaFold已预测超过2亿种蛋白质结构,为药物靶点研究提供了前所未有的工具。

    第二阶段(2022-2025):端到端探索

    英矽智能、晶泰科技等企业开始探索从靶点发现到分子设计的一体化AI解决方案。英矽智能的PandaOmics平台,将从靶点发现到PCC提名的周期缩短至18个月以内。

    第三阶段(2026-至今):临床验证

    AI设计的药物进入大规模临床试验,验证AI全流程设计药物的临床可行性。礼来、强生等跨国药企全面拥抱AI制药,标志着行业进入新的发展阶段。

    二、里程碑事件:AI制药进入临床元年

    2.1 全球首个AI全流程药物临床试验

    2026年,Isomorphic Labs宣布与礼来、强生达成深度合作,标志着AI制药进入临床元年

    此次进入临床的首款AI设计药物,是一款针对慢性肾病的小分子抑制剂。在I期临床试验中,该药物展现出了优异的安全性与符合预期的药代动力学特征。

    这意味着什么?

    这是全球首个由AI从靶点结构出发、从零设计的全新分子进入临床——不是对现有药物的改良,而是真正意义上的”AI造药”。

    礼来与强生的合作,将全面覆盖小分子与生物制剂两大领域,靶点涵盖癌症、自身免疫病、代谢性疾病等全球高发疾病。AI制药不再是小众技术,而是成为跨国药企的核心研发引擎

    2.2 英矽智能:从中国走向全球

    英矽智能是中国AI制药的代表企业。2026年,其核心产品Rentosertib(ISM001-055)在特发性肺纤维化(IPF)的IIa期临床中显示出明确疗效,并推进至III期。

    这是全球首个由生成式AI发现并推进至临床III期的TNIK抑制剂,不仅验证了AI在难成药靶点上的攻坚能力,更确立了”端到端”AI药物发现模式在全球的可行性。

    2026年,英矽智能登陆港交所主板,成为中国首家以生成式AI驱动药物研发为核心业务的上市公司,市值一度高达195亿港元。

    2.3 晶泰科技:AI+量子物理的结合

    晶泰科技采用”量子物理+AI+云计算”的技术路线,在药物研发领域走出独特道路。

    其智能药物研发平台已成功赋能超过200个早期药物发现项目。其中与礼来合作的口服小分子GLP-1受体激动剂项目,2026年上半年已确认PCC,并计划于同年提交IND(新药临床试验申请)。

    晶泰科技内部数据显示,其与实测值的相关性系数(R²)已提升至0.85以上,显著降低了湿实验筛选的成本与盲目性。

    三、技术突破:AI制药的核心能力

    3.1 蛋白质结构预测:从AlphaFold到AlphaFold3

    AlphaFold是AI制药领域的里程碑式突破。2024年发布的AlphaFold3,进一步将预测范围扩展到DNA、RNA等生物分子。

    AlphaFold的意义在于:大幅降低药物靶点研究的门槛

    传统方式下,确定一个蛋白质的三维结构可能需要数年时间和数百万美元;AlphaFold可以在数小时内完成预测,且准确率接近实验水平。

    这对中小型药企和科研机构意义重大——他们无需建设昂贵的结构生物学实验室,就能开展高质量的药物研发工作。

    3.2 生成式AI:从”找药”到”造药”

    如果说AlphaFold解决了”靶点长什么样”的问题,生成式AI则解决了”怎么设计药物分子”的问题。

    英矽智能的Chemistry42平台,采用扩散模型进行抗体设计,支持按表位和框架进行条件控制。小分子设计平台升级了Alchemistry 2.0引擎,结合分子动力学模拟,大幅提升了结合亲和力预测的精度。

    更值得关注的是”零样本”能力。Chai-2模型实现零样本抗体设计,面对全新靶点蛋白,能直接根据三维结构从头生成全新抗体,将成功率从不足0.1%提升至16%,效率飞跃百倍。

    3.3 多智能体:从”单兵作战”到”军团协作”

    传统药物研发流程中,靶点发现、分子设计、临床试验等环节相互割裂,信息传递效率低下。

    AI制药正在构建”多智能体”平台,将不同环节的专业智能体整合成”首席智能体科学家军团”。这些智能体不再”各自为战”,而是分工协同,在知识图谱约束下进行推理规划。

    这种”人机共生”的研发范式,正在重塑药物发现的效率天花板。

    四、市场格局:AI制药的万亿赛道

    4.1 全球AI制药市场规模

    2026年全球AI制药市场规模约120亿美元,预计2030年将突破500亿美元,年复合增长率超过40%。

    4.2 中国AI制药:快速崛起的第二极

    中国AI制药行业2026年被认为是从技术验证迈向商业化兑现的关键之年。

    核心数据:

    • 中国AI核心产业规模预计突破1.2万亿元
    • AI企业数量超过6000家
    • 国产开源大模型全球累计下载量突破100亿次
    • 中国已成为AI专利最大拥有国

    在政策层面,2026年4月,国家药品监督管理局药品审评中心(CDE)正式发布《人工智能辅助药物研发申报资料指导原则(试行)》修订版,首次明确AI生成药物在IND申报中关于算法可解释性、数据溯源性以及模型验证的具体技术要求。

    这是中国AI制药合规化的”破冰时刻”。

    4.3 资本涌入:AI制药融资再创新高

    2026年以来,AI制药领域融资持续火爆:

    • 晶泰科技与DoveTree授权合作:约59.9亿美元
    • 英矽智能港交所上市:市值一度达195亿港元
    • 纽瑞特医疗核药融资:10亿元E轮
    • 2026年H1 AI制药融资:约120亿元人民币

    根据动脉网数据,2026年上半年,AI制药领域融资总额同比增长35%,头部企业如晶泰科技、英矽智能的股价表现强劲,反映出二级市场对AI制药商业模式盈利能力的认可。

    五、挑战与展望

    5.1 当前面临的挑战

    尽管进展显著,AI制药仍面临三大核心挑战:

    1. 数据质量与可得性

    AI模型的训练需要大量高质量数据,但制药行业的数据往往分散在不同企业、机构,且存在格式不统一、质量参差不齐的问题。

    2. 监管不确定性

    各国药品监管机构对AI设计的药物尚未建立完善的审批标准。CDE新发布的指导原则是重要进步,但仍需进一步细化。

    3. 技术局限

    AI在分子设计环节表现出色,但在”成药性”预测、临床试验设计等方面仍有局限。AI设计的分子能否在人体中表现出预期效果,仍需要大量实验验证。

    5.2 未来展望:人机共生的药物研发时代

    展望未来,AI制药将经历三个阶段:

    近期(2026-2028):单点深化

    AI在靶点发现、分子设计等单点环节持续深化,效率优势进一步显现。AI设计的药物陆续进入II、III期临床,初步验证商业化可行性。

    中期(2028-2030):全流程融合

    AI深度融入药物研发全流程,从靶点发现到临床试验,实现端到端智能化。人机协同成为主流研发范式。

    远期(2030+):范式革命

    AI从”工具”升级为”创新伙伴”,不仅执行人类指令,更能提出创新性的药物设计思路。药物研发进入真正的”AI驱动”时代。

    结语:让每一种疾病都有药可医

    2026年,AI制药进入临床元年。这不仅是技术的突破,更是人类对抗疾病历程中的重要里程碑。

    传统”双十定律”(十年、十亿美元研发一款新药)的牢笼,正在被AI撬动。英矽智能18个月完成靶点发现到PCC提名,晶泰科技将预测准确率提升至0.85以上,Isomorphic Labs的AI设计药物进入临床试验——这些不再是PPT上的概念,而是真实发生的进步。

    AI的价值,从来不是替代药物研发科学家,而是把科学家从海量的筛选、试错中解放出来,让他们聚焦真正的医学创新与临床转化。

    让每一种疾病都有药可医——这个愿景正在因为AI而变得更加真实。

  • 具身智能规模化落地元年:从展品到商品的跨越

    具身智能规模化落地元年:从展品到商品的跨越

    2026年4月,上海某3C电子工厂的生产线上,一台人形机器人正在完成精密装配任务。8小时工作制,2283次任务操作,零失误。

    这不是演示视频,而是真实的生产场景。这台来自智元机器人的”精灵G2″机器人,标志着具身智能正式从”展品”变成了”商品”。

    工信部数据显示,截至2026年3月,国内人形机器人整机企业已超过140家,发布产品达330款。行业从”实验室炫技、Demo展示”,进入”工程化、场景化竞争的下半场”。

    2026年,被业界定义为具身智能”部署态元年”。

    具身智能产业链全景 - 从核心零部件到场景应用的完整产业链

    一、转折时刻:从”能走路”到”能干活”

    1.1 行业进入下半场

    回顾具身智能的发展历程,2024年到2025年初,行业的焦点还在比拼机器人走路是否自然。如今,人形机器人已能完成”飞檐走壁”般的高难度动作。

    “本体灵活性已达到实用化阶段,接下来要比的,是谁的干活能力更强。”智元机器人联合创始人、总裁兼CTO彭志辉(稚晖君)在2026人形机器人与具身智能标准化(HEIS)年会上表示,”不仅在国内比,更要与海外头部企业比,看谁能在’部署态’真正落地。”

    这个转变的核心逻辑是:AI要实现最大化的通用性和兼容性,终端形态大概率要长得像人。正如整个物理世界——从门把手高度到工具形态——都是为人类身体设计的,人形机器人是物理世界的”通用接口”。

    1.2 “沿途下蛋”的商业策略

    面对复杂的物理世界约束,智元总结出一套可落地的工程范式——“一体三智”

    所谓”一体”,即机器人本体。在数字世界,代码跑错了可以重启;但在物理世界,有物理成本、失效成本。本体设计绝非简单的硬件堆叠,而是可靠性工程、供应链工程和安全工程的综合体

    “三智”则是指:

    • 运动智能:基础智能,承担执行器功能
    • 交互智能:高阶智能,提供服务生产力
    • 作业智能:高阶智能,提供劳动生产力

    在场景落地策略上,彭志辉提出了”沿途下蛋”的思路。他将任务维度划分为”场景复杂度”和”任务复杂度”,认为当前人形机器人的最佳切入点是——“在简单场景做复杂任务”

    比如在结构化的工厂环境里,执行高自由度、高维感知的复杂操作。相比自动驾驶”在复杂环境下做简单任务”,人形机器人的终局是”在复杂环境下完成复杂任务”,但这需要循序渐进。

    二、技术突破:从”大脑”到”小脑”的全面进化

    2.1 具身基座大模型:机器人的”大脑”

    2026年4月,智元机器人发布新一代具身基座大模型GO-2,首次在统一架构中打通从逻辑推理到精准动作执行的”最后一公里”。

    GO-2支持千台级机器人协同训练,训练效率提升约10倍。这意味着机器人的”大脑”不仅能理解指令,还能将指令转化为精确的身体动作。

    更值得关注的是智元同步开源的AGIBOT WORLD 2026数据集——这是业界最大的真机数据集,所有数据均采集自商业空间、酒店、家居等100%真实世界场景,涵盖遮挡、光照变化等随机干扰因素。

    相比模拟数据训练的机器人,基于真实数据训练的具身智能,在复杂场景下的泛化能力显著提升。

    2.2 世界模型:让机器人拥有”物理直觉”

    除了具身基座大模型,世界模型是另一条关键技术路线。

    智元发布的GE-Sim 2.0世界模型,首次构建可交互、可训练的”物理进化引擎”。机器人可以在模拟环境中完成大规模闭环训练,大幅降低对真实物理试错的依赖。

    为什么要训练世界模型?

    因为让AI理解物理规律——重力、材质、空间关系——是机器人不再”犯傻”的关键。传统的机器人依赖预设程序,面对非结构化环境往往束手无策;具备世界模型的机器人,能够理解”这个杯子是玻璃的,轻拿轻放”,而不是机械地执行”拿起杯子”。

    OpenAI调整Sora团队方向、杨立昆和李飞飞等顶尖学者创办世界模型公司——这些动向都表明,物理AI正在成为AI竞争的下一战场

    2.3 硬件进化:从”能用”到”好用”

    软件进化之外,硬件层面的突破同样关键。

    2026年4月,智元一口气发布4款本体新品:

    • 远征A3:综合能力最强全尺寸人形整机,整机重量从行业普遍的70多公斤降至50公斤,双电池包支持热插拔,连续工作8-10小时
    • 灵犀X3:面向人形交互服务场景,预计2026年年底上市
    • 精灵G2系列:面向工业搬运拆码垛场景
    • 酷拓D2系列:四足机器人,面向物流搬运、工业巡检等场景

    灵巧手的突破尤为关键。彭志辉指出,工业场景中接近80%人类做得很好、但自动化做不好的工序,都和触觉强相关。”装配工人通过手感把零件拼起来,’咔嚓一声’觉得装好了——这种信号如何用数字描述?这是行业面临的瓶颈之一。”

    三、商业化落地:从”烧钱”到”赚钱”

    3.1 工业场景:率先突破

    目前,具身智能商业化落地最成熟的场景是工业制造

    典型案例:

    • 智元”精灵G2″在3C工厂8小时完成2283次任务,零失误
    • 优必选Walker S系列已批量进入富士康、比亚迪、极氪等头部制造企业,单台机器人作业成功率99%
    • Figure AI的F.02机器人在宝马工厂连续运行11个月,完成10小时轮班,累计运行1250多小时
    • 银河通用Galbot S1双臂最大持续负载50公斤,已在宁德时代产线实现零遥操、全自主作业

    为什么工业场景率先突破?

    工业场景具备三大优势:

    1. 环境相对结构化:工厂生产线虽然复杂,但相对可控
    2. 任务相对标准化:装配、搬运、质检等任务有明确的流程
    3. ROI容易计算:一台机器人替代几个工位,价值可量化

    3.2 从”单点突破”到”规模化复制”

    2026年,具身智能正在从单点突破走向规模化复制

    优艾智合是工业领域出身的机器人代表企业,截至2026年,已累计超过800个工业具身智能场景落地案例,覆盖半导体、能源化工、锂电、3C制造等多个领域,服务全球400余家行业头部客户。2025年营收达3.4亿元,目前已递交IPO招股书,计划港股上市。

    智平方与惠科股份达成的5亿元大单,覆盖仓储物流、上下料、装配到质检全流程,成为半导体显示行业首个大规模具身智能应用项目

    星动纪元与顺丰深度合作,在物流集散中心实现分拣、扫码、供件全流程覆盖,推动仓储、快递中转等环节的规模化应用。

    3.3 “部署态元年”的市场规模

    根据《中国人工智能产业发展指数报告》,2025年中国具身智能市场规模约380亿元,预计2026年将突破600亿元,年增长率超过58%。

    更长期来看,具身智能的想象空间是万亿级别的。彭志辉判断:”未来人形机器人走进家庭时,产业规模将是’手机数量乘以汽车价格’的级别。”

    四、投资机遇:产业链全景梳理

    4.1 上游:核心零部件

    具身智能产业链的最上游是核心零部件,这也是当前资本最关注的环节:

    细分领域主要玩家投资价值
    减速器绿的谐波、国茂股份谐波减速器价值量高,国产替代空间大
    伺服系统汇川技术、禾川科技运动控制核心,毛利率较高
    传感器速腾聚创、帕西尼感知力传感器国产化率低,壁垒高
    灵巧手智元自研、追觅触觉感知是差异化关键

    2026年一季度,速腾聚创机器人业务销量达18.55万台,同比大增1458.8%,销量占比达56.2%,首次超过车载激光雷达业务。”高级驾驶辅助系统(ADAS)+机器人”双轮驱动战略取得结构性突破。

    4.2 中游:整机厂商

    整机厂商是具身智能产业的核心,包括:

    • 人形整机:智元机器人、优必选、Figure AI、特斯拉Optimus
    • 工业机器人:ABB、库卡、国产替代
    • 服务机器人:普渡科技、擎朗智能

    2026年,智元机器人第10000台通用具身机器人远征A3正式下线,从千台到万台的突破仅用时3个多月,量产速度创全球纪录

    4.3 下游:场景应用

    下游场景应用可分为三大方向:

    • 工业制造:3C电子、汽车总装、锂电池
    • 物流仓储:分拣、搬运、上架
    • 商业服务:酒店、餐饮、医疗辅助

    工信部日前批准发布的《YD/T 6770—2026 人工智能 关键基础技术 具身智能基准测试方法》,将于2026年6月1日正式实施,从环境、任务、能力、考核、安全伦理五大核心维度,构建覆盖全链路的产业级验证体系。

    行业标准的落地,标志着具身智能从”技术验证”走向”产业规范化”。

    五、挑战与展望

    5.1 当前的三大挑战

    尽管进展显著,具身智能仍面临三大核心挑战:

    1. 泛化能力不足

    当前的人形机器人,在特定场景下表现优异,但面对非结构化环境(如陌生家庭、复杂户外)的能力仍然有限。”左手换右手”这种对人类简单的动作,对机器人仍是难题。

    2. 成本依然偏高

    一台人形机器人的售价仍在数十万到上百万元,远未达到大规模普及的临界点。降本路径包括:核心零部件国产化、规模化生产、供应链优化。

    3. 数据闭环待完善

    具身智能需要大量真实场景数据进行训练,但数据采集成本高、效率低。智元开源AGIBOT WORLD数据集,是解决这一问题的重要尝试。

    5.2 2026-2030年发展路线图

    智元提出的XYZ曲线框架,为行业发展提供了清晰的演进坐标:

    • X曲线(2022-2025年):开发尝鲜期,完成从原型到规模量产的关键跨越
    • Y曲线(2026-2030年):部署成长期,部署态数据飞轮驱动生产力持续逼近人类水平
    • Z曲线(2030年以后):部署普及期,机器人在制造、物流、服务等领域生产力全面超越人类

    2026年的目标是:在首批部署态场景完成万台部署,成功跨越百亿营收门槛。

    结语:机器人时代真的来了

    2026年,具身智能进入”部署态元年”。这不仅是一个时间节点,更是行业从”技术驱动”转向”需求驱动”的标志。

    当人形机器人开始在工厂里8小时零失误工作,当具身智能模型开始理解”玻璃杯要轻拿轻放”,我们正在见证一个全新时代的开启。

    机器人不再是展品,而是商品。具身智能不再只是概念,而是正在发生的现在。

  • AI智能体平台横评:OpenClaw vs Claude Managed Agents vs Hermes,谁将定义数字员工时代?

    AI智能体平台横评:OpenClaw vs Claude Managed Agents vs Hermes,谁将定义数字员工时代?

    2026年,AI智能体(Agent)赛道的竞争格局正在悄然生变。当大模型的参数竞赛告一段落,业界目光转向了更务实的问题:谁能真正把AI从”聊天工具”变成”数字员工”?

    答案并非只有一个。OpenClaw、Claude Managed Agents、Hermes Agent——这三款目前最受关注的AI智能体平台,正以截然不同的路径切入市场。它们不是同一赛道上的竞争对手,而是面向不同用户群体、提供差异化价值的解决方案。

    本文将深度横评三大平台,解析它们的技术架构、核心优势与竞争策略。

    AI智能体技术架构对比 - OpenClaw、Claude、Hermes三平台技术维度

    一、格局重塑:三大平台的三条路径

    1.1 OpenClaw:开源世界的”瑞士军刀”

    OpenClaw从诞生之初就定位清晰——自托管、本地优先的开源AI Agent网关

    它不是传统意义上的聊天机器人,而是一个能把大语言模型变成”能动手做事”的助手的框架。通过Gateway架构和丰富的Skills生态,OpenClaw让AI帮你回微信、发邮件、操作数据库、定时执行任务——这些能力被整合在一起,形成了一套完整的自动化工作流。

    几个核心数据足以说明它的地位:

    • GitHub Star:34万+(截至2026年4月)
    • 支持平台:20+通讯渠道(WhatsApp、Telegram、Discord、微信等)
    • 支持模型:25+AI模型(Claude、GPT、DeepSeek等)
    • 最新版本:2026.4.5(4月5日发布,全模态能力+AI记忆系统)

    OpenClaw最大的优势在于生态成熟度。多年的积累让它拥有了庞大的社区Skills库——超过3000个社区构建的扩展插件,覆盖邮件、日历、网页自动化、交易等场景。对于”数据不能上云”的企业来说,OpenClaw的本地优先特性是无可替代的选择。

    但值得注意的是,2026年2月,OpenClaw创始人Peter Steinberger宣布加入OpenAI,项目正在向开源基金会过渡。这一变化对OpenClaw的长期发展走向,值得持续关注。

    1.2 Claude Managed Agents:企业级的”交钥匙”方案

    Anthropic在2026年4月8日发布的Claude Managed Agents,走的完全是另一条路。

    它不是框架,甚至不是一个具体的Agent产品。用Anthropic自己的话说,它是一个**”meta-harness”**——一个托管在云端的Agent基础设施层。

    传统开发Agent时,你需要自己搭建三样东西:

    • Harness(编排层):管理任务调度和执行流程
    • Session(会话状态):维护对话上下文
    • Sandbox(执行环境):隔离运行,保证安全

    这三层既复杂又容易出问题,是很多团队迟迟无法把Agent投入生产的主要原因。Claude Managed Agents的做法是:这三层我全部帮你托管了

    Anthropic的”三层解耦架构”如下:

    • Session层:append-only的完整操作日志
    • Harness层:调用Claude的编排循环,由Anthropic托管和优化
    • Sandbox层:隔离的执行环境

    最关键的定价:$0.08/小时运行时费用。这意味着企业不再需要雇一个运维团队来维护Agent基础设施,也不需要担心扩缩容问题。对于想快速上线Agent但又没有运维能力的中型企业来说,这个诱惑力是巨大的。

    1.3 Hermes Agent:自我进化的技术新锐

    Hermes Agent代表了另一种方向——自我进化

    与OpenClaw依赖人工编写的静态Skills不同,Hermes Agent能通过使用过程中的反馈自动改进技能结构。它不是简单地把对话存起来,而是会主动理解、关联、优化记忆结构。

    GitHub数据显示,Hermes Agent在发布两个月内就斩获了7万+星标,增长速度惊人。”越用越聪明”的概念在开发者圈子里极具吸引力——想象一下,你部署了一个Agent,它不需要你教,自己就能学会新技能。

    但Hermes的问题在于生态积累尚浅。OpenClaw的34万+Star、3000+Skills生态,是短期之内Hermes难以超越的护城河。

    二、技术架构深度对比

    2.1 记忆系统:谁更”记事儿”?

    记忆系统是AI智能体最核心的能力之一。它决定了Agent能否跨越会话保持上下文理解,真正成为用户的”专属助手”。

    维度OpenClawClaude Managed AgentsHermes Agent
    记忆类型会话级+持久存储全托管Session日志工作记忆+长期记忆+技能记忆
    跨会话记忆需配置外部存储原生支持原生支持,自动进化
    记忆检索基于向量检索Anthropic托管语义搜索+关联召回
    用户画像基础支持企业级用户管理自动构建用户模型

    2.2 技能生态:多才多艺的比拼

    技能(Skills)决定了Agent能完成多少任务,是衡量平台实用性的关键指标。

    维度OpenClawClaude Managed AgentsHermes Agent
    技能来源社区Skills+自定义官方托管API自动生成+手动创建
    技能进化手动更新版本管理使用中自动改进
    工具隔离沙箱机制企业级隔离内置安全沙盒
    技能生态丰富(3000+)起步阶段快速增长

    2.3 部署与运维:谁更”省心”?

    对于企业来说,部署和运维成本往往是选择平台的关键因素。

    维度OpenClawClaude Managed AgentsHermes Agent
    部署方式自托管(本地/云)完全托管自托管(轻量)
    运维成本中等(需维护)低(Anthropic托管)低($5 VPS即可)
    数据控制完全自主依赖Anthropic完全自主
    扩展性手动配置自动扩缩容垂直扩展

    如果你最怕麻烦,Claude Managed Agents肯定是首选——完全托管,零运维。但如果你对数据隐私有要求,或者想省钱,OpenClaw和Hermes的自托管路线更适合你。

    三、竞争格局:错位竞争还是正面交锋?

    3.1 Claude Managed Agents不会”杀死”OpenClaw

    很多人看到”Managed”就觉得这是要干掉所有开源框架,其实不然。

    Claude Managed Agents瞄准的是企业级托管市场。它的目标用户是那些”想快速上线AI Agent但不想自建基础设施”的中大型企业。对于这些企业来说,$0.08/小时的定价、自动扩缩容、企业级安全,都是非常有吸引力的。

    但OpenClaw的核心用户是什么人?是开发者、技术爱好者、以及对数据隐私有极致要求的企业。这些人要么喜欢折腾,要么数据不能上云——Claude Managed Agents再强,也满足不了他们的需求。

    结论:两者更多是错位竞争,而非直接对抗。

    3.2 Hermes才是OpenClaw的真正威胁

    真正对OpenClaw构成直接威胁的,其实是Hermes Agent。

    为什么?因为两者的定位几乎完全重叠:

    • ✅ 都是开源免费
    • ✅ 都是自托管
    • ✅ 目标用户都是开发者和技术爱好者

    而且Hermes还有一个杀手锏——“自我进化”。这个概念在开发者圈子里非常有吸引力。想象一下,你部署了一个Agent,它不需要你教,自己就能学会新技能、越用越聪明——这比OpenClaw的”静态Skills”模式听起来酷多了。

    但OpenClaw也不是没有机会。它的34万+Star生态、成熟的Gateway架构、丰富的Skills库,都是短期之内Hermes难以超越的护城河。

    四、落地场景:谁更适合你的需求?

    4.1 OpenClaw适合的场景

    • 数据 sovereignty 要求高:金融、医疗、政务等行业,数据不能上云
    • 需要丰富的第三方集成:3000+Skills覆盖几乎所有常见应用
    • 追求模型灵活性:想在不同模型之间切换(Claude、GPT、DeepSeek等)
    • 技术能力强:有Node.js运维经验,能够处理复杂配置

    4.2 Claude Managed Agents适合的场景

    • 快速上线:没有运维团队,想快速部署Agent能力
    • 企业合规要求:需要Anthropic级别的安全和合规保障
    • 规模化管理:需要管理大量企业用户和会话

    4.3 Hermes Agent适合的场景

    • 追求前沿体验:想体验”自我进化”的智能体
    • 技术爱好者:愿意折腾,但预算有限
    • 长周期任务:需要Agent在长期使用中不断学习和优化

    五、2026展望:智能体赛道的三大趋势

    5.1 从”对话框”到”数字员工”

    AI智能体正在完成从”聊天工具”到”数字员工”的质变。不再是简单的问答,而是能够自主规划、执行复杂任务的智能助手。

    OpenClaw的Gateway架构、Claude Managed Agents的托管编排、Hermes的自我进化——三条技术路线都在推动这一进程。

    5.2 企业级市场加速爆发

    Claude Managed Agents的推出,标志着AI智能体正式进入企业级市场的争夺战。$0.08/小时的价格,对于中型企业来说是可以接受的。

    预计到2026年底,40%的大型企业将部署AI智能体,覆盖自动办公、代码开发、数据分析等场景。

    5.3 开源与闭源的长期博弈

    OpenClaw的开源路线和Claude Managed Agents的闭源路线,代表了两种不同的价值观。

    开源的优势在于灵活性、透明度和社区驱动;闭源的优势在于稳定性、企业级支持和商业可持续性。两者将长期并存,而非简单的你死我活。

    结语:选择比努力更重要

    回到文章开头的问题:谁能真正定义数字员工时代?

    答案或许不是某一个平台,而是整个智能体生态的成熟。OpenClaw、Claude Managed Agents、Hermes Agent,各有所长,各有适用场景。

    对于企业来说,选择比努力更重要。根据自身的需求(数据安全要求、技术能力、预算规模、落地场景),选择最适合自己的平台,才是明智之举。

    2026年,AI智能体元年已至。无论你选择哪条路,现在都是入场的最佳时机。

  • AI眼镜赛道爆发:华为、阿里、小米集体卡位,2026年智能穿戴新战场

    AI眼镜赛道爆发:华为、阿里、小米集体卡位,2026年智能穿戴新战场

    巨头扎堆:华为、阿里、小米集体卡位

    先看华为。4月13日,华为官方宣布AI眼镜将于4月20日正式发布,搭载鸿蒙操作系统,支持跨端协同和拍摄功能。鸿蒙生态的加持,意味着这款眼镜不只是单独的设备,而是华为全场景智慧生态的重要一环。

    再看阿里。4月10日,千问AI眼镜S1已开启全渠道预约,4月15日现货发售。相比华为的产品,千问眼镜更侧重于AI交互能力,内置通义千问大模型,支持实时翻译、语音助手、智能问答等功能。

    小米虽然尚未发布新品,但内部研发早已不是秘密。小米AI眼镜的传闻已经持续数月,据悉将深度整合小爱同学和米家智能生态。

    百度的小度AI眼镜、理想汽车的理想AI眼镜……加上苹果首款智能眼镜进入密集测试阶段,整个赛道呈现出”全员备战”的态势。

    AI智能眼镜实验室 - 多任务处理与图像识别

    市场规模:322%增长背后的爆发前夜

    巨头们的集体入场并非盲目押注,而是基于对市场空间的清醒判断。

    数据显示,2025年全球AI眼镜出货量达870万台,同比大增322%。其中,Meta凭借Ray-Ban智能眼镜占据85%的市场份额,是当之无愧的领导者。但这个数字意味着,AI眼镜已经走过了”概念验证”阶段,开始进入真正的商业化轨道。

    中国市场的增速同样惊人。2025年中国智能眼镜市场出货量达246万台,同比增长87.1%。尽管绝对数量与全球市场相比仍有差距,但增速证明了国内消费者对这类产品的接受度正在快速提升。

    业界普遍认为,2026年有望成为AI眼镜的关键转折点。目前市面上的主流产品大多属于”无显示”类型——它们能听、能说、能拍照,但无法在眼前”显示”信息。而”带显示”版本才是被普遍认为是”下一代计算平台”的产品形态。

    从”无显示”到”带显示”:谁先突破?

    “无显示”和”带显示”的区别,说白了就是:前者只是”听得见的助手”,后者是”看得见的助手”。

    无显示眼镜的代表是Meta Ray-Ban智能眼镜。它可以听音乐、打电话、拍照、语音助手,但显示信息需要配合手机。这种设计的优点是体积轻巧、续航较长、价格相对亲民。

    带显示眼镜则更进一步。它可以在镜片上叠加虚拟画面,实现导航、信息提示、翻译字幕等功能。苹果Vision Pro虽然功能强大,但体积和重量仍是问题。真正能像普通眼镜一样日常佩戴的带显示AI眼镜,目前尚未出现。

    谁能在带显示版本上率先突破,谁就能占据下一个计算平台的入口。这也是为什么华为、小米、苹果等巨头都在这一方向上押下重注。

    技术挑战:轻量化与功能性的平衡

    AI眼镜的研发,面临着”既要又要”的矛盾。

    既要轻便:眼镜是随身佩戴的物件,太重太厚都会影响佩戴体验,用户接受度会大幅下降。

    又要有用:电池续航、散热、显示效果、音频质量、麦克风收音……每一项都不能有明显短板,否则就只是”噱头”而非”刚需”。

    这两个目标的平衡,正是AI眼镜研发的核心难点。Meta Ray-Ban之所以能卖得好,正是因为它在轻便和功能性之间找到了一个合理的平衡点。

    华为选择搭载鸿蒙系统,或许是想通过系统优化来提升效率,在有限的硬件条件下实现更好的体验。阿里则选择将通义千问大模型深度集成,发挥AI交互的优势。不同的技术路线,折射出不同厂商对用户需求的理解。

    供应链暗战:核心元器件争夺白热化

    巨头们的集体入场,让AI眼镜的供应链争夺日趋白热化。

    Micro LED、光波导镜片、定制芯片……这些核心元器件正在成为抢手货。有消息称,部分厂商已经开始向供应链下单,预订2026年上半年的产能。

    更重要的是,AI眼镜对芯片的功耗控制提出了更高要求。传统手机芯片的功耗动辄数瓦,而眼镜能承载的功耗可能只有几百毫瓦。芯片厂商正在为这一新场景研发专用解决方案。

    在这场供应链暗战中,谁能抢先锁定优质供应商,谁就能在产品上市时间上占据先机。

    应用场景:从尝鲜到刚需还有多远?

    对于普通消费者而言,AI眼镜目前更多是”尝鲜”而非”刚需”。

    目前最实用的场景包括:骑行时的导航和通话、烹饪时的语音食谱、旅行时的实时翻译……这些场景确实能带来便利,但并非”不可替代”。

    真正能让AI眼镜成为刚需的,是”带显示”+强AI能力的结合。想象一下,走在街上,眼前实时浮现导航箭头;和外国人交流时,字幕自动出现在视野中;开会时,发言内容实时转写成文字……这些场景一旦成熟,AI眼镜的渗透率将大幅提升。

    从”工具”到”平台”的跃迁,需要的不只是硬件突破,更需要杀手级应用的诞生。Meta押注的是AI社交,苹果押注的是空间计算,华为押注的是鸿蒙生态……不同的押注方向,将决定最终的市场格局。

    写在最后:2026年,见证历史

    2026年的AI眼镜赛道,像极了2019年的折叠屏手机——技术日趋成熟,玩家纷纷入局,消费者开始关注,但真正的爆发还在酝酿之中。

    巨头们的集体卡位,供应链的加速布局,应用场景的持续拓展……这些信号都在指向同一个结论:AI眼镜不是一个”伪需求”,而是下一个计算平台的雏形。

    当然,最终谁能胜出,现在还言之过早。但有一点可以确定:2026年的AI眼镜赛道,注定精彩纷呈。

    相关阅读:

  • 国产AI大模型全球崛起:DeepSeek V4即将发布、HappyHorse登顶全球视频榜

    国产AI大模型全球崛起:DeepSeek V4即将发布、HappyHorse登顶全球视频榜

    2026年4月,注定是国产AI发展史上值得铭记的一个月。就在全球目光聚焦GPT-6和Claude Opus 4.7的同时,国产大模型也在悄悄干着让硅谷有些紧张的事。

    HappyHorse登顶全球视频榜:国产AI视频技术断层领先

    4月15日,阿里ATH创新事业部研发的HappyHorse-1.0视频生成模型,在权威评测平台Artificial Analysis视频竞技场排行榜中登顶全球榜首。

    这个成绩的分量有多重?HappyHorse以更高Elo分数压过了字节跳动的Seedance 2.0、Google的Veo 3 Fast等强劲对手——这两款产品一个是国内AI视频领域的头部玩家,一个是硅谷巨头的最新力作。能在这场正面交锋中胜出,意味着国产AI视频技术已经实现了断层式领先。

    AI大模型协作 - 全息交互与代码生成界面

    更值得关注的是,这不是PPT发布。HappyHorse目前已处于内测阶段,近期将开放API。对于开发者和创作者而言,这意味着又一款强大的国产视频生成工具即将进入实用阶段。

    国产AI视频的崛起并非偶然。从阿里此前的Wan2.7-Video到字节的Seedance系列,国产厂商在视频生成领域持续深耕,在可控性、高清输出、长视频生成等关键能力上不断突破。HappyHorse的登顶,是多年技术积累的集中爆发。

    DeepSeek V4确认4月下旬发布:万亿参数+全栈国产

    如果说HappyHorse代表了国产在垂直领域的突破,那么DeepSeek V4则承载着国产大模型在通用能力上的野心。

    4月13日,DeepSeek创始人梁文锋在内部沟通中正式确认,新一代旗舰模型V4将于2026年4月下旬全球发布。核心参数已经曝光:参数规模达万亿级,采用Ultra-MoE稀疏激活架构,但单次推理仅激活约130亿参数——性能拉满的同时,功耗控制得死死的。

    最具里程碑意义的是全栈国产化适配。DeepSeek V4全程基于华为昇腾950PR芯片完成训练与推理,全面迁移至华为CANN框架,彻底摆脱了对英伟达CUDA生态的依赖。这是全球首款完全基于国产芯片训练优化的万亿级旗舰大模型。

    训练成本的对比更加震撼:DeepSeek V4的训练成本仅为520万美元,是GPT-4的1/20。高性价比+完全自主可控,这正是DeepSeek一贯的技术路线。

    上下文窗口扩展至256K Token,是V3的两倍;推理速度提升35倍,能耗降低40%。这些数字背后,是国产团队在算法优化和硬件适配上的双重突破。

    中国AI大模型周调用量连续五周超越美国

    Hard数据背后,是实际使用量的支撑。

    根据OpenRouter最新周度数据,全球AI大模型周调用量达到27万亿Token,环比增长18.9%。其中,中国AI大模型的周调用量突破12.96万亿Token,环比暴涨31.48%,连续第五周超越美国(3.03万亿Token),领先优势扩大至4.27倍。

    更让市场意外的是,在全球最热门的开源AI智能体Hermes Agent调用量排行中,前三名全是中国的模型。这意味着全球开发者和用户正在用脚投票,选择中国的AI服务。

    阿里通义千问Qwen3.6 Plus以4.6万亿Token登顶全球榜首,全球调用量前六名被中国模型包揽。这一格局的形成,标志着国产大模型已经获得了全球市场的认可。

    国产算力闭环:华为昇腾910B跑通GLM-5.1

    大模型的能力突破,离不开底层算力的支撑。

    智谱发布的GLM-5.1旗舰模型同样传来好消息:在SWE-bench Pro基准测试中,GLM-5.1取得58.4分,超越Claude Opus 4.6(57.3分)和GPT-5.4(57.7分)。该模型可连续工作8小时自主完成软件工程任务,全程无需人类介入。

    更重要的是,GLM-5.1完全基于华为昇腾910B芯片训练,未使用任何英伟达GPU。国产算力+国产模型完整闭环首次跑通,这意味着什么?

    意味着即使在极端情况下失去外部芯片供应,国产大模型的研发和生产不会受到根本性影响。芯片这个”卡脖子”的问题,正在被一步步攻克。

    数据显示,智谱API价格一季度累计上涨83%,但调用量却暴涨400%,完成从”聊天玩具”到”生产力引擎”的跃迁。用户愿意为真正的价值付费,这才是技术实力的最好证明。

    华为新一代算力芯片:性能达英伟达H20的2.87倍

    底层硬件层面,国产芯片也在加速追赶。

    华为发布的新一代高性能算力芯片,经权威机构实测,AI计算性能达到英伟达H20的2.87倍。该芯片在FP4低精度推理场景中优势显著,能耗较同类产品降低超30%,可有效支撑金融风控、医疗影像分析、智能制造等高负载场景。

    赛迪研究院预测,2026年我国智能算力占比将突破35%。在高端算力芯片90%依赖进口的背景下,华为新一代芯片的发布,标志着国产AI芯片的重要突破。中国AI产业正在摆脱对单一算力路径的依赖。

    写在最后:国产AI的底气从何而来

    写到这里,可能有人要问:国产大模型和GPT系列相比,到底谁更强?

    这个问题本身就值得商榷。AI竞争不是零和游戏。GPT-6强不强?强。但它服务的是全球市场,用的是美元定价,对中国开发者有使用门槛。国产大模型行不行?行。中文理解更好、成本更低、本地化服务更贴心,更重要的是——完全自主可控。

    从DeepSeek V4的全栈国产化,到HappyHorse登顶全球视频榜,再到国产大模型连续五周超越美国的调用量——这些不是PPT上的数字,是几百万开发者和用户用实际行动投票的结果。

    2026年的国产AI,值得认真看一眼。

    相关阅读:

  • GPT-6正式发布:参数量达5-6万亿、支持200万Token上下文,性能提升40%

    GPT-6正式发布:参数量达5-6万亿、支持200万Token上下文,性能提升40%

    2026年4月14日,OpenAI正式发布了代号”Spud(土豆)”的新一代旗舰模型GPT-6。这个代号据说源于研究团队在得克萨斯州Stargate数据中心连续数月靠土豆泥续命的趣闻——一个耗资超20亿美元、参数5-6万亿的超级工程,代号却朴素到近乎自嘲。

    GPT-6多模态能力 - 编程与智能制造场景展示

    核心参数:从”能用”到”无限”的跨越

    GPT-6的核心参数确实令人震撼。

    参数量达到5-6万亿,采用混合专家(MoE)架构设计。这意味着模型虽然庞大,但通过稀疏激活机制,实际推理时只调用部分专家网络,在性能和成本之间取得了精妙的平衡。

    更令人惊叹的是200万Token的上下文窗口支持。什么概念?这相当于能一口气读完两部《三体》全集,或者同时处理一个中型代码仓库的所有历史版本。这意味着GPT-6在处理长文档理解、复杂代码库分析、多轮对话一致性等场景时,将拥有前所未有的能力。

    官方数据显示,GPT-6在代码编写、推理分析、智能体任务上的性能较GPT-5.4提升约40%。这个幅度的提升,放在大模型迭代史上都属于重量级。

    技术架构:Symphony架构的融合美学

    GPT-6采用了全新的Symphony架构设计,这是OpenAI在架构层面的又一次创新。

    Symphony架构的核心特点在于”原生多模态统一”。不同于上一代模型需要多个专用模块分别处理文本、图像、音频,GPT-6从底层设计就实现了多模态的原生融合。文本生成、图像理解、声音处理不再是被”拼接”在一起的功能,而是真正在同一个语义空间中进行协同。

    据透露,Symphony架构采用了层次化注意力机制,能够高效处理超长序列的同时保持对关键信息的精准捕捉。这正是支撑200万Token超长上下文的底层技术基础。

    定价策略:略涨但仍有竞争力

    GPT-6的定价延续了OpenAI一贯的风格——不便宜,但比Claude Opus系列亲民得多。

    输入$2.5/MTok,与GPT-5.4持平;输出$12/MTok,比GPT-5.4微涨$2。在闭源旗舰阵营中,这个价格有一定竞争力,但远不是最便宜的选择。相比之下,Claude Opus 4.7的输入$5/MTok、输出$25/MTok,足足贵了一倍多。

    当然,最终的价格竞争力还要看实际表现。GPT-6能否在4月14日发布后,从Claude Opus 4.7手中夺回综合第一的位置?LMArena排行榜上,Opus 4.6已经稳坐了两个月的王座,这场龙虎斗才刚刚开始。

    API开放时间:6月见分晓

    尽管发布会引发轰动,但普通开发者还需要耐心等待。官方透露,GPT-6的API预计要到6月才向公众开放。这意味着:

    第一,GPT-6发布后的两个月内,主要是OpenAI的合作伙伴和企业用户在测试和适配;
    第二,真正的开放API竞争将在6月展开,届时各家的定价策略、实际性能对比都将更加清晰;
    第三,对于国内开发者而言,API访问的政策和可用性仍是未知数。

    内部定位:AGI的最后一公里

    一个值得玩味的细节是,OpenAI内部将GPT-6定位为”AGI的最后一公里”。

    这一定位的含义可以从几个层面理解:首先,从技术能力上看,GPT-6在代码、推理、Agent任务上的大幅提升,意味着AI已经能够在相当程度上”自主完成复杂任务”;其次,从架构设计上看,200万Token的上下文窗口让AI能够”记住”更多、更长的任务信息;最后,从应用场景上看,GPT-6有望在软件工程、科学研究、复杂决策等领域实现真正的”AI代理”能力。

    当然,”AGI”这个词汇在行业内始终存在争议。但无可否认的是,GPT-6代表了大模型发展的一个新高度。

    训练投入:20亿美元与10万张H100

    GPT-6的研发投入同样令人咋舌。

    OpenAI透露,GPT-6的预训练于3月17日完成,整个研发周期历时18个月。训练过程中,动用了约10万张H100 GPU,总耗资超过20亿美元。这个数字意味着什么?

    作为对比,OpenAI此前完成1220亿美元融资,其中相当一部分正是用于GPT-6的研发。大规模资本投入+顶尖硬件配置+长期研发周期,共同铸就了这款被寄予厚望的旗舰产品。

    竞争格局:GPT-6 vs Claude Opus 4.7

    GPT-6发布后,最直接的竞争对手当属Anthropic的Claude Opus 4.7。

    从已知信息来看,两款旗舰模型各有侧重:GPT-6的优势在于超长上下文和多模态原生融合,以及相对更亲民的定价;Claude Opus 4.7则在编程能力的第三方测试中表现更为稳定,视觉理解方面的突破也更为显著。

    真正的较量将在API开放后展开。届时,开发者社区会用自己的实测数据给出答案。

    写在最后

    GPT-6的发布,标志着大模型竞争正式进入”万亿参数+百万Token”的新阶段。这个阶段的竞争,已经不仅仅是参数规模的堆砌,更是对架构创新、训练效率、推理成本的全方位考验。

    对于整个AI行业而言,GPT-6的发布是一个重要的节点。它预示着AI能力的边界正在被进一步拓展,也为接下来半年的技术竞争设定了新的基准线。

    至于能否真的成为”AGI最后一公里”,时间会给出答案。

    相关阅读:

  • Claude Opus 4.7发布:视觉识别准确率跃升至98.5%,编程效率提升3倍

    Claude Opus 4.7发布:视觉识别准确率跃升至98.5%,编程效率提升3倍

    2026年4月16日,Anthropic正式发布了新一代旗舰大模型Claude Opus 4.7。从官方公布的数据来看,这次更新的力度远超市场预期——视觉识别准确率从54.5%飙升至98.5%,生产代码任务完成量是上代的3倍,编码评估解决率整体提升13%。这款被业界视为”AGI最后冲刺”的新模型,究竟带来了哪些突破?

    Claude Opus 4.7编程展示 - AI芯片与全息城市投影

    视觉能力:从”能看”到”看懂”的质变

    如果要从Opus 4.7的诸多升级中挑选最亮眼的一项,视觉能力的飞跃当之无愧。

    Anthropic在官方公告中专门提到了XBOW视觉敏锐度基准测试。Opus 4.6在这项测试中的得分是54.5%,而到了Opus 4.7,这一数字直接跳到了98.5%。这个提升幅度,放在AI模型的迭代历史里都算得上罕见。

    从具体能力来看,Opus 4.7支持最高约375万像素的图像输入,长边最长可达2576像素,是上一代的3倍以上。这意味着什么?如果你给它一张密密麻麻的复杂截图,或者一张包含大量数字的财务报表,它不仅能看清每一个细节,还能准确提取和理解其中的信息。

    对于需要处理设计稿、产品原型、复杂文档的用户来说,这一次升级几乎等于打开了一扇新门。设计师可以直接上传整张设计稿询问布局问题,产品经理能够一键解析原型图的结构逻辑,财务人员可以快速提取报表中的关键数据。

    编程能力:从”辅助工具”到”代码伙伴”

    另一个让开发者兴奋不已的突破,是Opus 4.7在软件工程方向的全面提升。

    官方给出的测试数据极具说服力:在CursorBench测试中,Opus 4.7的得分从58%提升到70%,进步了12个百分点;在Rakuten-SWE-Bench测试中,它完成的生产任务数量是Opus 4.6的3倍;在涵盖93项编码任务的综合基准中,解决率提升了13%,其中有4项任务是Opus 4.6和Sonnet 4.6都无法完成的,这次被成功攻克。

    Anthropic在公告中用一个案例来说明Opus 4.7的能力上限:它自主构建了一个完整的Rust语言文字转语音引擎,包含神经网络模型、SIMD内核优化,还配了一个可以运行在浏览器里的演示程序,最后用语音识别器自己验证输出结果是否正确。公司评价称,这相当于一位高级工程师几个月的工作量。

    当然,这类描述在AI公司的发布稿中并不罕见,实际使用效果因人而异。但从第三方测试数据来看,Opus 4.7的编程能力确实迈上了一个新台阶。

    指令遵循:更严格带来的”甜蜜烦恼”

    Opus 4.7在指令遵循方面也有显著改善。简单来说,用户说什么,模型就做什么,不会自作主张地跳过步骤或宽松解释意图。

    但这里有一个需要留意的地方:Anthropic专门在发布文档中提醒用户,之前针对Opus 4.6编写的提示词,在4.7上可能会产生意想不到的结果。原因正是指令遵循更严格了——旧版本会灵活变通甚至忽略的指令,新版本会一字不差地执行,反而可能导致输出与预期不符。如果开发者正在使用API,切换到4.7之前最好重新检查和调整一下提示词。

    这个”副作用”看似麻烦,实际上反映的是Anthropic对模型可控性的极致追求。更严格的指令遵循,意味着AI的行为更加可预测,更适合在对准确性要求严苛的生产环境中部署。

    记忆能力:长任务终于”靠得住”

    在多会话的长期工作场景中,Opus 4.7的记忆能力也得到了实质性改进。它更擅长利用基于文件系统的记忆机制,能在跨越多次对话的长时间工作中记住关键信息,下次启动任务时不需要重新交代大量背景。

    这对于需要AI持续参与的项目型工作尤为实用。比如一个持续推进几周的代码项目,或者需要多次迭代的长篇文档撰写工作,每次重新打开对话时,不必再把上下文背景重新粘贴一遍,AI已经自动”记住”了。

    Claude Code同步升级:新增代码超级审查

    与Opus 4.7同步发布的,还有一系列Claude Code(面向开发者的编程工具)更新。

    最引人注目的是新增的”/ultrareview”指令。开启这个模式后,Claude会以”专业代码审查员”的视角通读整个代码改动,标记出技术审核人员会关注的问题,而不仅仅是表面的语法错误或风格问题。Pro版和Max版用户每月可以免费使用3次。

    此外,之前只对团队版和企业版用户开放的”自动模式”(Auto模式),这次正式向Max订阅用户开放。在这个模式下,Claude可以自主做出更多决策,减少频繁打断用户确认的次数,同时比完全跳过权限控制的模式更加安全可控。

    安全机制:Project Glasswing的首款落地产品

    Opus 4.7是”Project Glasswing”计划下第一款应用新网络安全保障措施的模型。训练过程中,Anthropic专门尝试削弱模型在网络攻击方向的能力,同时部署了自动检测高风险网络安全请求的拦截机制。

    如果是有合法需求的安全专业人员,可以通过新推出的”Cyber Verification Program”(网络安全验证计划)申请使用相关功能,绕过部分限制。

    这一机制背后折射出一个现实:随着AI模型能力越来越强,如何防止它被用于网络攻击,已经成为主流AI公司必须面对的课题。Anthropic选择了一种更为审慎的路径——既保证模型能力的领先,又为高风险能力设置了专门的”阀门”。

    定价:维持不变,但分词器有变化

    对于开发者来说,一个好消息是:Opus 4.7的定价与上代完全相同——输入每百万token收费5美元,输出每百万token收费25美元。

    但有一个需要留意的变化:Opus 4.7换用了新的分词器,相同内容可能比之前消耗更多token,大约是原来的1.0到1.35倍。换句话说,名义上价格没变,但实际上同样的任务可能会花更多钱。Anthropic建议用户在实际流量中测量差异,并通过调整”effort”参数和任务预算来控制成本。

    目前,Claude Opus 4.7可以通过Claude的所有产品线使用,也支持Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry等云平台的API接入。

    写在最后

    Anthropic这次的发布时间点耐人寻味——就在谷歌、OpenAI都在加速发布新版本的当口,Opus 4.7选择了悄悄亮相,但用硬核数据说话。视觉能力近乎翻倍式的提升,加上编程任务3倍的效率增长,让它在当前这批主流模型中稳稳站住了旗舰级的位置。

    对于开发者而言,这或许意味着一个全新的编程范式正在到来——当AI不仅能写代码,还能看懂设计稿、理解复杂图表、自主完成代码审查时,”AI编程助手”这个概念本身,正在被重新定义。

    相关阅读: