美大学发布报告：中美AI模型性能差距缩小񑎀.7%

发布时间：2026-04-25 17:35:36 作者：玩站小弟

我要评论

　　长春1月7日电 (金乔刘栋)6日晚，2025-2026。

　　美国斯坦福大学发布《2026年AI指数报告》

　　中美AI模型性能差距缩小񑎀.7%

《2026年AI指数报告》封面。图片来源：美国斯坦福大学以人为本人工智能研究所官网

　　本报记者张佳欣

　　近日，美国斯坦福大学以人为本人工智能研究所发布了《2026年AI指数报告》。这�页的年度报告对人工智能(AI)在能力、投资、就业、应用等方面进行了系统梳理。

　　中美差距几乎消失

　　最引人关注的发现之一，是中美两国在AI模型性能上的差距已几乎消失。

　　报告指出，�年初以来，两国模型已多次交替登顶性能榜单。过去一年来，这一差距虽有波动，但始终保持在个位数。2025𻂊月，中国“深度求索”公司的DeepSeek-R1曾短暂追平美国最佳模型。

　　截�𻂋月，美国顶尖模型Claude Opus 4.6的Elo评分�，而中国顶尖模型紧追其后，差距仅񀙜.7%。

　　报告指出，美国在基础模型创新、资本投入和算力基础设施上仍保持领先。美国拥�个数据中心，是其他国家�倍以上。与之同步的是，其能源消耗量也位居世界第一。

　　相比之下，中国在科研产出与产业应用方面表现更为突出。报告显示，中国在论文发表量、引用次数以及专利产出方面均处于领先地位，在工业机器人(物理AI领域)部署数量上也位居世界前列，占全球装机量�%。越南媒体vietnam.vn网站指出，这反映出中国AI技术在制造业领域的快速发展，也体现了中国在AI领域的长期投资战略以及政府、企业和科研机构之间的紧密合作。

　　美国AI人才吸引力下降

　　长期以来，美国是全球AI人才的“引力中心”，但这一优势正在快速消退。

　　报告指出，�年以来，移居美国的AI学者数量下降�%，且仅在过去一年中就锐减�%。

　　尽管美国仍是全球AI研究人员最多的国家，但支撑这一优势的“人才流入”正在枯竭。对于那些习惯于顶尖研究者自然流向美国公司的企业来说，这一假设已不再稳固。

　　与此同时，全球AI竞赛已不再是部分大国之间的“擂台赛”，韩国已成为全球“创新密度”最高的国家，人均专利申请量领跑世界。

　　随着各国竞相布局，“主权AI”已成为许多政府的首要政策考量。过去一年，一些欧洲和中亚国家对其AI基础设施进行了大量投资，使得拥有“国家支持的超级计算集群”的国家达�个。但报告警告，南美和中东国家在AI基础设施上落后，可能引发新的“数字鸿沟”。

　　AI“偏科”严重

　　报告指出，生成式AI𶞓年内达到了全�%的人口使用率，普及速度快于个人电脑和互联网。然而，AI能力的进步并非均衡发展。

　　谷歌的Gemini Deep Think模型�年国际数学奥赛中，�分(满�分)的成绩夺得金牌，能𶞔.5小时内用自然语言完成端到端的解题。然而，在专门测试时钟识别的ClockBench上，顶尖模型正确读取指针时钟的概率仅�.1%，而人类�.1%。

　　“AI能赢得数学奥赛金牌，却仍然无法可靠地读取时间。”报告用“锯齿状智能”来形容这种能力分布的不均衡。

　　在其他领域，进步同样显著。AI智能体处理现实世界计算机任务的成功率，�个月前�%跃升�𻂋月�%，距离人类表现仅𺭒个百分点。在网络安全任务上，AI智能体解决问题成功率�年�%飙升�%。

　　然而，从数字世界跨入物理世界，AI的能力急剧衰减。机器人在软件模拟环境中的成功率可�.4%，但在真实的家务任务(如叠衣服、洗碗)中，成功率骤降�.4%。可见，整洁的实验室与凌乱的家居环境之间，隔着一道难以逾越的“鸿沟”。

　　AI对就业的影响显现

　　AI对就业的影响正在显现。报告发现，生产率提升明显的领域，往往也是初级岗位减少的领域。

　　在美国，22—25岁的软件开发人员就业率�年以来下降了�%，而年长从业者数量增加。类似情况也出现在客户服务领域。企业调查显示，计划中的裁员规模已超过近期实际裁减幅度。

　　然而，当就业市场对年轻人的“大门”开始收窄时，教育体系却尚未教会他们如何与AI共处。报告发现，4/5的美国高中生和大学生已经在使用AI完成学业任务，主要用于研究、论文编辑和头脑风暴，但只有一半的中小学制定了AI使用政策，𱎸%的教师表示这些政策是清晰的。

　　全球范围内，超�%的国家已提供计算机科学课程，但AI教育推进较慢。中国和阿联酋已开始将AI纳入必修课程。

　　最强AI模型透明度下降

　　当AI能力越来越强，我们对它的了解却越来越少。报告中的“基础模型透明度指数”平均得分，从上一年�分骤降�分。IBM�分领跑，而xAI的Grok和Midjourney仅�分。

　　能力最强的模型往往披露的信息最少。超�%的知名AI模型由私营公司创造，但许多公司不再披露训练数据集大小、参数数量或训练时长。去年发布�个知名模型中，�个未公开其训练代码。

　　报告还披露了AI的环境成本。xAI公司训练Grok 4模型估计产生�吨二氧化碳当量，相当�辆汽车一年的排放量。AI数据中心的电力容量已�.6吉瓦，接近纽约州峰值用电需求。仅GPT-4o的推理用水量，就可能超�万人的饮用水需求。

【编辑:陈海峰】

Tag： {loop type="keywords" row='10' } {$vo.title}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

美大学发布报告：中美AI模型性能差距缩小񑎀.7%