斯坦福AI年度报告：技术、应用与未来趋势洞察

发布时间：2026-05-01 10:54阅读：22

1. AI在复杂测试中的表现日益精进。2023年，研究者们引入了MMMU、GPQA和SWE-bench等新的评测标准，以挑战先进AI系统的极限。仅一年过去，其表现已显著飞跃：在MMMU、GPQA和SWE-bench上的得分分别提升了18.8、48.9和67.3个百分点。此外，AI在生成高质量视频方面取得了突破性进展，部分情况下，语言模型智能体甚至能在限定时间内完成编程任务，表现超越人类。

2. AI正加速融入我们的日常生活。从医疗保健到交通出行，AI正迅速地从实验室走向现实。2023年，美国FDA批准了223款由AI驱动的医疗设备，远超2015年的6款。在交通领域，自动驾驶汽车已不再是概念：美国主要运营商之一Waymo每周提供超过15万次无人驾驶出行服务，而百度的Apollo Go自动驾驶出租车队已在中国多个城市投入运营。

3. 企业全面拥抱AI，带动了创纪录的投资和应用，研究持续证实其显著的生产力效益。2024年，美国的私人AI投资额飙升至1091亿美元，几乎是中国的93亿美元的12倍，英国的45亿美元的24倍。生成式AI尤其势头强劲，全球私人投资额达到339亿美元，同比增长18.7%。企业AI应用也在加速普及：2024年，78%的企业报告使用AI，高于前一年的55%。同时，越来越多的研究表明AI能提升生产力，并在大多数情况下帮助缩小劳动力技能差距。

4. 美国在顶级AI模型开发方面依然领先——但中国正在快速缩小性能差距。2024年，美国机构发布了40个知名AI模型，而中国为15个，欧洲为3个。尽管美国在数量上保持优势，但中国模型已迅速缩短了质量差距：在MMLU和HumanEval等关键基准测试上，性能差异从2023年的两位数缩小到2024年的接近持平。中国在AI论文和专利方面持续领先。模型开发正日益全球化，中东、拉丁美洲和东南亚均有重要发布。

5. 负责任AI的生态系统发展呈现不均衡态势。AI相关事件急剧增加，但主流工业模型开发者中标准化的负责任AI评估依然罕见。然而，HELM Safety、AIR-Bench和FACTS等新的基准测试为评估事实性和安全性提供了有前景的工具。在企业层面，认识到负责任AI风险与采取实质性行动之间仍存在差距。相比之下，政府正表现出日益增强的紧迫感：2024年，全球AI治理合作得到加强，包括OECD、欧盟、联合国和非洲联盟在内的组织发布了聚焦透明度、可信度和核心负责任AI原则的框架。

6. 全球对AI的普遍乐观情绪正在上升——但地区间的深刻分歧依然存在。在中国（83%）、印度尼西亚（80%）和泰国（77%）等国家，绝大多数民众认为AI产品和服务利大于弊。相比之下，加拿大（40%）、美国（39%）和荷兰（36%）等地的乐观情绪仍然相对较低。不过，公众态度正在发生转变：自2022年以来，包括德国（+10%）、法国（+10%）、加拿大（+8%）、英国（+8%）和美国（+4%）在内的多个此前持怀疑态度的国家，乐观情绪显著增长。

7. AI正变得更加高效、经济且易于获取。在能力日益增强的小型模型推动下，达到GPT-3.5水平的系统的推理成本在2022年11月至2024年10月间下降了超过280倍。在硬件层面，成本每年下降30%，而能源效率每年提升40%。开放权重模型正在缩小与闭源模型的差距，在某些基准测试上，性能差距在一年内从8%缩小至仅1.7%。这些趋势共同作用，正迅速降低先进AI技术的准入门槛。

8. 政府正通过监管和投资双管齐下，加大在AI领域的投入。2024年，美国联邦机构推出了59项与AI相关的法规——是2023年的两倍多——且发布机构数量也翻了一番。全球范围内，75个国家的立法中提及AI的次数自2023年以来增长了21.3%，较2016年增长了九倍。随着关注度的提升，各国政府正进行大规模投资：加拿大承诺投入24亿美元，中国启动了475亿美元的半导体基金，法国承诺投入1090亿欧元，印度承诺投入12.5亿美元，而沙特阿拉伯的“超越计划”（Project Transcendence）则是一项价值1000亿美元的倡议。

9. AI和计算机科学教育正在扩展——但获取途径和准备程度的差距依然存在。目前，三分之二的国家提供或计划提供K-12（幼儿园到高中）计算机科学教育——是2019年的两倍——其中非洲和拉丁美洲进步最为显著。在美国，过去十年获得计算机学士学位的毕业生数量增长了22%。然而，由于电力等基础设施的短缺，许多非洲国家的教育获取途径仍然受限。在美国，81%的K-12计算机科学教师认为AI应成为基础计算机科学教育的一部分，但不到一半的人觉得自己有能力教授AI。

10. 产业界在AI领域取得飞跃性进展——但前沿差距正在逐渐缩小。2024年，近90%的知名AI模型出自产业界，高于2023年的60%，而学术界仍然是高被引研究的首要来源。

← 上一篇：尽调资料太乱？用归纳与疑点提示做AI实操智能体下一篇：AI助力图片转CAD，告别熬夜描图新时代 →