AI领域快速发展引关注 | 2026年4月15日科技要闻

发布时间：2026-04-15 10:57阅读：16

美国国家科学基金会（NSF）近期公布2026年度研究生奖学金获奖名单，共计2599名研究生获得资助，创该奖项自1952年设立以来的最高纪录。该数字较2025年的低点（1500人）增长42%，同时超越2023年2554人的前峰值。学科分布调整尤为显著：工程学领域占比攀升至35%，跃居首位；生物学以19%位列第二；计算与信息科学（含人工智能方向）从2023年的7%提升至10%，体现出AI在科研资助中持续增强的影响力。同期，心理学奖项占比从5%-6%降至2%，生命科学在荣誉提名中占据40%。这一变化被看作是对2025年政策争议的正向反馈。往年，受白宫优先扶持人工智能与量子信息科学的影响，奖学金名单分两次公布，第二批500个名额高度集中于AI方向，引发学界对NSF可能压缩传统学科资助份额的忧虑。2026年奖项恢复至更贴近历史分布的格局，显示NSF在平衡国家战略需求与基础研究生态方面取得进展。奖学金每年为获得者提供3.7万美元津贴，并向其所在机构支付1.6万美元用于覆盖教育成本，其"可携带"特性（与特定导师或项目脱钩）为研究生提供了宝贵的研究自主权。 NSF今年收到近1.4万份申请，竞争程度可见一斑。尽管基金会已启动与企业合作支持未来获奖者的计划，但2026年度的资金将完全由国会拨款承担。此举不仅缓解了科研人才储备的焦虑，也为AI与其他学科的协同发展提供了制度保障。从长远看，奖项分布的变化可能影响美国科研人才流向，工程与AI领域的强化投入或加速关键技术突破，而生命科学在荣誉提名中的高占比则预示其未来竞争潜力。

具体指引详见 📖 https://www.science.org/content/article/nsf-names-record-number-graduate-fellows-rebounding-2025-dip

👤 作者：Jeffrey Mervis📅 发布时间：2026-04-13

近期，全球顶级人工智能会议NeurIPS（神经信息处理系统大会）因一项涉及中国研究人员的政策引发争议，导致中国科学技术协会（CAST）宣布抵制该会议，不再资助研究人员参会，并在重要学术评估中降低NeurIPS论文的权重。这一事件折射出中美在人工智能研究领域日益加深的分歧。争议始于3月23日，NeurIPS组委会最初表示将拒绝与“受美国制裁机构”有关联的研究人员提交论文，并引用了美国政府列出的中国科技企业名单，包括华为等以往会议赞助商。此举在学术界激起强烈反对，多国研究人员在社交媒体发声抗议。尽管NeurIPS后续道歉并大幅收窄政策范围，仅适用于极少数实体，但CAST仍坚持原有抵制决定，并将原计划用于NeurIPS的经费转向支持其他国内外会议与项目。分析指出，CAST的立场表明中国在高端AI研究领域已具备更强的自主性。数据显示，中国在AI学术产出方面占据显著优势：2025年12月NeurIPS会议上，中国机构的研究人员首次成为第一作者占比最高的群体（超过半数）；Digital Science2025年研究报告也证实，中国AI论文发表总量全球领先，人才规模“远超竞争对手”。专家认为，若中国研究人员全面退出，NeurIPS的学术质量将受重创。此次风波不仅反映国际学术合作受地缘政治影响的风险，也可能加速中美AI研究体系的分化。未来，中国可能更倾向于发展本土学术交流平台，而全球AI社区需在学术中立与政治约束间寻求平衡。

具体指引详见 📖 https://www.nature.com/articles/d41586-026-01058-x

👤 作者：Elizabeth Gibney📅 发布时间：2026-04-14

当前，视觉语言模型（VLMs）在诸多应用领域取得了显著进展，但在低层视觉感知任务，如空间理解和视角识别方面，仍存在明显瓶颈。研究认为，这一瓶颈可能源于自然图像数据集对这些视觉技能提供的监督有限。自然图像文本语料库虽然规模庞大，但未能系统性地覆盖鲁棒视觉感知所需的各种组合变化。因此，本文提出了一个核心研究问题：能否仅通过任务关键词（如“深度顺序”）生成针对性的合成监督数据，来弥补VLMs的这些弱点？为了探索这一问题，本研究引入了VisionFoundry，一个任务感知的合成数据生成流程。VisionFoundry的核心创新在于其端到端的自动化管道，该管道仅以任务名称为输入，无需参考图像或人工标注。它利用大型语言模型（LLMs）生成问题、答案以及文本到图像（T2I）提示，随后通过T2I模型合成图像，并利用一个专有的VLM进行一致性验证，形成一个闭环系统。这种方法确保了生成数据的任务针对性和质量可控性，同时显著降低了数据收集和标注的成本。基于此流程，研究团队构建了VisionFoundry-10K数据集，这是一个包含10个低层视觉感知任务（如空间理解、相对深度、视角变化）的合成视觉问答数据集，共计10,000个图像-问题-答案三元组。实验结果表明，在三个代表性的开源VLM模型（Qwen2.5-VL-3B-Instruct, Llama-3.2-11B-Vision-Instruct, MiMo-VL-7B-SFT）上对VisionFoundry-10K进行微调，能显著提升视觉感知能力。具体性能指标显示，在MMVP基准上提升了7%，在CV-Bench-3D基准上提升了10%。同时，模型在微调后保持了更广泛的多模态能力，并且随着合成数据量的增加，性能呈现出积极的缩放趋势。此外，研究还发现，同等规模的合成与自然数据混合训练优于纯自然数据子集，表明经过验证的合成监督提供了难以从有限真实数据中获取的互补信号。这项研究的意义在于，它证实了有限的、任务导向的监督是解决VLM视觉感知瓶颈的一个重要因素，并指出合成监督是朝着为VLMs进行更系统性训练的一条充满前景的路径，为未来高效、低成本地提升AI模型的底层视觉能力提供了新的方法论和应用前景。

具体指引详见 📖 https://arxiv.org/abs/2604.09531

👤 作者：Guanyu Zhou等📅 发布时间：2026-04-10 17:48:51 UTC

2026年4月14日，一场聚焦人工智能对经济与就业影响的高级别论坛在华盛顿特区举行。此次首届“AI与经济论坛”由谷歌与MIT FutureTech联合主办，汇集了经济学家、行业领袖、政策制定者及领域专家，旨在共同探讨如何引导AI对经济产生积极影响。论坛基于一个核心共识：AI带来的益处与风险并非必然，其最终影响取决于社会各界——包括企业、劳动者、政府与研究机构——能否构建新型合作范式。与会者将分享信息、识别认知差距，并为持续协作奠定基础。为支撑这一目标，论坛宣布启动两项关键举措。其一是“谷歌AI与经济研究计划”，该计划将通过深度合作模式推进前沿研究。项目包括邀请顶尖经济学家（如MIT的David Autor）担任访问学者，并透过Google.org资金与谷歌云资源支持全球学者开展跨行业研究。MIT学者Ben Armstrong与Julia Shah已发布的研究表明，最成功的AI应用模式在于减少重复劳动、促进员工学习与协作。研究计划还将获得诺贝尔奖得主Michael Spence等学术顾问的指导，重点课题涵盖生成式AI对知识工作者生产率的影响、AI代理经济学等。其二是大规模技能培训计划。谷歌宣布扩大其全球AI机会基金（1.2亿美元）的覆盖范围，并与多个机构合作推出三项新计划：与强生基金会合作培训乡村医疗工作者AI技能，以提升诊疗效率；支持“解锁学徒制”项目在全美新兴领域创造学徒岗位；与制造业研究所合作为4万名制造业员工提供AI技能培训。这些举措建立在谷歌已累计培训1亿人数字技能的基础上，包括近期针对全美600万教师推出的AI教育者系列培训。此次行动是谷歌“AI Works”倡议的组成部分，该倡议已在美国投入10亿美元用于AI教育及基础设施建设。论坛强调，实现AI经济潜力需政策与私营部门投资协同，谷歌已支持多项旨在评估AI经济影响、强化劳动力技能的法案。分析认为，此类跨部门协作标志着AI治理进入新阶段，其成果可能为全球数字经济转型提供范式参考。

具体指引详见 📖 https://blog.google/company-news/outreach-and-initiatives/creating-opportunity/ai-economy-forum/

👤 作者：James Manyika📅 发布时间：2026-04-14

人工智能公司MiniMax近日发布了其Agent产品的桌面端两项重要更新——Pocket功能（Beta版）和Computer Use功能，标志着AI智能体在操作电脑能力上取得重大突破。此次更新的核心价值在于解决了长期困扰AI助手的技术难题：如何让智能体突破命令行限制，直接操作用户电脑上的图形界面应用程序和内部系统。Pocket功能支持接入飞书、微信、企业微信、Slack等主流即时通讯软件，用户可通过IM远程唤醒智能体并下达指令，智能体在用户电脑上执行任务后将结果回传至原对话，实现了"智能体随身携带"的便捷体验。更为突破性的是Computer Use功能，它使智能体能够像人类一样观看屏幕、操作鼠标和键盘，直接操控各类本地软件，包括设计工具、内部报表系统、系统偏好设置等传统AI难以触及的领域。从技术实现层面看，MiniMax采用了创新的工具矩阵设计，将桌面操作拆分为四个独立的工具域：Desktop Control（桌面控制）、Window Manager（窗口管理）、Browser Engine（浏览器引擎）和Clipboard（剪贴板），共计60多个工具组合。这种模块化设计相比传统的统一computer工具方式，显著提升了操作精度和可靠性。在视觉感知方面，公司解决了不同显示器分辨率适配的难题，通过相对坐标系统和自适应截图处理，确保智能体在各种屏幕上都能准确识别界面元素。此外，创新的"截图-验证-行动"循环机制有效保障了多步任务的可靠性，每一步操作后都会自动验证执行效果，出现问题时能够自动诊断并尝试替代方案。在安全管控方面，MiniMax建立了完善的权限管理机制，特别是针对远程操作场景。当智能体准备执行文件删除等敏感操作时，会通过IM向用户请求授权，确保用户对每个关键动作保持完全的控制权。这一设计既保证了使用的便捷性，又消除了远程操控的安全隐患。此次更新对AI行业具有深远影响，它打破了AI助手长期局限于命令行操作的瓶颈，将AI的应用范围扩展到用户真实的电脑桌面环境。随着CLI覆盖API化部分、Computer Use接管图形界面部分、IM作为统一指令入口的技术架构成型，AI智能体正在向成为真正的"数字员工"迈出关键一步。这不仅将极大提升个人用户的工作效率，更将为企业级AI应用开辟新的可能性，特别是在需要跨多个软件协作的复杂工作流程自动化方面。虽然该技术仍处于早期阶段，在复杂界面识别精度和长任务稳定性方面仍需完善，但这一突破无疑为AI智能体的未来发展指明了方向。

具体指引详见 📖 https://mp.weixin.qq.com/s/dmF0PRj6OMQ-TWAIoc-kqg

👤 作者：MiniMax 稀宇科技📅 发布时间：2026-04-14

近日，一项关于AI科学家的突破性研究在权威学术期刊《自然》上发表，标志着人工智能在自主科学研究领域取得了里程碑式的进展。该研究通过严谨的实验设计，首次量化地证明了基础AI模型性能的提升能够直接导致其生成科研论文质量的改善，这一发现为理解AI在科学发现中的作用提供了关键的实证依据。研究团队在实验中系统性地追踪了不同规模AI模型的输出，发现随着模型能力的增强，其生成的论文在逻辑严谨性、数据分析和创新性方面均有显著提高，初步揭示了一种"科学研究的缩放定律"。这一成果不仅验证了AI参与高水平学术研究的可行性——研究团队将其比喻为在科学领域通过了一项"图灵测试"——更重要的是，它建立了一个可量化的框架，用于评估和预测AI驱动科研的未来发展路径。当前，AI科学家系统仍面临诸多挑战，例如如何确保生成内容的真实性和原创性，以及如何与现有科研伦理规范接轨。为此，研究团队在项目中采取了多项负责任的前瞻性措施，包括为AI生成的论文添加数字水印以追溯

← 上一篇：生成式AI革新公卫防控模式下一篇：哈尔滨日报丨构建共性安全体系引领人工智能产业新格局抢占上游核心技术助力战略新兴产业升级 →