5月20日 AI前沿动态盘点
AI技术进展
知名AI专家Andrej Karpathy加入Anthropic。Andrej Karpathy重返大语言模型一线研发工作,他曾因Claude Opus 4.5的冲击而焦虑,认为AI发展迅速。
华为主任工程师郭威分享生成式推荐系统落地实践。该实践基于昇腾NPU,通过FuXi-α/β模型、多阶段统一建模及Performance Law等创新,解决了千亿级参数模型的高效训推难题。
Odyssey公司发布Agora-1世界模型。Agora-1首次实现多人联机FPS游戏,通过仿真与渲染解耦,在AI生成世界中支持多达四名玩家实时交互。
上海人工智能实验室发布30B-A3B模型。该模型通过统一后训练和推理时扩展,在IMO、USAMO、IPhO等奥赛中达到金牌水平,无需外部工具或代码执行。
DeepMind研究员Lun Wang指出评估是AI模型瓶颈。Lun Wang认为现有评估体系无法预测模型跨入新能力区间时的质变,需构建自我进化的评估系统。
Anthropic首次公开Claude Code在大型代码库中的部署打法。Anthropic强调其Agent式搜索机制与RAG不同,并通过CLAUDE.md文件、钩子、技能、插件等harness扩展点提升导航和性能。
Anthropic发布AI原生初创企业操作手册。该手册将创业拆解为想法、原型、上线、规模化四个周期,强调利用大模型构建商业护城河,创始人洞察力成为核心壁垒。
小红书研究团队推出HyperEyes模型。HyperEyes通过统一定位与搜索动作空间、并行可学习数据及双粒度强化学习,将多模态搜索从串行转变为并行,大幅提升效率与准确率。
清华大学发布ProteinOPD框架。ProteinOPD旨在解决蛋白质偏好对齐中的多目标难题,通过多教师OPD和几何共识分布,高效生成具特定性质的蛋白序列。
大语言模型架构围绕长上下文推理进行创新。Gemma 4、Laguna XS.2、ZAYA1-8B、DeepSeek V4等模型通过KV共享、分层预算、压缩注意力等技术实现效率提升。
京东与中科院信工所发布Self-Taught RLVR系列研究。该研究通过三篇论文探索大模型“自我指导”的迭代演化,聚焦RLSD、NPO、CoPD三个互补维度,旨在引入更有效的学习信号。
中山大学等联合发布SeePhys Pro框架。SeePhys Pro旨在细粒度评测多模态物理推理中的视觉理解与训练收益,并揭示当前模型在模态迁移中的瓶颈。
伯克利团队发布FST框架。FST通过快慢分层机制,解决了大模型持续学习的“灾难性遗忘”难题,使模型能像人脑一样“温故知新”。
微软开发4B参数小模型Terminus-4B。Terminus-4B能替代昂贵大模型处理终端执行任务,通过SFT和RL训练,将主模型Token消耗降低近30%,且性能未衰减。
两大开源Agent框架Hermes Agent和OpenClaw更新。Hermes Agent实现订阅转API,让ChatGPT Pro、Claude Pro等服务零成本驱动工具链,Grok也全面杀入Agent生态。
强化学习之父R.S.Sutton提出Intentional Updates机制。该机制实现内存消耗降低10-100倍且性能SOTA,文章还梳理了强化学习21个前沿方向及238种创新思路。
耶鲁大学AI系统MOSAIC颠覆化学合成。MOSAIC将化学知识划分为2498个领域,每个领域训练一个专家模型,在35种新化合物合成中成功率达71%。
Cursor发布Composer 2.5模型。Composer 2.5旨在提升AI编程长任务能力,通过强化后训练,以1/10成本实现接近Claude Opus 4.7的基准测试成绩。
大模型推理时“边想边说”成为可训练策略。新研究提出Side-by-Side交错推理,让模型学习何时披露已受支持的答案片段,显著缩短用户等待时间。
科技公司动态
AMD首次在上海举办AI开发者大会。CEO苏姿丰指出AI正重塑计算的每一层,竞争焦点转向系统工程与全栈优化能力,AMD持续加码中国市场。
AMD AI 开发者日上苏姿丰与李开复对话。李开复强调AI 转型需由 CEO 驱动,并提出“DRI”(直接负责人)将是企业核心,智能体将改变企业运营。
苹果WWDC 2026大会将发布AI新进展。大会预计发布iOS 27、macOS 27等新系统,更新重心将放在AI和Siri重构上,并着重优化系统性能。
AMD CEO苏姿丰表示中国市场是AMD路线图的核心。苏姿丰强调AI应无处不在,并押注Agentic AI,预计未来全球AI活跃用户将超50亿。
边缘AI推理芯片公司SiMa.ai拟融资超1亿美元。SiMa.ai正洽谈融资超1亿美元,估值达14亿美元,其低功耗专用芯片应用于无人机、机器人等设备。
百度2026年Q1财报显示AI业务收入首次过半。百度AI业务收入达136亿元,占一般性业务收入的52%,其中AI云收入增长79%,GPU云收入增长184%。
AI Agent与具身智能
华为开源AI Agent平台JiuwenSwarm发布。JiuwenSwarm将AI Agent从“单兵作战”推向“群体协同”,通过“协同工程”理念和全栈技术体系,让AI Agent高效协作、自主演进。
摩尔线程发布国产具身智能仿真平台MT Lambda。MT Lambda首次实现Sim-to-Real真机验证,打通“大模型训练—仿真模拟—端侧部署”全链路,为具身智能提供物理AI基础设施。
前地平线高管牛建伟成立叮当动力。叮当动力专注空间智能,获地平线数千万元投资,致力于让机器人学会思考,并提出“空间智能大模型+物理Agent”架构。
深度机智发布具身通用智能基座模型。深度机智凭借“人类第一视角”数据构建的基座模型,在WorldArena赛事中夺冠,标志着具身智能竞争重心转向数据生成。
AI产品与应用
初创公司帧跃科技完成千万美金天使轮融资。帧跃科技由前华为专家创立,专注于AI交互式视频赛道,计划2026年下半年发布平台级产品Leadde。
摩尔线程发布首款消费级智能硬件MTT AICUBE。AICUBE定位家庭AI中枢,整合AI Agent、AI PC、AI NAS三大核心能力,旨在解决家庭智能设备碎片化痛点。
腾讯推出操作系统层级个人AI助手Marvis马维斯。Marvis通过六个Agent将电脑变为可操控搭档,已覆盖Windows PC与Android手机端,未来将支持iOS和macOS。
“律动节拍”获超千万融资,提供AI演出行程管家服务。“律动节拍”聚焦“因演出行”垂直领域,提供AI演出行程管家服务,解决跨城观演痛点。
灵光App推出“闪应用”功能。“闪应用”使OPC(一人公司)创业者能用自然语言在秒级内完成应用原型验证,大幅降低了创意验证成本。
“整点贝果”能实时生成互动内容。由大千科技开发的“整点贝果”能实时生成互动内容,并基于手机实现数字空间构建,AI内容产品已从效率工具转向内容形态重构。
中国光帆科技开售AI全感穿戴设备。光帆科技发布带摄像头的AI耳机和AI手表,实现多模态自然交互,成为全球首家量产此类产品的公司。
国家反诈中心App上线AI内容鉴定功能。该功能结合小模型与大模型,旨在提升反诈能力。
AI Scientist在药企数据分析中表现远超人类实习生。全球首个生物医药过程级评估框架BiomniBench显示,AI完成任务速度快、成本低,但仍需人类协助进行生物学解释。
其他
DeepSeek疑似出现漏洞。DeepSeek被曝存在漏洞,可“偷窥”用户对话信息;泡泡玛特创始人向母校捐赠20亿Token引争议;Meta计划全球裁员10%。
教宗利奥十四世将发布首份AI主题通谕。教宗将与Anthropic联合创始人Chris Olah同台,梵蒂冈同步成立AI委员会,旨在填补AI治理真空。
群核科技空间智能大模型通过备案。群核科技空间智能大模型正式通过备案,成为国内首批完成合规备案的空间智能大模型之一,标志其服务符合监管要求。
AI黄牛通过“AI中转站”倒卖海外大模型服务。AI黄牛将海外大模型服务高价倒卖给国内用户,月流水可达百万,但存在模型降级、价格不透明和数据泄露等风险。
TapTap“聚光灯计划”首次落地广州。TapTap联合APPSO AIDONE共同发起活动,旨在见证AI赋能下的创意诞生,使“人人做游戏”成为可能。