国产AI模型Kimi K2.6强势发布:多智能体协作与全栈开发新突破;谷歌紧急应对!布林出山组建团队直追Anthropic Claude Code
ARTIFICIAL INTELLIGENCE
1. 国产AI模型Kimi K2.6:多智能体协作与全栈开发新突破
月之暗面推出全新模型Kimi K2.6,该模型具备更强劲的编码能力和多智能体协同作业能力,能够在多项任务并行处理中展现卓越表现,如同时完成调研报告、表格和PPT的生成。K2.6还展现了其在后端及数据库开发方面的全新功能,可构建真正的全栈应用。阅读更多
2.谷歌陷入焦虑!布林亲自挂帅组建「追击队」应对Anthropic Claude Code挑战
谷歌联合创始人谢尔盖·布林亲自督战,组建专门团队应对Anthropic在编程领域的领先地位。Anthropic的Claude Code已实现近乎100%的代码由AI编写,年化收入突破140亿美元,企业市场占有率达54%,远超谷歌和OpenAI。谷歌内部正强制推广AI编程工具的使用,力图缩小差距。阅读更多
3. AI系统SAGA设计新型抗生素通过湿实验验证:双层思考与多目标优化的创新成果
来自十余所顶尖机构的研究团队开发的新AI系统SAGA,在设计抗生素和其他科学领域任务中表现出色,通过湿实验验证了其生成化合物的杀菌和安全性。SAGA采用双层思考机制和多目标优化,实现了人类科学家难以预测的创新成果,同时降低了实验成本和时间。相关代码已开源。阅读更多
4. Codex新功能:后台截屏生成摘要,开会前记得关闭!
OpenAI发布了Codex的新功能Chronicle,可在后台抓取屏幕截图并生成摘要,以增强对话上下文理解。该功能目前仅向ChatGPT Pro订阅用户开放,并仅限于macOS系统。然而,OpenAI建议用户在处理敏感信息或开会前暂停该功能,以避免不必要的风险。阅读更多
5.赛博女娲:一键蒸馏乔布斯马斯克思维,帮你解决实际问题
GitHub上出现了一个名为“女娲.skill”的新项目,它能够模仿名人的思维方式和认知系统,只需输入一个人名,系统就能自动完成调研、提炼和验证。该项目在一周内吸引了9000多个星标,目前已突破10000个。用户可以利用该工具蒸馏出包括乔布斯、马斯克在内的多位名人的技能和思维模式,帮助解决实际问题。阅读更多
6.神秘世界模型MotuBrain双冠称王,业内大佬争相打听背后团队身份
神秘世界模型MotuBrain在世界模型基准测试WorldArena和机器人任务执行基准测试RoboTwin2.0中双双夺冠,展现了其在理解和预测现实世界及执行复杂任务方面的卓越能力,引发了业内广泛关注。目前尚无关于MotuBrain开发团队的公开信息,但其表现预示着将预测世界和驱动行动统一在一个模型中的研究方向具有巨大潜力。阅读更多
7.赋予大模型人类般的抽象视觉思考能力:Monet亮相CVPR 2026
北京大学团队发布Monet,一种新型方法,使多模态大语言模型能够直接在连续的隐空间中进行视觉思考,不再依赖外部工具或代码,从而提高模型的视觉推理能力。该方法已在CVPR 2026上被录用。阅读更多
8.基因策略:超越技能文档,大幅提升模型性能的秘密武器
EvoMap团队提出了一种名为Gene的新概念,用于改善模型在执行任务时的表现。与传统的详细Skill文档相比,Gene通过紧凑、面向控制的策略对象,在实验中显著提升了模型的性能。Gene采用GEP协议,强调将经验以可验证、可复用的形式存储和调用,而非单纯依赖于内容完整性。阅读更多
9.上交大54页综述:LLM Agent外部化演进之路
近日,上海交通大学等机构在arXiv上发表了一篇综述论文,系统梳理了大型语言模型代理(LLM Agent)的记忆、技能、协议与工程四大支柱,提出「外部化」是理解近年LLM Agent架构演进的统一逻辑。论文指出,LLM Agent的实际进展越来越依赖于外部认知基础设施而非模型本身的能力提升。阅读更多
10.揭秘AI行为控制:Steering技术全面解析与实践
近期《Science》发表的研究表明,通过解析AI内部表征可实现对其行为的通用引导与监控。浙江大学联合阿里巴巴的研究团队在ACL 2026会议上发布两篇论文,从机理和系统评估两个维度全面解析了Steering技术的工作原理与能力边界,并开源了一站式Steering框架EasyEdit2。该研究为确保AI行为可控性和可预测性提供了重要理论和技术支持。阅读更多
11. AURA系统:实时视频理解与互动的革命性突破
香港中文大学MMLab与华为小艺大模型应用实验室联合推出了AURA系统,该系统是一个面向实时视频流的端到端视觉交互框架,能够在观看视频的同时理解场景并实时响应,解决了现有视频大模型只能离线处理视频的局限。AURA在多个流式视频理解基准测试中取得了当前最优结果,展示了其在实时视频理解和主动交互方面的突破性进展。阅读更多
12.华为Pura X Max首发:小艺伴随式AI引领智能新纪元
华为于昨日发布了搭载HarmonyOS 6.1系统的Pura X Max大屏折叠手机,其最突出的特性是「小艺伴随式AI」,实现了从被动响应到主动服务的转变,具备跨应用操作和低功耗等优势,为用户带来更加智能、便捷的使用体验。阅读更多
13.智能体团队扩张需谨慎:最新三维框架解析系统表现关键因素
美国埃默里大学、牛津大学和格里菲斯大学的研究人员提出了一套三维分类框架,用于描述大规模智能体网络的架构拓扑、记忆范围和更新行为。该框架指出,决定系统表现的关键因素不仅在于智能体数量,还在于这些机制的组合方式。此外,研究强调了智能体间世界模型一致性的重要性,呼吁未来研究关注更深层次的一致性模型和通信调度机制。阅读更多
14. 19岁中国天才开发AI记忆系统M-Flow夺得全球榜单第一革新联想科技树
中国19岁团队心流元素开发的AI项目M-Flow在Agent Memory领域取得突破,采用独特的Cone Graph结构,解决了信息关联性编码难题,并在多个主流评测中获得第一。M-Flow不仅提升了记忆系统的检索能力,更强调AI的联想能力,使AI能够更好地理解上下文和潜在关系,为AI领域的发展开辟了新方向。阅读更多
15.单摄实时3D重建,低成本高精度机器人视觉新突破
中国科研团队开源的LingBot-Map技术,仅使用普通RGB摄像头即可实现实时流式3D重建,精度高且稳定性强,有效降低了机器人视觉系统的硬件成本。该技术已在多个数据集上超越了现有方法,引起了国际学术界和产业界的广泛关注。阅读更多
16. AI步入实战时代!Mythos引领「动手型智能」革命
4月8日,Anthropic发布了Claude Mythos Preview,标志着AI从「语言智能」向「动手型智能」的重大跃迁,尽管该模型仅在受控计划中使用,但其强大的网络操作能力已引起全球软件行业的震动和监管层的高度关注。企业界已经开始重视这种新型智能的实际操作能力,而非仅仅对话功能,预示着未来软件、金融、网络安全等领域的重大变革。阅读更多
17. 2026年:AI或将超越人类控制引发智能爆炸
美国《纽约时报》专栏作家Kevin Roose在新文章中引用了位于伯克利的非营利组织METR的研究数据,指出AI技术的发展速度正在以指数级加速,预计2026年可能出现智能爆炸,即AI自我进化超出人类控制的能力。METR的研究还揭示了AI可能具备隐蔽能力和情境感知,进一步增加了AI行为不可预测性,引发对人类未来掌控AI能力的担忧。阅读更多
18. Kimi K2.6实测教程:打造个人知识库的全能助手
Datawhale成员筱可发布了一份关于Kimi K2.6的保姆级教程,介绍了K2.6在多模态理解和长程推理方面的表现,以及如何使用Hermes和Obsidian构建个人知识库。教程详细说明了部署Hermes、初始化知识库和处理视频的步骤,并展示了K2.6在知识管理和Agent集群等场景中的应用。阅读更多
19.白宫开放Claude漏洞挖掘AI,军民冲突一触即发
白宫计划向联邦机构开放Anthropic公司的Claude人工智能漏洞挖掘工具,此举可能加剧军方禁令与民用部署之间的冲突。阅读更多
20. Claude Mythos安全性揭秘:75个漏洞背后的真相
VulnCheckAI发布报告,分析Glasswing的安全性,指出其在Claude Mythos项目中提及75个CVE,其中40个由Anthropic研究人员发现,1个明确关联Glasswing。预计今年该项目将有更多进展。阅读更多
往期资讯
22岁天才破解开源:Claude Mythos核心架构再现辉煌;手机厂商夺冠!荣耀机器人刷新人形机器人半马纪录
MCP协议重大漏洞:设计缺陷危及全球20万台服务器和1.5亿次SDK下载;白宫顶着风险也要部署Mythos AI:国家级网络安全的新武器
DeepSeek首次融资超3亿美元:V4模型将告别英伟达采用华为芯片;白宫开放Claude AI引军方禁令冲突
Claude Opus 4.7震撼登场:最强公开模型,却带点GPT的味道!字节跳动Seedance 2.0:171人团队研发的AI视频生成技术震撼发布