MoE架_标签-酷阅新闻

AI科研日报 | 自主生物医学Agent最新动态

扫描时间：2026-07-11 09:50 (Asia/Shanghai) 数据源：arXiv、PubMed、产业新闻覆盖方向：AI/ML、计算机视觉、NLP、生物医学+AI 交叉核心亮点：关键结论：核心创新：关键结果：核心优势：愿景与意义：7月9日多方消息透露，OpenAI计划发布GPT-5.6，推理速度达到750 Tokens/s，可能采用覆盖100张晶圆的全新架构。大模型推理效率竞争迈入新阶段。腾讯混元团队推出Hy3模型，基于MoE架构，总参数量295B、激活参数量21B。幻觉率从12.5%下降至

2026-07-11 14:12:16 | 7 阅读

视频模型学会穿墙术?蚂蚁开源具身智能视频底座:画面精美还不够,还得懂物理因果

当你让视频模型生成"往杯子里倒水"的场景，效果细腻到无可挑剔：水流的光泽、玻璃的折射、光影的层次，全都恰到好处，仿佛请来了一流灯光师亲自操刀。结果水直接穿透了玻璃杯壁，扬长而去，一滴都没留下。动作干脆利落，毫无违和感，液体仿佛拿到了穿墙特批。这类翻车，2026年一批主流视频生成模型几乎无一幸免。画面精美到能以假乱真，物理逻辑却连半秒都经不起推敲。科技账号AI Frontliner把这段对比发到了X上，配文判断很直接："It looks perfect and the physics is nonsense

2026-07-11 01:55:34 | 13 阅读

华为首度公开美团万亿参数大模型部署方案：昇腾A2推理仅20毫秒

快科技7月6日消息，华为CANN（昇腾AI异构计算架构）团队首次公开披露了美团万亿参数大模型LongCat-2.0在昇腾A2芯片上的完整部署方案。 LongCat-2.0，总参数量达1.6万亿，原生支持100万Token超长上下文。该模型是业界首个完全基于国产算力完成训练与推理全流程的万亿参数模型。此次公开的部署细节显示，LongCat-2.0基于昇腾Atlas A2 192卡集群部署，单机16卡。Prefill阶段采用64张昇腾A2协同调度，Decode阶段采用128卡超大规模专家并行EP部署。昇腾

2026-07-07 00:59:12 | 14 阅读

腾讯混元Hy3正式亮相

新浪科技讯 7月6日下午消息，腾讯混元Hy3 正式发布。相比preview版本，它展现出显著强于同尺寸模型且比肩（参数规模2—5倍的）旗舰模型的智能水平，定价进一步降低，总体稳定性和性价比大幅提升。Hy3已在WorkBuddy/CodeBuddy、元宝、Marvis、ima等多个业务接入，API已在腾讯云TokenHub上线，多个海外API平台也将陆续接入。据介绍，Hy3是一个快慢思考融合的模型，采用 MoE 架构，总参数 295B、激活参数 21B，支持 256K 上下文长度。4月23日发布的Hy3

2026-07-06 22:54:29 | 8 阅读

本周AI学习目标

LongCat-2.0基于MoE架构构建，拥有1.6万亿总参数，每个Token激活参数约480亿，原生支持100万级别的超长上下文窗口，能够一次性处理百万字级别的输入内容。该模型深度适配了Claude Code、OpenClaw、Hermes等主流Harness框架，在编程任务方面表现卓越。OpenRouter平台总调用量已升至全球前三，性能表现接近Claude Opus 4.6今年4月末，美团低调推出了LongCat-2.0-Preview版本，以匿名方式接入全球最大的大模型API路由平台OpenRou

2026-07-06 15:40:23 | 12 阅读

AI日报|美团发布LongCat-2.0开源模型性能超越GPT-5.5,研究揭示AI学习成本被低估

📏 全文约1300字 | ⏱️ 阅读约3分钟 | 📅 统计截至2026年7月6日🔥 今日热点7月5日，美团正式发布LongCat-2.0并实现全面开源，采用MIT许可证，公开了模型权重与推理代码。该模型采用MoE架构，总参数量达1.6T，每次激活约48B参数，支持100万token上下文窗口。真正引发行业关注的是其 benchmark 表现：SWE-bench Pro达到59.5，超越GPT-5.5的58.6；BrowseComp 79.9，Terminal-Bench 70.8。这表明在代码编写和浏览器

2026-07-06 07:53:07 | 15 阅读

禁令挡不住：中国AI新星U2强势崛起

又封禁了，又他X的封禁了。美国人工智能公司Anthropic旗下两款最新大模型Fable和Mythos对外国公民实施全面封锁访问权限，甚至连公司的外籍员工都被拒之门外……你封你的，我们干我们的。1中国AI惊艳亮相一边是美国AI闭门造车，另一边，中国AI惊艳亮相。"港股AGI第一股"云知声在本月早些时候推出了其最新通用大语言模型U2。一经问世便登顶巅峰。基于快慢思维融合的MoE（混合专家）范式打造，与大多数同行堆砌参数、堆砌Token的路径截然有异，从而达成了"小参数强能力、少Token高产出、低算力低成本

2026-06-21 22:34:48 | 15 阅读

AI顶尖人物最新洞察 | 2026年5月20日行业风向标

AI界从来不缺热点与深度思考。今日多位顶尖专家分享了对人工智能发展的最新见解：从MoE架构的效率提升，到世界模型的发展路径，再到算力投入的指数级增长，这些前沿观点值得我们仔细研读。X 🔥 热度指数👉 MoE架构的核心在于高效激活机制Karpathy在研读完GPT-5的推理实现后，对MoE路由优化印象深刻。在MoE架构中，每个token仅需激活少数专家模块，GPT-5中每个token仅激活2/128的专家，但性能依然卓越。他想传达的核心观点是：模型不一定要更大，关键是架构设计更高效。这给我们一个重要启示：未

2026-06-11 08:30:52 | 12 阅读

AI大牛观点集锦：2026年6月顶级研究者的前沿思考

人工智能领域从来不缺乏关注点和深度思考。近期，多位行业领军人物分享了他们对AI未来的最新见解：无论是MoE架构的效率提升，还是世界模型的发展路径，亦或是算力投入的指数级增长，这些顶级专家的观点都值得我们细细品味。X 🔥 热度指数👉 MoE架构的核心在于高效激活在审阅GPT-5的推理代码后，Karpathy对MoE路由的优化印象深刻。在MoE架构里，每个token仅需激活少量专家，GPT-5中每token仅激活2/128的专家，却展现出惊人效果。他强调的重点并非单纯增大模型，而是提升架构效率。这启示我们：未

2026-06-01 08:58:32 | 17 阅读

AI顶尖人物洞察 | 2026/5/20 - 业界领袖最新思考

AI领域从来不缺乏热点和深度思考。今日多位顶尖专家分享了对AI未来演进的最新看法：从MoE架构的效率提升，到世界模型的发展路径，再到算力投入的指数级增长，这些业界领袖的洞见值得我们仔细研读。X 🔥 热度指数👉 MoE架构的核心在于精准激活仔细研究完GPT-5的推理代码后，Karpathy最受触动的是MoE路由的改进。在MoE架构中，每个token仅需激活少数专家，GPT-5里每个token仅激活2/128的专家，却依然表现出色。他想传达的核心并非模型规模，而是架构的效率提升。这给我们一个重要启示：未来AI

2026-05-30 18:33:01 | 18 阅读

端侧AI新突破：国产技术实现手机运行大模型的高效压缩

一个 8B 参数的大模型，通常需要约 16GB 显存。参数越多，越吃显存，这就是为什么，内存价格一天比一天高。现在，有一种方法，可以省下 6 倍显存，却几乎不损耗模型性能。过去两年，围绕这个看似极端的思路，一条全球性的技术竞赛正在成型。而就在这条赛道上，一个完全基于国产算力的方案，刚刚给出了自己的第一个回答。模型被压到了不到 3B，同时，能力却可以保留 97%，甚至更进一步，如果结合 MoE 架构，未来可以直接在一部 8GB 内存的手机，运行 600 亿参数的大模型。听上去匪夷所思，怎么做到的？

2026-05-25 22:44:42 | 13 阅读

AI智能体日报 | 2026-05-14

导语DeepSeek V4开源发布逼近GPT-5.5性能，Claude Code速率限制翻倍，Apple开放AI Agent上架App Store——开源模型逆袭、编程工具提速、生态入口打开，三件事搞清楚，明天比同行早一步。开源大模型正式进入「性能不妥协、成本砍六分之一」的新阶段，AI编程工具可用性也迎来翻倍提升。01 · DeepSeek V4开源发布：1.6万亿参数MoE逼近GPT-5.5，成本仅六分之一DeepSeek正式发布V4模型，采用1.6万亿参数混合专家架构，性能接近GPT-5.5和Clau

2026-05-14 07:18:03 | 17 阅读

2026年4月26日AI周刊：聚焦本周重磅AI动态

采用万亿参数MoE架构，百万Token上下文成为新标准。完美兼容华为昇腾910B与寒武纪MLU硬件，达成全栈自主化，彻底切断对英伟达CUDA的依赖。成本仅为GPT-5.5的百分之一。OpenAI推出GPT-5.5，强调“解决实际工作难题的智能”，拥有200万Token上下文窗口，仅需少量指令即可自主处理多步复杂流程。其API价格大约是DeepSeek V4的100倍。月之暗面推出Kimi K2.6并宣布开源。在国际SWE-Bench Pro代码评测中斩获58.6分，大幅领先GPT-5.4的57.7分，首次

2026-04-26 16:03:21 | 30 阅读

小米MiMo大模型：AI推理赛道上的新锐力量

由小米自主研发的MiMo人工智能大模型体系，专攻推理效率，被视为AI推理赛道的后起之秀，强调轻量架构与卓越性能。该体系专注于数学计算、程序开发等高难度逻辑处理，用较小参数量达成超越级别的表现。根据北京研精毕智市场研究指出，首代7B模型依靠独特训练方法，推理成绩胜过众多32B规模模型。进阶版MiMo-V2系列运用MoE混合专家架构，涵盖旗舰型、全模态、语音交互三大形态，平衡计算能力与部署成本。MiMo具备更快的推理速率、更低的功耗及更短的响应延迟，可处理超长文本上下文。全系模型开放源代码，支持云端服务器与终

2026-04-16 11:55:01 | 25 阅读