摩尔线程发布万卡集群,构建全栈智算生态
5月20日下午,在摩尔线程年度产品发布会上,公司全方位展示了“云-边-端”全栈智算矩阵:从万卡规模的夸娥集群,到搭载自研“长江”SoC的MTT AICUBE与MTT AIBOOK;从数字智能体“小麦”,到加速物理AI落地的MT Lambda仿真平台,再到持续进化的MUSA生态,宣布全面贯通“云-边-端”智能算力体系。 如今,万物智能化浪潮涌动,算力基石作用日益凸显。在智算基建方面,摩尔线程以夸娥(KUAE)集群为核心,打造高性能AI底座。据悉,夸娥万卡集群已成功部署,多项核心指标对标国际主流:Dense大
AI 蒸馏揭秘:究竟提炼了何种精华?
模型蒸馏绝非将大型模型简单压缩为 zip 文件,亦非机械地复制参数。它更像是一位“教师模型”通过大量解题、讲解与提供答案,利用这些成果去培育一个更小巧、成本更低且易于部署的“学生模型”。蒸馏看似神奇,但要真正理解它,只需厘清三个核心问题:依据什么进行蒸馏?过程中习得了什么?最终产出的究竟为何?近期,“模型蒸馏”的话题再度引发热议。缘由十分直接:大模型能力虽强,成本却日益高昂。并非每家企业都能长期依赖顶级模型支撑业务,也非所有应用场景都需要在每次请求时调用最强模型。于是,一个极具现实意义的问题摆在了面前:能
国产AI模型震撼发布:蚂蚁百灵开源万亿参数技术
如果你最近几天还在关注科技圈的动态,那你绝对不能错过这条足以让所有打工人和程序员沸腾的重磅炸弹——蚂蚁集团百灵大模型团队,正式开源了他们的最新万亿级旗舰思考模型:Ring-2.6-1T!💣什么意思?简单来说,就是我们中国团队自己研发的AI大脑,不仅智商飙升到了万亿参数的恐怖级别,而且在多项硬核测试里,把那些曾经不可一世的海外巨头(比如GPT-5.4、Claude-4.7等)按在地上摩擦!更良心的是,蚂蚁直接把这套顶尖的“武功秘籍”开源了,让全世界的开发者都能免费白嫖!🤯今天,我们就来好好盘一盘,这只名叫“
OpenAI革新语音交互:低延迟与强推理并举
硅基工具人OpenAI正以前所未有的速度推进其语音技术的边界。OpenAI于2026年5月7日隆重推出其最新的语音模型及Realtime API功能,其战略意图十分明确:为开发者和产品团队提供低延迟的语音交互、推理、翻译及转写能力。对于一个已将文本对话确立为主要入口的公司而言,语音并非附加功能,而是其下一代人机交互入口的关键战场。本次发布的亮点在于“三款全新语音模型”的同步亮相。官方并未将此次更新包装成单一性能的提升,而是将实时语音能力、语音理解能力与文本化能力置于同等重要的讨论层面。语音助手、客服以及多
GPT-5.5 Ultra推理跃升:OpenAI能力再升级
2026年5月5日 · AI大模型迎来重磅更新OpenAI于5月5日正式上线GPT-5.5 Ultra,作为其2026年AI走向实用化的重要节点,这一新模型在复杂逻辑推理、数学论证以及代码生成等方面带来显著进展,进一步拓展了大语言模型的能力上限。根据官方披露,GPT-5.5 Ultra在推理与编码方面的表现相比GPT-4实现了明显提升,尤其在复杂逻辑推断、数学证明与代码生成等关键任务上取得突破。同时,其算力消耗可达每分钟4亿Token量级,反映出当前大模型算力的高端水平。另外,GPT-5.5 Ultra的
顶尖AI智力测试“翻车”:人类完胜,模型表现堪忧
GPT-5.5与Claude Opus 4.7最新测试结果令人大跌眼镜📊 最新一项测试让全球最顶尖的人工智能模型挑战了一套“智力题”——结果显示,人类考生全部答对,而GPT-5.5的正确率仅为0.43%,Claude Opus 4.7的表现更差,只有0.18%……这究竟是人类智慧的胜利,还是AI能力的局限?你是否曾思考过,当前的人工智能究竟有多么“聪明”?为了探究这个问题,Keras的创始人François Chollet设计了一项名为ARC-AGI的测试。近日,他们发布了第三代版本——ARC-AGI-3
DeepSeek V4低调发布:百万上下文与低价策略能否突围?
实测V4长文本、代码及推理表现。 AIX财经(AIXcaijing)原创 作者| 李梦冉 编辑| 魏佳 没有发布会,没有倒计时,DeepSeek V4就这样悄无声息地上线了。 这已是DeepSeek的常规操作。但这次的不同之处在于,他们在技术报告中主动提及:V4的能力仍不及GPT-5.4和Gemini-3.1-Pro,发展进度大约落后顶尖闭源模型3至6个月。 这句话在国内AI圈显得有些另类。大多数模型发布时,标配的都是“全球领先”“行业第一”。而DeepSeek反其道而行之,主动承认差距。 但如果细看此次
冥想赋能AI时代:人类智慧的守护之道
西班牙埃萨德商学院教授、数字战略学者朱利奥·托斯卡尼提出,在人工智能深度渗透日常生活的当下,人们亟需掌握冥想与批判性思维能力。为探究人机交互的机遇与挑战,托斯卡尼访谈了来自50个国家的150位AI领域专家。托斯卡尼在新著《增强:以数据与人工智能重塑人类判断力》中强调,人类天性偏好即时回报,往往对潜在风险与负面后果缺乏足够预估。托斯卡尼指出:"人工智能的日益迷人之处在于其随时随地的即时满足感。"在数字化加速的快节奏社会中,AI展现出强大吸引力。然而,这种便捷性与即时响应也暗藏风险——潜在的成瘾性。托斯卡尼认
AI大模型与小模型的深度对比
为何当下AI技术普遍追求'大模型'?这两者之间究竟存在哪些差异?本文将用通俗易懂的语言,为您解析这两个概念,以及它们各自的应用场景。 近年来,'大模型'一词几乎充斥着各大领域。 ChatGPT、文心一言、通义千问……这些我们耳熟能详的AI,背后都离不开'大模型'。 但您是否思考过: 为何AI都要往'大'了做? 大模型真的比小模型强吗? 今天,我们就来聊聊这个话题。 何为'大'模型?何为'小'模型? 简单来说,'大'与'小'指的是模型参数的规模。 何为参数?不妨将其视为AI的'神经元'。 - 小模型:参数量
Nature重磅:ADeLe精准预判AI模型成败
瓦伦西亚理工大学(Universitat Politècnica de València)的一支研究团队,来自瓦伦西亚大学人工智能研究所(VRAIN)及ValgrAI,成功研发了ADeLe。这一创新方法可精准预判大型语言模型(LLM)在未曾执行过的全新任务中的成功率,并清晰界定特定模型的推理边界。该研究刊登于《自然》期刊,堪称重大进展。传统手段仅能反映AI模型在既定测试中的成效,而ADeLe运用更具认知深度的评测方式,可预先解析并预判模型行为,使企业在发布新型AI系统前便能洞察潜在失误。如此一来,我们便能
2026智能体发展动态
新华网旗下《环球》杂志今日以显著篇幅发布专题报道《2026:智能体崛起之年》,邀请四位国内外顶尖学者,共同做出重要预测。专家们总结了智能体爆发的四大基础:推理能力飞跃:Claude Opus 4.6、DeepSeek-R1、Gemini 3等模型已能执行"长期任务",从对话助手升级为"实用型AI";工具生态系统整合:MCP协议、A2A协议与企业API标准化,使智能体能够真正介入现实系统;成本大幅降低:两年内AI推理成本下降超过95%,"为每个业务流程配备一个Agen
AI与思维能力的平衡之道
遗忘曾经掌握的知识,会带来一种独特的羞愧感。你曾学习过它,理解过它,但随后——一切都忘记了。一个名字,一个事实,一张面孔,统统消失。我耗费了二十年时间进行训练,目的就是为了避免这种情况的发生。我记住了二十副特殊扑克牌的洗牌顺序。我记住了一千个陌生人的名字。我参加了六次美国记忆锦标赛,并且每次都获得了冠军。即便如此,有些早晨我走进厨房时,还是会忘记自己为什么会来这里。记忆力并非天赋,而是一种技能。就像其他技能一样,当我们把这项工作交给外部工具时,它就会逐渐退化。这就引出了一个显而易见的记忆力威胁目标:人工智