MiniCPM5-1B:重塑端侧AI智能密度新高度
2026年5月26日,面壁智能携手清华大学及OpenBMB开源社区,共同推出面向端侧部署的文本基座大模型 MiniCPM5-1B。该模型参数量为1B,专为终端设备场景设计。依据官方公布数据,MiniCPM5-1B 在 Artificial Analysis(AA)榜单中斩获17.9分,在2B以下开源模型中表现优异。相比之下,Qwen3.5-2B 得分为16.3分。在知识问答、数学推理、代码生成及工具调用等评测维度上,MiniCPM5-1B 相较于 Qwen3.5-0.8B、LFM2.5-1.2B-Thin
清华五道口AI速递 | 多款大模型齐发,端侧AI密集落地,人形机器人同步更新
各位早安!欢迎收听清华五道口AI速递,每日为您梳理AI领域最新动态。OpenAI GPT-5.6意外泄露:上下文窗口扩至150万token,预计6月亮相2026年5月26日,多位开发者在OpenAI Codex后端日志中发现了尚未公开的下一代模型线索,内部代号为“iris-alpha”,外界猜测即为GPT-5.6。该模型最大亮点在于上下文窗口从GPT-5.5的105万token大幅提升至150万token,增幅约43%,可更高效处理超长文档、大型代码库及复杂多步骤任务。测试表明,即使输入超过90万toke
AI 自训模型问世!面壁小钢炮成本降一成,性能碾压同尺寸竞品
面壁智能最新一代“小钢炮”正式亮相。5 月 25 日,面壁智能携手清华大学及 OpenBMB 开源社区,共同推出了 MiniCPM5-1B。该模型仅含 1B(10 亿)参数,却在权威评测榜 Artificial Analysis(AA)上斩获 17.9 分的高分,一举超越所有参数量在 2B 以下的模型,即便是参数翻倍的 Qwen3.5-2B 也甘拜下风。更小却更强,这再次印证了面壁曾发表于 Nature 的密度定律:大模型的智能密度大约每 3.5 个月就能翻一番。面壁“小钢炮”系列模型向来以参数小巧、能量
卡莱特AI100引领公共显示安全新范式
据相关数据统计近年来,国内公共显示屏内容安全事故已突破3000余起在数字化进程不断加快的当下公共显示屏已远非单纯的"信息展示平台"光鲜与隐患,往往仅在一帧画面之间卡莱特内容安全智能体创意短片AI100是一款部署于显示屏前端的边缘AI内容审核装置,作为最终呈现前的"智能把关者"。能够对输入信号进行智能化分析,拦截违规内容,保障屏幕画面纯净安全,协助客户高效落实内容安全管理。它是"过滤网":对输入信号实现毫秒级智能分析,自动拦截违规内容;它是"决策中心":配备自主判断的"智慧中枢",可独立完成内容识别、分析与
真AI手机缺位:智能手机行业困局与出路
点击蓝字,关注我们上个月与某手机厂商渠道商朋友聚餐,他坦言如今线下门店最大的困扰就是:进店浏览的人不少,可一旦问到换机意愿,多数人的回答都是"现在这台还能用,没坏干嘛换"。这番话直接戳中了整个行业的心病。Counterpoint 2026年4月发布的最新行业数据显示,今年第一季度全球智能手机出货量同比下降6.2%,国内市场出货量同比下降3.3%,此前连续十个季度的增长态势就此终结。除了苹果、三星以及国内的小米、vivo、OPPO等头部品牌,没有任何一家厂商能逃脱存量市场的残酷竞争。降价促销冲量已成为行业普
面壁智能破局:600亿参数模型仅用8G内存,国产算力领跑端侧AI
通常情况下,运行一个8B参数的大模型大约需要16GB显存,参数规模越大,对显存资源的消耗就越严峻,这也推高了硬件成本。不过,现在出现了一种新技术,能让显存需求骤降6倍,同时尽量维持原有的性能水平。这两年全球都在争夺这一前沿技术,而我国凭借国产算力优势,已率先取得突破。该技术能把模型压缩到3B以内,性能保留率高达97%;配合MoE架构,未来只需8G内存的手机就能运行600亿参数的大模型。这一惊人的技术突破背后有何奥秘?传统大模型通常依赖高精度的数值来存储权重,每个权重的可选数值非常丰富,虽然精度高,但非常消
国内首个1.58比特端侧大模型开源发布
IT之家5月25日信息,面壁智能携手清华等机构,今日公布并开源其最新低比特大模型成果BitCPM-CANN。 据透露,该模型为我国首个完全基于华为昇腾平台端到端训练并开源的三值(1.51-bit)大模型。从量化计算、训练方法到整体框架,BitCPM-CANN均在昇腾平台原生构建,提供0.5B、1B、3B、8B四种规模,与同规模MiniCPM4全精度系列逐一对比测试,表现卓越。 相较传统BF16精度,BitCPM-CANN在推理时释放约6倍显存优势,同时保持90%-97.2%模型能力保留率。 官方指出,对移
端侧AI新突破:国产技术实现手机运行大模型的高效压缩
一个 8B 参数的大模型,通常需要约 16GB 显存。参数越多,越吃显存,这就是为什么,内存价格一天比一天高。 现在,有一种方法,可以省下 6 倍显存,却几乎不损耗模型性能。 过去两年,围绕这个看似极端的思路,一条全球性的技术竞赛正在成型。而就在这条赛道上,一个完全基于国产算力的方案,刚刚给出了自己的第一个回答。 模型被压到了不到 3B,同时,能力却可以保留 97%,甚至更进一步,如果结合 MoE 架构,未来可以直接在一部 8GB 内存的手机,运行 600 亿参数的大模型。 听上去匪夷所思,怎么做到的?
面壁智能开源首个基于昇腾训练的1.58位端侧大模型
【TechWeb】5月25日,面壁智能联合清华大学、OpenBMB开源社区共同发布了其在低比特大模型训练领域的最新成果——BitCPM-CANN。这是国内首款完全基于华为昇腾算力平台实现的1.53位端侧大模型,该模型在技术上实现了重要突破。在相同设备配置下,该技术展示首次完成,随后已将其完整模型系列向公众开放。据公开信息显示,相比传统BF16精度,该模型在推理过程中节省了约6倍的显存资源,同时模型能力保持在90%至97.2%之间。在相同终端设备上运行时,可承载的模型能力大幅提升,过去需要1/6的内存即可获
安克发布 AI 芯片耳机,端侧算力重构降噪体验
↑↑↑点击蓝字 | 关注我们follow usAINGOODS 硬集谷近日,安克创新正式发布了其首款搭载自研 Anker Thus™ AI 芯片的旗舰级开放式耳机 AeroClip。此举标志着安克正式进军 AI 音频硬件领域,将端侧 AI 算力直接融入消费级耳机,凭借硬件级 AI 能力全面重塑音频、通话及降噪体验。与市面上多数依赖手机端 AI 算法的耳机不同,AeroClip 的核心竞争力在于其端侧本地算力。通过 Anker Thus™ AI 芯片的实时运算,主要实现了三大实用功能:AI 实时人声增强与环
端侧AI营收超25%,炬芯科技能否真正落地?
云端AI正在弥补短板,端侧AI同样如此。不同之处在于,云端可以通过资本支出堆叠服务器,而端侧产品不具备这一条件。耳机、眼镜和手表等设备电池小,散热空间有限,且芯片面积受限。要在这些设备上运行本地AI功能,难点不在于口号,而在于功耗、算力和出货量。我们需要从这个角度审视炬芯科技:存内计算能否将低功耗AI能力植入耳机、音箱、手表、AI眼镜和健康监测设备中,并产生稳定的收入。一、端侧AI的核心痛点:小设备能否承载AI服务器竞争的是系统效率,端侧设备也是如此。贴上AI标签很容易,但真正的挑战在于终端设备能否运行本
美格智能领涨超 4%,77TOPS AI 模组迈入量产新阶段
扎根香江,布局全球。新浪财经全球资本峰会金曜奖评选正式拉开帷幕!探寻最具潜力的资本标杆,您的投票举足轻重 立即参与美格智能(03268)早盘表现强劲,涨幅突破 5%,截止发稿时上扬 4.09%,现价报 25.46 港元,成交总额达 3370.31 万港元。根据美格智能官方发布的信息,近期该公司在业内率先启动了 77 TOPS AI 模组的大规模量产与交付工作。继成功研发 48TOPS 高算力智能模组并实现广泛部署之后,此举再次彰显了其在端侧 AI 领域的技术领导地位。此外,针对云端巨大的低功耗推理市场需求
深度复盘:物理AI产业链核心要素
尽管物理AI近期才广为人知,但其技术演变早已在多个细分领域落地。不同于侧重数据处理、内容生成或虚拟交互的传统AI,物理AI更强调对现实世界的感知与干预,它必须依托机器人、自动驾驶或工业机械等实体存在。从“虚拟智能”迈向“实体智能”的变革,催生了全新的技术栈:仿真训练、算力支持与环境感知缺一不可。通过对十七家企业的分析,我们发现物理AI产业生态已初具规模,各企业的角色定位也远比预想的清晰。仿真训练是物理AI区别于通用AI的核心壁垒。AI若要在物理世界安全运行,无法仅靠试错,虚拟训练环境势在必行。索辰科技依托
端侧AI崛起:算力为何“下沉”车间?
展望2026年,开源AI智能体框架将迎来爆发,"本地优先"理念不再局限于边缘计算,而是成为制造车间的硬性指标。数据留在本地、决策不依赖云端、反应即时响应——随着智能体从"云端大脑"蜕变为"车间神经末梢",一场关于算力下沉的深刻变革正在上演。从"被动响应"迈向"主动决策"传统工业AI深受"云端依赖"困扰:设备先采集数据上传,待云端模型推理后再下发指令。这种"往返式"流程让车间设备沦为"感知器官",云端成了唯一的"大脑"。一旦网络波动或中断,决策链条便会瘫痪。延迟是核心痛点,百毫秒级的网络往返足以让高速产线的
腾讯 Marvis 助手开启内测:打造操作系统级 AI 体验
5 月 19 日讯,腾讯近日正式拉开了个人智能助手 Marvis(马维斯)的邀请制内测序幕。Marvis 被定义为一款“操作系统层级”的智能助理,能够预装六位全天候在线的 AI 智能体,用户仅需通过自然语言即可实现对手机与电脑的全流程掌控。此外,该助手还支持端侧隐私保护模式,确保数据无需上云,并具备跨设备远程控制能力。据腾讯方面透露,Marvis 由腾讯应用宝团队倾力打造。在技术维度,它实现了“在电脑端操作手机应用”的功能,直接复用了应用宝在跨端运行领域的深厚积累;在生态维度,应用宝庞大的用户基础也助力