推理_标签-酷阅新闻

英伟达 GTC 台北站：告别纯聊天，Agent 行动纪元来临

AI 已不止于答疑，它正着手替你执行具体任务。在 GTC 2026 台北盛会中，黄仁勋耗费两小时阐述了一个核心观点：AI 正从“内容生成”迈向“任务执行”的新阶段。这一变革对算力需求的冲击，远超大众此前的预判。01 推理超越训练：算力消耗的主阵地发生转移黄仁勋在演讲中强调，Agentic AI 的工作负载以推理为核心，且在特定场景下，其算力消耗已逾越传统训练模式。这表明企业部署 AI 的成本架构正经历重塑英伟达于会上推出了新一代 Blackwell Ultra 架构，专为高频推理场景量身优化。这不仅是产品

2026-06-07 08:29:46 | 26 阅读

开源协作|沐曦联合上海AI实验室推进多芯片异构推理，打造国产算力新体系

近日，上海人工智能实验室更新并开放了DeepLink多元算力混合推理技术方案。作为核心芯片合作伙伴，沐曦股份首批部署了公司标准推理镜像，深度参与这一面向国产异构算力的开源协同生态。多芯联动，推理模式迈入新阶段大模型推理的技术发展正逐步跨越“单芯片、单架构”的限制。伴随模型规模增长和应用场景多样化，业界对“异构混推”需求日益增强——不同厂商与架构的芯片能否在同一推理链路中协同工作，成为国产算力生态落地的核心问题。沐曦股份持续投入行业基础设施建设，助力开发者与各类场景更便捷地使用国产算力。此前，公司与上海人工

2026-06-07 07:45:24 | 24 阅读

AI基础设施时代：Google网络架构的演进与重构

这份资料阐述的是Google如何将过去支撑互联网、流媒体和云计算的网络基础设施，转化为服务于AI训练与推理的全新架构体系。建议从三个维度来理解这个架构。第一层是AI超级计算系统的内部结构，即单一数据中心或园区内，TPU、存储设备与前端网络如何实现互联互通。第二层是AI超级计算系统的外部结构，即多个园区、跨地域数据以及跨云环境如何整合为一个统一的分布式计算池。第三层是全球互联网络，即AI推理服务如何触达全球终端用户。传统网络主要服务于网页浏览、视频流媒体和云端应用。AI工作负载呈现出截然不同的特征。大模型训

2026-06-06 15:11:55 | 28 阅读

AI突破长文本极限，多数人却未察觉其深意

我是楚哥，某软件上市企业副总，深耕软件行业近二十载，自2018年起便与国内顶尖AI专家联手推进相关项目。今年六月这波模型发布热潮，在朋友圈刷屏，众人只注意到“又出新模型了”。坦白讲，这波兴奋实属多余。真正值得关注的数据仅有一个：上下文窗口。GPT-5.6已突破150万Token，Kimi K2.6更是激进，直接达到200万Token。这意味着什么？能将《三体》三部曲全文一次性输入，AI可从头读到尾，人物关系、伏笔线索，全盘铭记。以往与AI对话至第三轮，它便遗忘首句内容；如今？它能一口气读完你全年的工作日志

2026-06-06 14:05:42 | 21 阅读

AI如何攻克“无标准答案”难题

SERIES让 AI 做算术或翻译,核心是通过计算输出与标准答案间的 loss 并反向传播。可一旦任务是“回答得更好”或“下赢棋”,根本不存在标准答案可供计算 loss——这条路也就断了。强化学习接过了这个难题,甚至能下出人类万分之一概率才会下的棋。这究竟是如何做到的?本文核心要点01 监督学习的核心要求:必须先有答案,才能计算出 loss大模型的预训练与微调,本质上都是监督学习:将模型预测的 token 与“标准答案 token”对比,计算交叉熵(差距大小),再通过反向传播调整参数以缩小差距,循环数百万

2026-06-06 10:42:29 | 26 阅读

语音 AI 架构革新：不仅听指令，更懂听时机

语音操控早已跨越了单纯附加功能的初级阶段。过去十几年，智能家居领域一直受困于一种认知偏差：把语音控制当作可有可无的点缀。然而真相并非如此。伴随家居环境愈发复杂、设备互联日益紧密，语音已演变为唯一真正贴合人类生活习惯的交互模式。传统交互手段已难以为继：双手忙碌时，触控屏便形同虚设；操作应用需耗费大量心力；遥控器总在急需时找不到。若语音能保持稳定可靠的运行，它将成为唯一能跨越空间、场景及不同用户的交互途径。不过，当下我们仍依赖实体按键与遥控器，根本原因在于对语音交互缺乏足够信心。语音指令易被忽略，嘈杂环境下识

2026-06-06 10:34:17 | 27 阅读

AI竞争新焦点：从能力比拼转向成本控制

2026年5月，Anthropic完成H轮融资，金额650亿美元，投后估值9650亿美元。公司自行披露的年化运行收入（run-rate）超过470亿美元。470亿美元的run-rate意味着什么？按照公司最近一个月的实际营收乘以12来推算，它已经进入全球收入最高的科技公司行列。不过需要说明的是，Anthropic采用总额法记账——通过AWS、Azure等云厂商渠道的收入会全额计入营收，再把云厂的分成记回成本。据The Information测算，其经济意义上的净留存收入大约在130亿到150亿美元量级。同

2026-06-06 02:46:22 | 30 阅读

OpenCSG 赋能璇玑 AI NAS：打造本地化智能算力新底座

随着 AI 技术深入家庭与办公领域，用户关注的焦点已从简单的对话交互，转向其能否有效处理个人文档、影像资料及日常事务。璇玑 AI NAS 创新性地将本地存储、边缘计算、知识库、智能体、相册管理、文件系统及智能设备控制融为一体，确保数据留存于本地，同时让 AI 能够基于这些私有数据高效运作。在此架构中，OpenCSG 专注于提供底层模型服务与 API 支持。其中，CSGLite 核心负责底层 API 接口、本地模型托管、推理执行、硬件兼容性及模型供应商对接；CSGHub 则统筹管理模型、应用及智能体等 AI

2026-06-05 21:05:00 | 24 阅读

清程极智AI Ping聚合30余家供应方、600余项大模型能力

新浪科技讯 6月5日上午消息，在中科创星硬科技媒体行——清程极智专场活动中，清程极智团队在分享中透露，针对Token服务市场供应方众多、参数指标参差不齐、选型难度大的行业现状，清程极智打造的AI Ping一站式大模型服务评测与API智能路由平台——已对接30余家主流供应方、600余个大模型服务，能够依托智能路由算法，通过统一API接口为用户自动筛选最优供应方，实现成本下降超37%、吞吐量提升超90%、响应延迟降低超20%。同时，针对大模型部署成本居高不下、国产算力适配性欠缺等挑战，清程极智推出的赤兔推理

2026-06-05 17:38:29 | 43 阅读

GeoAI 新纪元：三维感知、时空推演与自动制图的范式跃迁

若说早期的 GeoAI 主要攻克了"AI 能否识别遥感影像"这一基础难题，那么 2025 至 2026 年的技术演进已迈向更深层面：AI 如何认知三维空间？如何预判时空演变？如何实现地图生产的自动化？这三大追问直指 GIS 行业价值最密集的领域——三维点云智能处理、时空序列预测建模以及制图综合自动化。尽管三维激光扫描（LiDAR）与倾斜摄影已成为测绘生产的核心数据源，但点云数据与二维栅格影像存在本质差异：无序性（缺乏固定网格）、稀疏性（大量空白区域）及旋转不变性（同一物体不同角度差异显著）。传统的"投影→

2026-06-05 06:12:39 | 22 阅读

【AI 周周学】第四期：大模型进阶之道

大模型从"可用"跨越至"好用、可信"的核心征途如今，大模型虽已渗透至千行百业，然而"幻觉频现、业务认知模糊、知识难以固化"等顽疾，极大阻碍了其在企业关键业务场景中的实际应用。推进大模型"本体化"，恰是攻克上述难题的必由之路，为 AI 从"可用"跃升至"好用、可信"奠定坚实基石。"本体"概念源自哲学，在人工智能范畴内，它指代对特定领域概念、特性、关联及准则的形式化界定，宛如为机器描绘出一幅"业务关系图谱"。所谓大模型本体化，即是将此"图谱"与大模型深度耦合，促使模型摆脱对概率猜测的依赖，转而依托严谨逻辑推演

2026-06-04 21:41:33 | 20 阅读

算力共生|国鑫闪耀COMPUTEX 2026科技盛会

2026年6月2日至5日，2026台北国际电脑展（COMPUTEX 2026）在台北盛大开幕。本届展会以"AI Together"为主题，聚焦人工智能运算、机器人与智能移动、未来科技三大核心方向，汇集全球33个国家和地区、1500家科技企业，展览规模创历史新高。作为国内领先的服务器产品与解决方案供应商，国鑫受邀参展本次盛会，携覆盖大模型训练、推理、高性能计算与高密度存储的全系列AI服务器产品矩阵精彩亮相，与全球产业伙伴共同探索人工智能产业协同创新新路径，推动"人工智能+"加速赋能千行百业。当前，人工智能技

2026-06-04 19:01:13 | 10 阅读

AI的推理究竟是怎么回事？

这里是AI大白话第011篇。上篇讲了，AI写东西就是猜概率，一个字一个字地猜。那问题来了—— 一个只会"猜"的东西，为什么能推理、能思考、能帮你做决策？更关键的是：它的"推理"，真的靠谱吗？先说清楚它到底怎么"推理"的，再聊值不值得信。你可能会觉得，AI天生就会推理——它被造出来就这么聪明。不是这么回事。AI能"推理"，经历了三个阶段。第一阶段：喂数据。让它"见世面"。AI被塞进了几万亿字的文本——书、文章、论文、代码、对话、

2026-06-04 18:31:38 | 11 阅读

128TB内存!这家初创公司如何破解AI服务器的内存墙困局

点击蓝字关注我们SUBSCRIBEto USMajestic Labs内存瓶颈是当前大语言模型（LLM）发展面临的最严峻挑战。权威研究表明，大模型输出文本属于典型的内存密集型任务，模型生成速度受制于内存读取带宽，且随着参数规模扩大而愈发严重，这种内存墙问题严重制约着大模型推理效率（https://arxiv.org/pdf/2403.14123）。AI硬件初创公司Majestic Labs祭出一套系统性解决方案，自主研发名为Prometheus的AI服务器，单机最大支持128TB内存，是英伟达旗舰AI平

2026-06-04 15:12:49 | 40 阅读

AI能耗激增：技术繁荣的隐性成本

2026年第一季度，全球AI数据中心的电力消耗达到了一个里程碑数字：约350太瓦时。作为对比，法国全国一年的用电量约450太瓦时。AI正在以一个国家级的能耗速度消耗能源。国际能源署 IEA 的一份报告预测，到2027年，全球AI数据中心的电力消耗可能占到全球总发电量的2-3%。听起来不大？但2%的全球电力已经超过了大多数国家的全国用电量。这个问题的本质很直白：大模型训练需要越来越多的GPU，更多的GPU意味着更多的芯片，更多的芯片意味着更多的电。而且——更大的模型训练不仅需要更多的电，还需要更集中的电——

2026-06-04 02:28:10 | 14 阅读