AI基础设施时代:Google网络架构的演进与重构
这份资料阐述的是Google如何将过去支撑互联网、流媒体和云计算的网络基础设施,转化为服务于AI训练与推理的全新架构体系。建议从三个维度来理解这个架构。第一层是AI超级计算系统的内部结构,即单一数据中心或园区内,TPU、存储设备与前端网络如何实现互联互通。第二层是AI超级计算系统的外部结构,即多个园区、跨地域数据以及跨云环境如何整合为一个统一的分布式计算池。第三层是全球互联网络,即AI推理服务如何触达全球终端用户。传统网络主要服务于网页浏览、视频流媒体和云端应用。AI工作负载呈现出截然不同的特征。大模型训
AI的推理究竟是怎么回事?
这里是AI大白话第011篇。上篇讲了,AI写东西就是猜概率,一个字一个字地猜。那问题来了—— 一个只会"猜"的东西,为什么能推理、能思考、能帮你做决策?更关键的是:它的"推理",真的靠谱吗?先说清楚它到底怎么"推理"的,再聊值不值得信。你可能会觉得,AI天生就会推理——它被造出来就这么聪明。不是这么回事。AI能"推理",经历了三个阶段。第一阶段:喂数据。让它"见世面"。AI被塞进了几万亿字的文本——书、文章、论文、代码、对话、
AI推理模型:从快嘴到深思的进化
AI 又开始“动脑子”了?一篇讲透推理模型 推理模型转这么久是什么原因。什么时候用? 以前大家比的是谁更会聊天、谁写得更像人、谁能把老板三句话润色成“战略升级、生态闭环、价值共振”。 现在风向变了。 大家开始比:谁更会思考,谁能拆复杂任务,谁能一步步算明白,谁不是一上来就拍脑袋回答。 说白了,AI 终于从“嘴快选手”,开始卷成“脑子选手”了。 那推理模型到底是什么? 先说人话:推理模型,就是更擅长处理复杂问题的模型。 它不是简单背了更多资料,也不是突然长出了人类大脑。它更像一个不急着抢答的人,遇到问题先读
陈立武阐述英特尔战略:聚焦芯片到系统创新,助力AI时代产业转型
新浪科技讯 6月3日上午消息,在Computex 2026大会上,英特尔公布了一系列前沿技术创新方案,旨在满足客户从芯片到系统层面的AI需求,并提供针对特定行业痛点定制化的解决方案。英特尔CEO陈立武指出:"过去五十余年里,英特尔与生态伙伴紧密合作,持续推动PC、互联网以及当前AI时代核心基础技术的演进。现阶段,随着推理、智能体和物理AI的快速发展,英特尔正大力推进从芯片到系统层面的创新突破,为产业升级和社会发展提供新动力。" 当前,随着AI模型训练逐步成熟,越来越多AI应用投入实际部署,市场对高性价比、
AI推理浪潮下,香港数据中心价值重估在即?
研究时间:2026年5月 数据截止:2026年5月(含FY2025全年及FY2026中期业绩) 声明:本备忘录基于公开资料整理,仅作产业参考,不构成任何投资建议。2023年,受AI训练需求推动,北美IDC巨头(如Equinix、Digital Realty)估值逻辑重构——市场愿为“AI基建核心”给予30至40倍市盈率。至2026年,类似逻辑正蔓延至香港IDC领域。然而,两地市场底层架构是否具备可比性,尚无定论。我们尝试从一个关键问题切入:AI推理需求的激增,是否会引发香港互联基础设施的价值重估?新意网(
AI独角兽Fireworks融资估值达1000亿
AI推理平台Fireworks AI正在进行新一轮融资谈判,公司估值已攀升至150亿美元(约合1000亿人民币)。这意味着又一家千亿元级别的独角兽企业诞生。这个成就仅用了四年时间——2022年,Fireworks AI正式成立,专注于为企业提供开源AI模型运行服务,并采用Token计费模式。目前该平台日均处理Token量已达30万亿,通过Token销售实现快速发展。背后的领导者令人印象深刻——Lin Qiao(乔琳),本硕均毕业于复旦大学,正是在这里开启了她的AI职业生涯。借助AI行业的发展机遇,她带领团
AI推理新纪元:芯片逻辑重塑
从英伟达的巨额投资,到初创企业密集推出产品,再到资本市场对这些企业展开估值,可以清晰看出,在AI推理阶段,行业竞争焦点已从“更大模型”逐步转向“更高效模型”。AI芯片产业的核心逻辑,正从训练算力向推理效率转变。在2022年生成式AI爆发初期,行业竞争的核心集中在模型训练上。谁能训练出最强模型,谁就占据竞争优势。因此,大量资本涌入参数规模和芯片资源堆叠,以追求模型能力与规模的飞跃。但随着AI服务进入常态化部署阶段,成本结构已发生改变。训练属于高资本投入、低频次的研发行为,而推理则是高频、长期的持续性成本,并
Mistral AI计划自研AI芯片 加速欧洲算力布局
法国AI新锐Mistral AI掌门人阿瑟·门施透露,企业正积极探索自主研发芯片的可能性,相关产品有望在未来面世。 这是门施首次就半导体领域的战略规划公开发声。此举反映出,在与OpenAI、Anthropic等美国巨头竞争的过程中,Mistral AI致力于强化对核心基础设施的把控。 谈及自研芯片的愿景,门施坦言:“这个方向很有潜力,公司并未关闭这扇门。” 他指出,定制化芯片能显著压缩AI token的使用成本,而token正是AI模型处理信息的核心单元。 “自研芯片大概率会成为我们的选项,但目前我们依然
墨芯完成C轮融资,下一代稀疏芯片SparsePrime年内面世
知名企业墨芯人工智能近日宣布完成C轮融资,金额高达十亿元人民币。此次融资吸引了深创投、岩山科技、大湾区共同家园、力鼎资本、蕴盛资本等产业巨头及市场机构,凯旋创投、创享投资、盛景嘉成等多家老股东跟投。这种“产业巨头+国资背书+财务资本”的多元股东结构,不仅保障了技术协同的深度,也为墨芯在全国算力网络布局中提供了坚实的资源保障与产业支撑,标志着稀疏计算正从技术验证阶段加速迈向规模化产业爆发的新时期。就在融资宣布之时,公司核心新品——全新一代计算卡SparsePrime®(以下简称“SparsePrime®”)
墨芯人工智能完成近十亿元C轮融资,推进AI推理芯片商业化
近日,墨芯人工智能正式完成C轮融资,金额近十亿元人民币。据悉,融资资金将重点投向全新一代计算卡SparsePrime的量产与商业化,以及全国算力网络版图的进一步扩张。2021年,真格基金参与其Pre-A轮融资,一路陪伴至今。融资宣布之际,公司核心产品全新一代计算卡SparsePrime将于今年内正式推出。SparsePrime计算卡是一款面向智算中心和数据中心的高性能AI通用推理计算卡,基于自研的Antoum2.0芯片架构,专为大模型与复杂推理场景优化设计。该产品采用自顶向下的整体设计理念,广泛适用主流T
大模型推理进入规模化落地期,KV Cache性能瓶颈如何突破
在多模态、私有化AI、实时推理和工业智能部署全面推广的背景下,AI行业已从模型训练阶段迈向推理规模化落地的新时期。高并发、超长上下文和低时延的服务需求,使得KV Cache从单纯的推理加速工具转变为大规模推理的核心性能瓶颈,主要表现为显存占用高、多节点缓存孤岛、小粒度IO压力大以及冗余计算多等问题,最终导致吞吐下降、算力浪费和硬件成本攀升。针对上述行业痛点,百代存储基于自研OptiFS高性能并行文件存储,推出AI推理专属KV Cache全链路优化方案,弥补存算协同短板。方案核心优势如下:1. 分层存储架构
AI推理爆发:CPU与GPU双核驱动,存储设备板块共振
科技圈震动!🔥AI推理时代强势开启,CPU与GPU双强争霸!各位,AI领域的赛道已经发生了根本性的切换!随着AI应用重心从模型训练转向实际推理,产业正迈入“CPU+GPU”协同发展的新纪元,不再局限于GPU的垄断,CPU的战略价值正经历剧烈重塑!英特尔CEO陈立武指出,AI推理普及后,CPU与GPU的配置比例有望达到4:1;AMD掌门人苏姿丰亦表示,推理及智能体AI的发展为CPU赋予了全新的角色定位。值得注意的是,传统数据中心中CPU与GPU的比例仅为1:4,预计到2026年将逼近1:1。一旦实际配比突破
AI推理重塑存储产业格局!长协定价颠覆传统周期,四大投资主线深度解析
后台有朋友留言问:"存储芯片从去年涨到现在,还能持续多久?国产链条到底怎么选?"这个问题恰好切中了当下A股半导体最核心的主线。AI推理需求正在引爆存储芯片有史以来最长的结构性景气周期。供需缺口预计延续至2027年,长协锁单机制使存储从传统周期品蜕变为高盈利能见度资产。国内"两存"IPO开启千亿级资本开支大幕,设备、零部件、材料环节迎来量价齐升的黄金窗口。重点关注存储涨价受益链(兆易创新、澜起科技)、设备扩产链(北方华创、中微公司、拓荆科技、微导纳米)、零部件材料链(富创精密
海康机器人发布AI一体化终端与服务器
AI推理终端VAC3000&VAC5000系列面向工业环境边缘部署优化强大AI计算能力支撑AI加速卡性能表现优异可高速执行深度神经网络模型推演工作符合高准确率、高效率标准多任务同步运行VAC5000系列配置双AI加速卡轻松处理多AI组件并行运算满足高清晰度和更高性能要求深度整合VM系统预装VM全功能算法系统包含经典算法、深度学习及边缘计算算法全面支持定位、测量、识别、瑕疵检测等应用多样接口整合整合多种视觉系统数据传输与控制接口支持多种工业协议与外设接入基于X86开放式架构可灵活适配各类视觉检测与自
大模型推理的法律边界探索
人工智能能否胜任法律推理工作?其推理过程的可靠性如何保障?大规模语言模型的推理机制究竟遵循何种原理?就我观察而言,当前人工智能的推理能力仍停留在归纳与演绎阶段,尚未触及辩证推理的深层境界。不过,仅仅是归纳和演绎推理,就已经足以支撑大语言模型处理绝大多数语言相关任务,而且其精确度还在持续优化中。在我看来——法官这一职业是否会被替代,关键在于大模型能否真正实现"自主"的辩证推理,而非如今这种流于表面的"表演式"辩证推理。除此之外,现有的证据推理框架、评判准则与执行流程相当繁复,但归根结底,人工智能的推理手段依