Andy730_AI基础设施产业日报(20260619)
目录
AMD强调坚守FP64计算,将发MI430X芯片
亚马逊商谈直销Trainium芯片,切入第三方数据中心领域
Cerebras于Cerebras Inference上线Gemma 4,推理速率突破1500词元/秒
三星推进美泰勒晶圆厂设备进场,拟2027年量产2纳米工艺
Kioxia发布CD9P-R固态硬盘评测,4K随机读取延迟仅30微秒
阿里云日本启用第五座数据中心,强化海外AI基建版图
Meta携手Crusoe达成1.6GW产能合约,发力德州与密苏里州数据中心建设
Google DeepMind推出AI控制路线图,构建纵深防御应对智能体内部风险
Atom Computing斩获1亿美元C轮融资,助推中性原子容错量子计算商用
MangoBoost自DPU芯片延伸至整机架售卖,借交钥匙基建实现全面商业化
Synopsys推3DIC Compiler自动凸点与TSV规划解决方案
VAST Data剖析其AI操作系统,借DASE架构整合KV Cache与向量存储
Hammerspace实施混合云数据编排策略,借统一数据平面化解GPU饥饿
蚂蚁集团发布UFP4预训练研究,统一4位网格消除FP4收缩偏差
中国科研团队发布WRBench世界模型研究,指出现有模型缺失持久状态核心
AMD
2026-06-19:强调坚守FP64计算,将发MI430X芯片
AMD在超算与AI领域重申其高性能计算(HPC)精度路线,明确短期内不会舍弃原生FP64计算。针对近期理化学研究所(RIKEN)负责人Satoshi Matsuoka在TPC26期间提出用FP8硬件结合Ozaki II模拟替代FP64的观点,AMD超算业务负责人Joseph George表示,科学计算与模拟等诸多核心产业对精度要求极高,当前客户并未要求去掉GPU中的FP64核心,而是期望保留更多弹性以灵活选择工作负载。科学家的回馈显示,近中期最关键的仍是获取准确结果,而非一味追求低精度与高速度。
从产品规划来看,AMD正持续强化FP64性能,即将发布最新MI430X GPU。该芯片将应用于美国能源部(DOE)的Discovery超级计算机,作为橡树岭国家实验室Frontier超级计算机的后续系统。外界预测MI430X的FP64性能将达约192~204 TFLOPS,较MI355的77 TFLOPS实现大幅跃升。
AMD对低精度计算的准确性保持谨慎,特别是INT8搭配Ozaki I或FP8搭配Ozaki II的结果,目前尚未看到足以证明其完全等同于传统FP64的定论。若工作负载偏重矩阵运算,模拟方案较合适;但若属于其他类别的科学程序,正确性仍需优先验证。未来HPC环境将迈向混合精度,部分工作负载可借助AI时代的低精度硬件,部分则必须仰赖FP64以保障科学准确性。
Amazon
2026-06-19:商谈直销Trainium芯片,切入第三方数据中心领域
亚马逊正商讨向第三方数据中心企业直销其Trainium AI芯片。该行动紧随谷歌今年4月宣布向特定客户出售定制TPU的步伐。亚马逊CEO Andy Jassy此前曾暗示将向第三方出售芯片架,目前亚马逊自研芯片业务年营收运行率已超200亿美元。其自研硬件组合涵盖Graviton CPU、Trainium与Inferentia AI加速器,以及Nitro网卡。
外部合作与供应链进展显示,Uber已成为首批采用Trainium3的外部伙伴之一,Anthropic也承诺在其AWS托管的数据中心部署超100万个Trainium芯片。亚马逊此前已向Anthropic投资40亿美元。另外,旗下Annapurna Labs研发的通用处理器Graviton也已开始向Meta供货。
Trainium系列技术演进历程:
1.Trainium1:2020年发布,主要处理AWS内部推理工作负载。
2.Trainium2:2024年发布,提供前代4倍性能与3倍内存容量,借强化热管理并精简内部组件提升算力,用于训练大参数AI模型。
3.Trainium3:2025年末发布,基于台积电(TSMC)3纳米工艺节点打造,性能达Trainium2的4倍,专为云端训练和运行大参数生成式AI模型设计,目前已基本售罄。
行业竞争分析指出,亚马逊与谷歌销售定制芯片对Nvidia构成潜在威胁。Nvidia的优势在于CUDA、开发者工具及合作伙伴构建的全栈生态,而亚马逊正围绕Trainium开发其AWS Neuron模型开发平台。因定制AI加速器软硬件生态构建耗时较久,其专有属性可能妨碍快速普及,此举目前主要用以满足当下旺盛的AI芯片市场需求。
Cerebras
2026-06-18:于Cerebras Inference上线Gemma 4,推理速率突破1500词元/秒
Google DeepMind开放权重多模态大模型Gemma 4现已在Cerebras Inference平台开放私人预览版,并计划于2026年6月底前正式全面发布。该模型在晶圆级硬件平台实现了每秒超1500个输出词元的运行速度,相比市面上直接可比的生产级密集多模态模型Claude Haiku(约100词元/秒)实现高达15倍的速度提升,且保持同等质量与更低的单词元输出价格。
多模态与智能体工作流的性能飞跃
1.传统多模态与智能体循环(如查看视觉输入、推理、生成结构化输出、调用工具及检查结果)极少仅单次调用模型,在每秒100个词元时因处理效率过低无法支撑实时闭环,而1500词元/秒的高速运行使应用和用户协同响应近乎即时,大幅缩短文档、屏幕截图前端迭代时间并显著提升系统重试与验证频次。
2.作为首个接入Cerebras平台的Google DeepMind模型,Gemma 4支持将文本与图像(含UI状态、屏幕截图、图表、扫描页面、文档等)相融合的高阶交互,进一步拓宽了自动计算机控制、图像驱动智能体及机器人应用等新兴产品类别。
旗舰模型微架构与基准指标
1.Gemma 4 31B作为密集多模态模型,借高模型智能设计规避了专家混合模型(MoE)对高内存占用的昂贵硬件依赖,在人工分析智能指数(Artificial Analysis Intelligence Index)上获得29分,与Claude Haiku的30分性能表现相当。
2.该模型基于Apache 2.0协议完全开放权重,能为从Llama、GPT-OSS或Haiku迁移的开发团队提供无供应商锁定的中型参考架构,针对多模态推理、文档理解、快速摘要及特定代码流等受推理速度制约的业务场景提供晶圆级硬件加速。
三星电子
2026-06-19:推进美泰勒晶圆厂设备进场,拟2027年量产2纳米工艺
三星电子位于美国德州威廉姆森县的泰勒代工工厂全面开启初期运营筹备,全球半导体曝光设备巨头ASML韩国公司的主要工程师及极紫外线(EUV)曝光设备专家近期已派驻该厂,预计停留一个半月至两个月。目前该晶圆厂的洁净室基础设施已竣工,全面步入高端设备的组装、设置与最终优化阶段,为下半年试产及2027年商业量产做准备。
泰勒工厂建设进展与工艺优化
1.泰勒工厂曾因全球经济低迷及争取客户延迟导致开工推迟,合作企业人员曾于2024年底撤回韩国。伴随2026年4月下旬设备投产仪式的举办以及一线熟练专业人员的重新调配,该晶圆厂进军美国代工市场的计划重回正轨。
2.三星电子美国代工厂副总裁Margaret Han在近日举办的SAFE论坛上宣布,计划2026年在Taylor 1晶圆厂建设最先进的2纳米产能,并于2027年启动生产。
核心客户拓展与针对性制程调整
1.泰勒代工厂被视为生产特斯拉下一代自动驾驶人工智能芯片等高端工艺产品的关键基地。
2.三星电子计划向泰勒工厂引入针对AI工作负载精准调校的2纳米第二代改良工艺(SF2P+),该工艺可实现高达30%的性能提升。目前该工厂已进入依客户规格量身定做的最终设计优化和技术开发阶段,正修改2纳米工艺设计以瞄准特斯拉的下一代芯片。
Kioxia
2026-06-19:发布CD9P-R固态硬盘评测,4K随机读取延迟仅30微秒
Kioxia发布最新数据中心NVMe固态硬盘CD9P-R的实验室测试结果。作为首款基于BiCS FLASH第八代3D TLC打造的读取密集型设备,其采用单端口、1 DWPD设计,兼容PCIe 5.0和NVMe 2.0。E3.S版本容量达30.72TB,2.5英寸版本达61.44TB。7.68TB和15.36TB型号性能最优,额定顺序读取14800 MB/s,随机读取260万IOPS,30.72TB型号指标则降至13500 MB/s与27万IOPS。
Kioxia BiCS FLASH第8代3D NAND结构
在FIO与DLIO基准测试中,其展现出极高的读取优势与特定的写入短板:
1.顺序读取性能:7.68TB型号在128K顺序读取中达14235.9 MB/s,与Pascari X200P齐平。
2.低队列深度优势:QD1下4K随机读取延迟仅30微秒左右,约为竞品的一半,最高随机读取达216.5万IOPS。
3.顺序写入速度:128K顺序写入速度为6912.4 MB/s,在测试组中垫底。
4.LLM检查点测试:在Llama 3.1 405B模型架构的大数据量测试中,其每次通过时间稳定在572秒左右,展现出可预测的稳定性。
在Magnum IO GPU直接存储(GDS)测试中,其在多线程扩展与单线程表现上表现优异:
1.16K块大小:在16K/128线程下达2.0 GiB/s,为测试组最高吞吐量。
2.128K块大小:单线程配置下以1.6 GiB/s开局,8线程时达4.7 GiB/s峰值,但高并发下被美光9550系列反超。
3.1M块大小:单线程吞吐量4.9 GiB/s,多线程基本维持在4.3~4.4 GiB/s,1M/128配置下读取吞吐量达6.2 GiB/s,写入峰值4.9 GiB/s。
该设计主要面向超大规模与云服务器集群、OLTP读取层等以读取为主的固定功耗环境。硬件合规方面,其部分兼容OCP数据中心NVMe SSD规范v2.5,具备断电保护、端到端数据保护及安全加密选项,50°C环境下平均故障间隔时间为250万小时,提供5年质保。
阿里云
2026-06-19:在日本启用第五座数据中心,强化海外AI基建版图
阿里云宣布在日本东京启用第五座数据中心。该举措紧随其2026年3月在日本设立第四个可用区的动作。自2016年开服以来,该最新数据中心主要用以满足日本零售、游戏、娱乐及制造业客户的需求。伴随新数据中心的启用,阿里云Model Studio及最新AI模型也实现了本地化可用,重点支持日本开发者与企业利用智能体(Agent)驱动业务创新。
全球云基础设施建设与资本性支出进展:
1.本周内双点落子:该数据中心是阿里云本周内启用的第二个国际数据中心,前一日其刚宣布在法国巴黎启用两个数据中心。此外,本月早些时候阿里云还于马来西亚柔佛州新增了其在该国的第二个双可用区区域。
2.投资规模持续加码:阿里云自2025年起全面推进重大全球扩张计划。公司CEO吴泳铭(Eddie Wu)于2025年6月证实,公司拟投入约527亿美元用于构建“统一的全球云网络”,随后阿里云考虑将该项资本性支出规模进一步扩容至690亿美元。
Meta
2026-06-19:携手Crusoe达成1.6GW产能合约,发力德州与密苏里州数据中心建设
Meta已签约从人工智能基础设施提供商Crusoe获取合计1.6GW的计算能力产能。根据彭博社报告,Meta已签署合同购买Crusoe位于德克萨斯州Childress和密苏里州Warrenton两处地点的容量,目前该协议的具体财务价值尚未披露。
基础设施分布与园区建设细节:
1.德克萨斯州Childress项目:该站点由Lancium与Crusoe合作开发,拥有1GW互连容量,且已获德克萨斯电力可靠性委员会(ERCOT)的完全批准。
2.密苏里州Warrenton园区:计划占地约340英亩,规划包含两座面积为805000平方英尺的数据中心大楼和一座40000平方英尺的行政建筑。
数据中心资源与第三方云合作进展:
1.Crusoe整体产能:本月早些时候Crusoe透露其已签约的人工智能基础设施合同产能达4.9GW(含数据中心项目及Crusoe Cloud云平台),总开发流水线超40GW,但近期退出了怀俄明州的一个项目。另外,Crusoe在德克萨斯州阿比林建有1.2GW园区(由甲骨文建造并转租给OpenAI),以及一个正为微软建设的900MW园区。
2.Meta算力多元化布局:Meta CEO马克·扎克伯格近期透露正考虑推出自有云计算产品的可能性,其新成立的Meta Compute部门计划在十年内建造数十吉瓦的自建数据中心产能。在自建之外,Meta正借大规模签署第三方协议拉高算力:包含与Nebius签署价值270亿美元的云协议(首期自2027年起五年内执行120亿美元)、与CoreWeave签署210亿美元协议,以及与AWS合作在其云端使用Graviton5芯片。
Google DeepMind
2026-06-18:推出AI控制路线图,构建纵深防御应对智能体内部风险
Google DeepMind推出AI控制路线图(AI Control Roadmap),作为在Google内部构建与管理高级人工智能的纵深防御安全框架。该框架超越传统的模型对齐,借增设系统级安全层,在模型可能出现未对齐的假设前提下,依托受控的增量访问权限授予机制保障智能体(Agent)的系统级安全。
基于网络安全最佳实践的纵深防御与控制机制:
1.内部威胁建模:框架将不受信任的人工智能智能体视为潜在的“内部威胁”,并基于工业界标准的MITRE ATT&CK网络安全框架构建风险分类,将潜在的攻击拆解为具体的战术与技术,以便有条不紊地在造成实际破坏前捕捉异常行为。
2.异步监控与主动干预:监控体系利用其他可信的人工智能系统充当“监督者”,对工作智能体的推理、行动和计划进行持续审查。一旦主管智能体察觉有害意图,可在损害发生前执行同步介入阻断。目前该异步监控系统原型已分析了一百万个编码智能体轨迹,成功识别出高信号行为模式并应用于Gemini Spark智能体的实时数据保护。
3.动态安全能力映射:安全协议依智能体的两项核心能力指标进行动态分级扩展:一是规避检测能力,当智能体具备监督意识或不透明推理时,检测级别需从单纯的思维链文本监控(D1-D4)转向行为分析与内部机理检查;二是潜在危害能力,安全响应级别(R1-R3)依操作风险调整,低风险采用异步延迟审计,重大网络攻击等高风险行为则必须强制执行实时预防的同步响应。
为推动行业、政策制定者与学术界的生态协同,Google DeepMind同步发布了“智能体安全的三层”技术框架政策白皮书,从个体智能体安全、多智能体系统安全以及赋能网络防御者三个维度阐述了增强社会韧性的具体方法。
Atom Computing
2026-06-19:斩获1亿美元C轮融资,助推中性原子容错量子计算商用
Atom Computing宣布完成1亿美元的C轮融资,并与美国商务部签署1亿美元意向书,本周筹资总额超3亿美元。本轮融资由Third Point Ventures领投,DCVC和Cisco Investments等参投,资金将用于加速公用事业规模量子计算机的开发、部署与扩大客户采用。该公司目前在科罗拉多州博尔德运营数据中心并托管多个系统。
Atom Computing AC1000系统内部光学
Atom Computing量子计算机光学平台与激光控制系统
技术路线与核心系统指标:
1.中性原子技术路径:系统利用光学平台和激光器实现量子力学效应,不依赖传统需要超低过冷环境的稀释制冷机架构。该路径被投资方视为大规模实现容错系统的最可靠路径之一。
2.物理与逻辑量子位:其AC1000系统可提供1200多个物理量子位,经计算转换后的逻辑量子位约为30个。
商业化与本地化部署进展:
公司正与微软合作,计划明年在丹麦部署大规模量子计算机,该项目将成为Atom Computing的首次商业化本地化部署。
MangoBoost
2026-06-19:自DPU芯片延伸至整机架售卖,借交钥匙基建实现全面商业化
MangoBoost宣布从DPU芯片销售延伸到完整服务器机架系统,向客户供应交钥匙AI基础设施。韩国公司CEO Kim Jang-woo表示,公司今年全面启动商业化,预计包含自研DPU的完整服务器机架业务将带来100亿韩元的营收,并预测明年营收有望实现十倍增长。
自研硬件架构与全栈整合进展:
1.任务卸载与异构处理:公司核心技术由自研DPU芯片与AI推理软件平台LLM Boost构成。DPU主要用于卸载CPU的网络和数据移动任务,提升服务器间的通信效率,使CPU专注计算工作负载,以取代传统借增加服务器数量来解决通信瓶颈的做法。
2.整机集成与芯片选型:针对缺乏服务器设计与构建能力的客户,公司直接供应整机方案。新推出的Alphonso GPU服务器与Kesar存储服务器均集成了自研软硬件技术,其底座CPU和GPU全量采用AMD产品。
3.垂直整合竞争策略:公司采取垂直整合模式,除Nvidia外,MangoBoost是目前业界少数能够将芯片到软件进行全栈统一交付的供应商。
目前MangoBoost正筹集新一轮融资,市场预计其融资金额将达1500亿韩元,甚至可能超出该预期。在此之前,该公司的累计融资金额已达800亿至900亿韩元。
Synopsys
2025-07-02:推3DIC Compiler自动凸点与TSV规划解决方案
Synopsys在白皮书《如何为多芯片设计创建高效的凸点和穿硅通孔规划》中推出3DIC Compiler自动化方案。该方案解决AI、HPC及汽车芯片采用HBM与UCIe进行2.5D/3D异构集成时,数百万个高密度互连凸点的规划难题,在设计早期即可实现自动化布局与验证。
多芯片3D IC中的TSV、微凸点(Micro Bump)和封装侧凸点
采用UCIe高速标准化接口的Open Chiplet多芯片平台
3D芯片集成EDA流程中的高级凸点/TSV规划模块
1.攻克高密度互连瓶颈:传统手动规划无法应对混合键合工艺微缩带来的百万级凸点规模。3DIC Compiler允许在缺乏晶圆厂工艺数据时进行早期原型设计,避免因设计变更导致后期布线质量劣化或违反设计规则。
2.动态自愈与自动镜像:引入基于无限画布的区域规划,当凸点区域的大小或形状变动时,系统自动增删凸点并瞬间更新。自动凸点镜像功能可跨芯片精准计算目标坐标,实现正确构建的完美对齐。
3.实时ECO与全局多芯片DRC:提供色彩编码的工程变更指令追踪,内置设计检查器可在早期捕获超60种容差、缺失对接凸点、逻辑与黄金网表物理一致性等违规行为。
4.并行TSV规划与三维可视化:支持TSV与背面C4凸点并行规划,借轻量化虚拟内存模型评估其对标准单元区域和时序QoR的物理影响,在单一环境中融合划分、布线及黄金签核验证,支持大容量数据流2D和3D瞬时可视化。
VAST Data
2026-06-18:剖析其AI操作系统,借DASE架构整合KV Cache与向量存储
VAST Data发布最新VAST AI操作系统(AI OS),旨在将传统事件代理、分布式数据库、数据湖与数据存储整合为单一的AI原生数据平台。该平台基于底层的“分解、共享一切”(DASE)存储架构,使计算与存储资源实现独立扩展,以消除传统无共享架构在大数据量下因计算存储捆绑扩展导致的高昂成本。
平台在技术架构与核心业务场景上的数据演进主要表现为以下四个方向:
1.瓦解传统数据流水线:传统AI工作流中数据在对象存储、视频语言模型与向量数据库之间跨系统移动属于批处理过程,不仅增加故障点还会带来运行延迟。VAST AI OS将离散系统合并,使运行其认证硬件的本地化部署能够直接在集群内托管模型并执行GPU加速分析,减少系统间的数据传输开销。
2.多云全局命名空间:伴随Neocloud新型云服务商及边缘计算的扩展,针对大数据引力带来的高昂跨云传输成本,该操作系统在存储层提供全局命名空间。新的计算资源可直接访问数据而无需移动或复制,使数据流水线具备跨云可移植性。
3.长期上下文与KV Cache卸载:由于LLM上下文长度增长与并发用户扩展,KV Cache驻留在GPU HBM中的传统做法易导致内存耗尽并使GPU闲置。AI OS作为外部存储层直接承接KV Cache卸载与长期上下文记忆,打破GPU内存墙限制,并支持多智能体系统间的上下文共享。
4.内置高吞吐组件性能:在百亿级高维向量检索与实时日志可观测性压力下,平台集成了原生向量存储与事件代理。基准测试显示,其原生向量存储在500亿个向量规模下每秒处理超1000个查询,而独立向量数据库产品每秒处理不到100个;其原生事件代理在读写吞吐性能上也优于Apache Kafka。
该自研操作系统目前已在CoreWeave、Cursor、Pixar等企业实现部署。平台集成了对象、文件和块存储,提供事件驱动的函数与流水线及跨数据源自动同步,在当前闪存市场价格因AI热数据需求暴涨的背景下,用于优化企业HPC与数据密集型工作负载的资本性支出与运营性支出。
Hammerspace
2026-06-19:实施混合云数据编排策略,借统一数据平面化解GPU饥饿
Hammerspace提出混合云数据编排方案,将非结构化数据与底层硬件解耦,以解决传统存储产生的数据引力及数据孤岛导致的GPU闲置问题。该方案在存储层采用就地同化技术,无需手动复制或数据迁移即可将异构存储直接纳入全局视图,避免了迁移停机时间。
统一数据平面与混合云文件系统的核心技术机制:
1.元数据驱动工作负载迁移:借元数据与数据主体的解耦,组织可在不重构数据堆栈的前提下,直接依成本或性能配置将工作负载调度至不同的CPU或GPU计算资源。
2.全局命名空间构建:该文件系统桥接了HPC并行文件系统与对象存储桶,将其统一呈现为单个可挂载的全局命名空间,并依托智能缓存机制提供本地速度的远程数据访问。
3.无代码策略引擎:系统内置自动化分层机制,支持用户借非代码化策略(如指定8K视频文件在NVMe存储上保留30天)执行自动化的地理或性能层级数据移动。
4.主权合规与成本控制:允许设立特定目标,将敏感数据主体锁定制于本地,仅允许非敏感元数据全局可见,并借自动化生命周期管理减少跨云数据传输带来的出口费用(Egress Fees)。
科研动态
2026-06-19:蚂蚁集团发布UFP4预训练研究,统一4位网格消除FP4收缩偏差
蚂蚁集团与 Inclusive AI 团队发布关于大语言模型(LLM)低比特预训练的最新学术成果(arXiv 编号:2606.20381)。针对NVIDIA Blackwell/Rubin级系统与AMD MI350系列 GPU 等当前 FP4 硬件普遍采用的 E2M1 数据格式,研究团队指出该非均匀格式存在可表示箱几何不对称所导致的系统性负舍入误差,即“收缩偏差”。该偏差在神经网络各层间乘法累积并被随机阿达玛变换(RHT)放大,解释了现有 E2M1 基准低比特预训练不稳定的微架构根源。
论文提出 UFP4 统一 4 位训练方案并建议未来加速器重构底层低比特计算原语:
1.均匀网格避错机制:研究表明 E1M2 或 INT4 风格的均匀网格能够完全避开此类网格几何误差,更好地将 RHT 带来的桶利用率提升转化为量化质量。
2.UFP4 方案设计:该方案将 RHT 应用于全部三种训练矩阵,同时将随机舍入(Stochastic Rounding)范围严格限定于 dY 层面,以消除收缩偏差并提高跨大模型架构的预训练稳定性。
3.扩展性验证:在 Dense 1.5B 以及 MoE 7.9B、MoE 124B 规模的长期长文本预训练测试中,UFP4 在规模定律(Scaling Laws)分析与消融实验中,均实现了比强 E2M1 基准更低的 BF16 相对损失退化。研究强调未来的算力加速器应将 E1M2 或 INT4 均匀 4 位网格视作与 E2M1 相同的一流训练基元(First-Class Training Primitives)支持。
2026-06-18:中国科研团队发布WRBench世界模型研究,指出现有模型缺失持久状态核心
中国科研团队在 Hugging Face Papers 发布关于世界模型(World Models)的最新研究论文(arXiv 编号:2606.20545)。研究指出,当前主流世界模型在缺乏实时观察(未观察到)的情况下,无法在内部维持一致的世界状态。现有的主流模型仅能做到按需渲染令人信服的视频帧,而无法构建一个随时间推移、与外部观察解耦的内部演化状态(即物体在镜头移开时持续存在、事件在视野外持续推进)。现有基准测试因过度奖励图像保真度、运动和相机可控性等表面属性,未能有效暴露这一技术盲点。
论文推出首个诊断基准 WRBench 并提出世界模型底层架构的重构方向:
1.诊断基准机制:WRBench 将相机运动视为对可观测性的干预,借人工校准的链式结构进行系统评估。其核心测试维度包含:相机是否执行请求的交互、场景在视野中是否保持连续且可识别、返回的目标是否与预设事件的客观发展逻辑保持一致。
2.核心漏洞披露:在对跨越 4 种控制范式、涵盖不同模型族及规模增量的 23 个模型、总计 9600 个视频进行深度测试后发现,当前系统无一例外地将未观察到的世界维持为“跟踪镜头”状态(即视线返回时,目标仍停留在被放弃的原始节点,未能随时间在视野外推进事件)。
3.架构重塑方向:研究表明,鲁棒的世界状态演化无法借提升图像清晰度、强化几何先验、引入更严密的控制或单纯扩张参数量(Scaling Laws)来解决。团队提出,应将物理状态内核的稳定性、以及视点干预下世界线的一致性作为世界模型设计的首要目标,使模型真正捕捉物理世界的展开规律,而非仅仅预测下一帧的画面呈现。
更多交流,可加本人微信
(请附中文姓名/公司/关注领域)