天地一体化算力:协同构建太空与地面网络
目前,人工智能正从文本互动及交互智能向多模态交互与执行智能快速跨越,对算力的规模需求日益激增。与此同时,全球自然灾害频现、地缘局势日趋紧张,对算力的实时响应能力提出了极高的挑战。但是,现有算力设施主要依托地面建设,在远海、极地、荒漠等地带存在明显的覆盖盲点,且抗毁性能较差。一方面是需求呈爆发式增长,另一方面是算力覆盖存在空缺。该如何填补这一差距?
“打造涵盖太空及地面的天地一体算力基础设施,是解决这一问题的关键所在。”国家超级计算天津中心党组书记、首席科学家孟祥飞指出,借助将算力部署从地面拓展至太空,有望彻底消除覆盖盲区、增强系统韧性,从而满足实时响应及规模扩大的双重需要。近期,在2026世界智能产业博览会人工智能与太空数智设施发展交流会上,太空数智基础设施联合攻关体宣告成立。该攻关体致力于我国天地一体算力基础设施,期望通过全链条协同创新,在核心技术领域实现突破。
新成立的联合攻关体重点围绕星上超级算力载荷产品化、在轨智能处理单元、星地协同调度以及太空系统自治运维等关键共性技术,旨在构建起算力、任务、数据协同的天地一体超智数融合基础设施。
孟祥飞表示,把地面成熟的算力设施移植到太空面临着诸多挑战。
供电是首要难题。如今全球功率最大的人造卫星发电功率仅为25千瓦,而未来天基超级数智装置的需求起点便是100千瓦乃至兆瓦级,两者相差一个数量级。这既需要轻量化、高效率的柔性太阳电池阵,也要求能源与热控的一体化设计。“简而言之,星上算力载荷必须在极端的体积、重量、功耗和辐射环境下运行,与航天平台的能源、热控、结构紧密耦合,仅靠单点突破无法解决问题。”孟祥飞解释道。
算力方面面临巨大跨越。当下全球已部署的卫星单星峰值大约为1P级,而未来天基数智基础设施的需求是单星算力达到100P以上。“整整两个数量级的提升,绝非仅仅是性能的堆砌,而是要求在高密度集成结构、分布式计算架构等软硬件层面实现从0到1的原创性突破。”孟祥飞称。
星地协同同样是难以回避的难题。星地链路存在数百毫秒的时延和间歇性连接,传统模式下,一个地面站一天仅有几十分钟的通信窗口,卫星只有在过境时才能上传指令。一旦遇到突发应急计算需求,从地面发出指令到卫星响应往往需要数十分钟,最佳的处置时机早已错失。未来的太空算力网络要求实现近实时协同,地面动态分配算力,卫星自主调整任务队列。唯有突破星上轻量级调度器、星地预测性资源预留等技术,才能彻底改变“只能过境操控”的被动局面。
在轨无人值守也是一大难关。针对卫星故障,传统做法是地面发现后发送指令进行修复。但若链路不通,从故障发生到修复,短则几小时,长则数天,卫星在此期间可能功能降级甚至彻底失效。“未来百千瓦级大算力卫星将搭载成百上千个计算核心,故障概率将呈指数级上升,地面根本来不及处理。”孟祥飞表示。唯一的出路,就是让卫星自身“长出”免疫力——通过微重启、任务迁移等全面自愈能力,实现零人工干预下的稳定运行。
针对这些难题,联合攻关体已确定了多个关键技术方向,包括模块化可扩展算力载荷、星载高性能国产芯片、在轨智能运管、空间计算软件栈、能源热控一体化、空间用柔性太阳电池阵、星地任务协同调度等多个关键领域。其中,国家超级计算天津中心以“天河”系列超级计算机为核心,具备异构算力统一调度、超大规模并行计算等长期积累的核心技术,将为天基算力网络的构建提供重要的地基“操作系统”级能力支撑。此外,飞腾、曙光、中电科蓝天、航天518所等单位也将在星载芯片、能源热控、柔性太阳电池阵等各自优势领域协同合作。(记者 陈 曦)