标签

AI大模型动态 | 5月30日

Anthropic 完成史上最大 AI 私服融资,投后估值达 9650 亿美元,首超 OpenAI(8520 亿)成为全球估值最高 AI 企业。Altimeter Capital、Dragoneer、红杉资本领投,三星、SK 海力士、美光科技战略入股。年收入突破 470 亿(去年同期仅 40 亿),预计 Q2 首现运营盈利。Apollo 与黑石还为其发起约 360 亿 TPU 芯片私募信贷。Anthropic 发布旗舰模型 Claude Opus 4.8,距上代仅 41 天。关键进展:代码缺陷忽略概率降约

2026-05-30 16:09:16  |  5 阅读

AI计算集群概述

早期大语言模型训练多采用单卡模式,例如2018年时BERT-Large(3.4亿参数)可直接在单卡上完成训练。然而随着模型参数与数据量呈指数增长,单卡训练遇到三个主要限制:1.显存容量限制一个拥有700亿参数的模型,若采用FP16格式存储,仅参数存储就需140GB空间,而单张H100显卡仅有80GB显存。2.计算时间约束 大模型训练所需的浮点运算量极为庞大,以GPT-3 1750亿参数为例,单张H100显卡需要约5年才能完成训练。3.数据传输瓶颈 大语言模型训练需要处理TB至PB级别的海量语料,但单卡IO

2026-05-12 08:01:38  |  5 阅读

AI与科研深度融合:中科曙光领跑AI4S新赛道

尽人皆知,人工智能(Artificial Intelligence,简称AI)有三大核心要素:数据,算法,算力。那么在AI大潮席卷全球的今天,当人工智能遇上科研,将会迸发出怎样的火花?在中科曙光AI4S计算集群发布会上,我们见证了未来的无限可能。国内最大规模AI4S计算集群亮相日前,中科曙光在郑州,成功举办了科学智能(AI for Science,简称AI4S)计算集群发布会,正式对外宣布国内最大规模的6万卡AI4S计算集群投入运营。在大会开幕致辞中,中国科学院院士、河南省科学院院长徐红星对中科曙光AI4

2026-04-20 21:58:24  |  4 阅读