推理速度_标签-酷阅新闻

人工智能掌控人造太阳：128微秒的推理速度

两条消息，单独看都震撼。合在一起审视，趋势更加明朗。第一条：中国环流三号首次达成双亿度运行。离子温度1.17亿度，电子温度1.6亿度。EAST全超导托卡马克持续稳态运行1066秒。两套聚变装置超导磁体，全部国产化。第二条：美国Valar Atomics于7月1日展示了一项成果。利用微型核反应堆，直接为一台NVIDIA DGX Spark供电，执行AI推理任务。美国首次有先进反应堆实际产出电力。第一度电，输给了AI。一个助力核聚变，一个助推AI。相互滋养。核聚变最棘手的并非温度。而是驾驭。等离子体温度过亿，

2026-07-05 14:29:25 | 33 阅读

83亿美元估值背后：Together AI完成8亿美元C轮融资，开源AI云平台加速崛起

Together AI 今日宣布完成8亿美元C轮融资，本轮由Aramco Ventures领投，Vista Equity Partners、General Catalyst、Emergence Capital、NVIDIA、March Capital、Pegatron、S Ventures（SentinelOne）及 Schneider Electric 旗下风险基金 SE Ventures 等机构共同参投。融资完成后，Together AI估值达83亿美元，较2025年2月由General Catal

2026-07-02 14:59:09 | 19 阅读

AI科技日报·2026年6月10日(Siri AI重磅登场)

每日精选10条AI科技要闻，一键速览行业前沿 👇关注不迷路👇大模型竞赛再掀热潮，Anthropic以惊人速度推出新一代旗舰产品。美东时间6月9日，Anthropic正式推出新一代大模型Claude Fable 5，并同步发布Claude Mythos 5。两者基于相同底层架构，其中Fable 5是首个面向公众开放的Mythos级模型，定价为每百万输入Token 10美元、每百万输出Token 50美元。据披露案例，支付巨头Stripe在5000万行Ruby代码库中，Fable 5仅用一天便完成了原本需团队

2026-06-10 14:05:51 | 20 阅读

谷歌发布超高速AI模型，284.2 token/秒刷新响应速度纪录

2026年5月23日 · AI大模型 · 人工智能AI研究社Google I/O 2026刚结束，谷歌就一口气发布了三个新模型，没有预热，没有分阶段推送，直接全部亮相。最引人注目的是Gemini 3.5 Flash，推理速度达到284.2 token/秒，这个数字比GPT-5.5快了4倍。速度这个东西，说出来可能没感觉，但实际用起来差别很大。你问它一个问题，284 token/秒意味着几乎感觉不到延迟，就像跟人聊天一样顺畅。更重要的是，Flash定位高并发、低成本实时交互，这不是为了跑分好看，而是真的要把

2026-05-23 20:22:27 | 22 阅读

AI 新趋势：边缘计算崛起，蒸馏技术重塑本地智能

理解 AI 为何必然走向边缘，不能始于硬件，而应源于对“心流（Flow State）”的深刻洞察。在 AI 芯片领域，长久以来我们受制于 NVIDIA 定义的“吞吐量（Throughput）”指标——即单位时间输出 Token 的数量。这好比衡量大巴车的载客量，只要一次能运送足够多人，便视为高效。然而，当 AI 转变为实时编程助手或虚拟伴侣时，底层逻辑彻底改变。若 AI 助手每秒仅输出 40 个词，你的思维将不断被打断，交互显得“割裂”；但若其速度达每秒 200 词，甚至快过阅读速度，AI 便从“对话框”

2026-05-19 19:32:51 | 12 阅读

清华五道口AI俱乐部：万亿模型百倍提速，千亿投资与政府级项目齐发

大家早安！这里是清华五道口AI俱乐部，每日为您呈现最新的AI行业动态。蚂蚁百灵推出万亿参数模型Ling-2.6-1T，聚焦“快思考”模式，对标GPT-5.4非推理版本近期，蚂蚁集团百灵团队发布了万亿级旗舰模型Ling-2.6-1T。该模型融合了MLA与Linear Attention架构，创新性地放弃了主流的“慢思考”推理方式，通过极低的Token消耗实现高效的“快思考”推断。这不仅大幅削减了计算成本和响应时间，还确保了性能的卓越。在综合实力上，Ling-2.6-1T直逼GPT-5.4非推理版，并在AIM

2026-04-26 07:59:02 | 13 阅读