标签

传字节跳动自研 CPU 破局,加速 AI 基建布局

IT 之家 5 月 28 日讯,路透社引述三位知情者透露,受芯片价格攀升及供应短缺周期延长的影响,字节跳动的扩张步伐受阻。为应对日益增长的 AI 基础设施需求,字节跳动正着手研发自主 CPU。 此举反映出 AI 行业正迅速向“推理”阶段转型。在推理环节,AI 模型需执行智能体任务,这对 CPU 性能提出了更高要求,且需与英伟达 GPU 协同作业。此前,英伟达 GPU 一直是 AI 浪潮中的核心硬件。 近几个月来,行业向推理端的转变引发了 CPU 短缺。谷歌、亚马逊及微软等全球超大规模云服务厂商也在研发定制

2026-05-29 02:42:08  |  7 阅读

AI算力转向推理,CPU配置迎来上行

AI算力的重心正从训练阶段逐步转向推理环节,国产算力底座的再搭建,已成为当前算力与芯片相关板块最关键的产业走向。本文着重梳理了英特尔关于CPU/GPU配比变化的公开数据(由1:8调整到1:1,甚至出现2:1的情况),并进一步解读DeepSeek V4对华为CANN架构的系统性适配所带来的战略意义。算力重构:从GPU单核主导到CPU-GPU协同发力,DeepSeek V4如何重新定义国产算力的新“底座”就在近日,全球人工智能产业出现了明显的结构性转向。DeepSeek V4的发布,以及其对华为昇腾CANN生

2026-04-28 02:04:42  |  5 阅读

AI交互的数学底层逻辑

使用AI的完整流程犹如矩阵运算= 大模型本体:由万亿参数构成的恒定巨型矩阵= 完整输入提示向量:发送给大模型的所有信息总和= 输出结果向量:大模型生成的回复内容核心法则:在推理期间,输入无法改变矩阵中的任何元素完整的 AI 产品逻辑链条大模型接收的并非单一的用户输入而是一个拼接后的复合向量系统技能记忆文件用户每个向量的具体含义用该公式解释常见误区训练与推理:最本质的差异1. 推理阶段(使用者对客户端的操作)操作:用固定 A 乘以不同 X,得到不同 Y特点:A 保持不变,输入 X 不会改变 A速度:极快,几

2026-04-14 07:50:32  |  3 阅读