标签

单台700万仍供不应求!英伟达B300服务器在华价格狂飙

据快科技5月1日消息,NVIDIA B300 AI服务器在中国大陆市场的实际成交价格已攀升至每台约700万元人民币,折合近100万美元,相比去年年底约400万元的价位几乎上涨了一倍。 作为对比,搭载8块B300 GPU的同型号服务器在美国市场的售价大约为55万美元,较去年底的50万美元仅有小幅上扬。中国市场的高昂溢价使其价格几乎翻倍。 价格的急剧上涨已迫使部分预算有限的AI企业调整策略,从直接购买转向租赁模式。据了解,B300服务器一年期租赁合约的月租金已上涨至19万元人民币,并且仍需排队等待设备资源。

2026-05-01 20:02:50  |  4 阅读
DeepSeek多模态论文连夜撤回,核心技术究竟是什么?

DeepSeek多模态论文连夜撤回,核心技术究竟是什么?

点击下载新浪财经APP,获取全球实时汇率行情 选择在假期前夕推出重磅技术论文,‘DeepSeek风格依旧’。 DeepSeek如今实现了‘视觉感知’。此前,他们悄然启动了多模态功能的灰度测试。部分用户在首页看到新增的‘识图模式’。上传图片后,模型能像人类一样解读视觉内容。 4月29日,多模态团队负责人陈小康发文表示:‘现在,我们能看到你了。’这是DeepSeek聊天产品首次集成多模态功能。 紧接着在4月30日,他们发布了题为《Thinking with Visaul Primitives》(《用视觉原语思

2026-05-01 19:37:43  |  7 阅读

2026-2028年AI行业发展趋势与投资机会

2026至2028年人工智能产业走向展望一、当下行业态势分析细分领域 现状 发展方向基础大模型 多家巨头并存(OpenAI/Anthropic/Google/Meta/DeepSeek) 竞争重点转向差异化AI Agent 早期起步→高速增长期 最大变数,2年内迎来爆发AI 硬件 NVIDIA 占据主导,ASIC 紧随其后 算力消耗不断倍增AI 应用 代码/客服/设计等行业垂直应用落地 全行业覆盖速度加快二、关键发展趋势预判🚀 1. AI Agent 时代正式开启2026-2027 是 AI Agent

2026-05-01 17:37:16  |  6 阅读

行业一周热点:数据局称AI训练推理并重

要闻速览IAE智行众维®1.雷军:小米汽车2027年开启出海 德国将成首站2. 奇瑞与英伟达达成战略合作3. 佛瑞亚拟以18.2亿欧元处置内饰相关业务4. TTTech Auto完成更名为TrustMotion5. 从车端智能到Physical AI 联想车计算2.0的路线升级6. 受AI投入支出及法律审视担忧影响 Meta股价走低7. 高德车服发布面向全生命周期的汽车服务方案8. 魔法原子推出自研世界模型Magic-Mix9. 卓驭科技发布“原生多模态基础模型”并与中国一汽开展战略合作10. 国家数据局

2026-05-01 14:41:51  |  5 阅读

AI点燃的两段地理科幻

三部曲塞拉·万斯十四岁那年,第一次清楚明白:河流并不只是水。那天她的老师格兰杰博士在黑板上画下这一点——泰斯流域,线条简洁得像一只手掌——接着说:你们以为在看的是水的流动。可真正移动的,是土地在一万年前做下的选择;而这选择至今还在运转。她说完便停住了。大多数学生把这句记在本子里。只有塞拉把笔平放在课桌上,久久盯着黑板那张图。窗外,真正的泰斯河正从深秋的光里穿行,灰色、沉稳、不急不缓。她从流域图望向窗外的河,再从河看回图。就在那一瞬间,她理解世界的方式被彻底改写。这也是卡斯特尔学院存在的理由。它并不只是要把

2026-05-01 09:31:53  |  5 阅读

英伟达推理芯片提前出货:千亿链条新机遇

引言2026 年 4 月,供应链端传出重要进展:英伟达在完成收购 Groq 后推出的首款推理专用芯片 Groq 3 LPX,将原本计划在年底才启动的发货安排,提前到第三季度展开。预计全年交付量可达 150 万颗,同时配套的 LPX 机架交付规模超过 6000 台。此次调整并不只是简单的产能加快,更像是 AI 产业从 “训练驱动” 转向 “推理释放”的关键拐点。目前全球 AI 算力需求的结构正在重塑:到 2026 年,推理算力需求预计将达到训练算力的 4-5 倍;在中国市场,这一比例可进一步放大至 8 倍。

2026-05-01 07:52:31  |  7 阅读

第九届数字中国峰会:人工智能与太空算力成焦点

4月29日,在第九届数字中国建设峰会上,国家数据局、工信部相关负责人围绕Token(词元)、人工智能、太空算力产业发展进行了深入解读。人工智能正迈向训练与推理并重的新纪元国家数据局局长刘烈宏指出,人工智能的发展催生了数据生产的新模式。当前AI正加速演进,呈现出从大语言模型向多模态模型延伸,从基础模型向行业模型深化,从内容生成向智能体自主决策执行跨越,从数字智能向具身智能拓展等趋势,为数据生产带来了结构性变革。刘烈宏提到,2025年全国数据生产总量预计达52.26泽字节,较上年增长27.28%。其中,由系统

2026-04-29 20:49:13  |  7 阅读

AI日报:推理成本骤降,多模态架构统一

今天是2026年4月29日,为您汇集AI行业的最新热点资讯,一同聚焦今日AI领域的重大进展。👉 百万token调用成本迈入个位数时代最新数据显示,过去三年大模型推理成本已下降逾百倍,目前百万token调用成本已降至人民币个位数。硬件优化、量化技术以及推理架构的三重突破共同促成了成本的显著降低。这意味着以往仅限于高价值场景的AI能力,如今可大规模应用于几乎所有行业。成本的断崖式下降正在重塑数字经济的根本逻辑,AI正从“奢侈品”转变为如同水电般的基础公共服务。👉 单一模型处理所有模态,跨模态理解能力实现质变今

2026-04-29 16:10:00  |  7 阅读

深度解析:AI服务器的训练与推理成本构成

AI服务器依据其主要应用领域,可被划分为训练型和推理型两大类。这两类服务器在硬件配置、成本构成以及供应商选择等方面,都展现出明显的区别:概括而言,AI训练服务器的设计理念是“性能优先”,其成本绝大部分(70-80%)集中在GPU的购置上;而AI推理服务器则遵循“能效与成本兼顾”的原则,GPU所占成本比例有所下降(60-70%),相应的,CPU、存储和网络等组件的成本比重则相应增加。在供应商的选择方面,训练型服务器倾向于采用国际顶尖的GPU产品,而推理型服务器则更加侧重于国产化替代方案以及针对特定应用场景的

2026-04-29 12:20:46  |  6 阅读

国产AI算力链景气上行

一、核心:两大趋势锁定主线,行业景气度持续抬升1. 国产AI芯片加速崛起:国内AI芯片市场份额持续扩大,本土供应链关键环节的竞争力不断增强,国产替代进程稳步推进;2. 超节点放量可期:国产超节点相关技术已基本成熟,正迈向批量交付阶段,或将成为驱动行业演进的关键主轴。二、四大核心逻辑:支撑算力链长期走强逻辑1:AI需求全面释放,算力消耗与商业化同步突破AI需求的加速增长,是算力链保持向好的根本动力,主要体现在以下三方面:✅ Token消耗显著上扬:豆包大模型日均Token用量突破120万亿,短短3个月实现翻

2026-04-29 11:26:48  |  6 阅读

本周AI动态速览:模型升级与算力融合

OpenAI在四月下旬发布了GPT-5.5及Pro版本,此版本在更高的推理精确度和更广阔的上下文窗口方面实现了突破,并已逐步整合至企业级应用和开发工具中。新模型在代码生成、复杂逻辑分析以及多模态交互能力上均有显著增强,堪称近期最重要的大模型更新。DeepSeek发布了其V4模型,该模型采用了大规模的MoE(专家混合)架构,支持超长上下文窗口,并具备卓越的推理性能。此模型着重于降低推理成本和提升效率,是中国当前大模型领域的一项重要成就。DeepSeek V4已成功适配华为昇腾AI芯片,从而在中国本土算力体系

2026-04-29 09:19:56  |  3 阅读

Ubuntu 26.04 LTS:AI能力深度融合,本地化推理成关键

Ubuntu 26.04 LTS问世之际,Canonical宣布未来一年将聚焦于本地推理能力的系统层面整合。该团队的目标是在不触动Linux生态核心的基础上,赋予系统情境感知和自动化处理能力,应用于日志分析和故障排查等领域。官方声明指出,此举并非将Ubuntu打造成AI产品,而是将AI融入系统固有能力,旨在增强桌面及服务器的易用性和安全性。选择本地推理路径,与Linux社区一贯重视的隐私和可控性原则不谋而合。Canonical亦将携手芯片制造商,拓展无缝集成和情境感知功能,同时确保新功能的安全性与灵活性处

2026-04-28 21:43:15  |  5 阅读
芯片初创瞄准AI内存瓶颈突破路径

芯片初创瞄准AI内存瓶颈突破路径

超大规模的人工智能模型让服务器负荷剧增,高端芯片也更容易出现闲置。谷歌以及元宇宙领域(Meta)的多位资深从业者表示,他们已经摸索出可行的破解思路。 内容摘要 Majestic Labs AI 打造了新一代服务器系统“普罗米修斯”,核心目标是在运行超大 AI 模型时,打破由内存容量与带宽带来的性能瓶颈。 由谷歌(Alphabet 旗下)与 Meta 过往关键高管组成的团队,研发了一套新的服务器架构,意在应对当前 AI 模型规模持续膨胀、技术复杂度不断上升所带来的部署与运行难题。 Majestic Labs

2026-04-28 20:53:54  |  4 阅读

AI价值链重排:GPU要配CPU,还要配设备与能源

AI浪潮的价值传导:GPU→CPU→设备/能源 关键看点:英特尔(Intel)CPU近期遭到市场热捧,股价走强的关键原因在于AI技术路线正在把重心从“训练”逐步转向“推理”并进入智能体(Agent)阶段。对整个AI系统而言,CPU相当于“调度中枢”和“控制平面”,其战略意义因此被市场重新评估并显著上调。此前不少资金过度聚焦GPU的算力优势,却在一定程度上忽略了AI规模化落地后,对更复杂的任务编排、资源管理与运营支撑所带来的CPU基础设施需求。 1. 为何英特尔CPU近期会更受关注?—— 技术栈演进推动价值

2026-04-28 18:03:40  |  5 阅读
壁仞科技午盘涨超5% 深度求索V4完成壁砺166适配优化验证

壁仞科技午盘涨超5% 深度求索V4完成壁砺166适配优化验证

扎根香港,面向全球。新浪财经全球资本峰会金曜奖投票现已启动!聚焦最具价值的资本力量,你的每一票都很关键 立即参与投票 壁仞科技(06082)午间股价上涨超过5%。截至发稿,股价涨幅为5.02%,报47.26港元,成交额达到1.63亿港元。 近期,壁仞科技官方消息称,深度求索团队发布了全新系列模型DeepSeek-V4的预览版本,并同步开源。依托成熟的BIRENSUPA™软件栈,以及自研GPU全栈智能体“AIModelMaster”,壁仞科技已快速完成DeepSeek-V4在旗舰通用GPU壁砺™166系列产

2026-04-28 15:03:10  |  7 阅读