标签

AI要闻速递:DeepSeek V4价格长期下探;OpenAI手机瞄准2028;Anthropic万亿估值下Token成本上扬

发布时间:2026-04-27 16:38来源:微信阅读:7

• DeepSeek V4宣布长期降价,编程开销直降83%

• OpenAI传与联发科、高通协作做手机,目标2028年规模出货

• Anthropic估值站上万亿,重度用户Token疑似“隐性加价”35%

• 美国NSA据称已低调启用Anthropic Mythos用于漏洞挖掘

• AI公司高管成现实威胁对象,黄仁勋年安保支出345万美元

• 23岁非科班借ChatGPT仅80分钟攻克60年数学猜想

DeepSeek V4永久降价,编程成本骤降83%

DeepSeek对外公布:V4系列“输入缓存命中”计费将永久下调到原价的1/10,并同步贴上"AGI for Everyone"标识。开发者实测显示,同一编程任务费用从31.73元降到5.34元,综合节省约83%。其中V4-Pro的输入缓存命中率约95%,Flash约91%,意味着绝大多数调用都能吃到最深折扣。其根本原因在于混合专家(MoE)与稀疏注意力的工程优化,使单token推理FLOPs仅为V3.2的27%,KV缓存占用也压到约10%。社区里已出现“全量切到DeepSeek V4,月度账单下降90%”的真实反馈。

点评:性能差距被抹平、价格直接打一折后,是否切换不再是工程判断,而是财务选择。

OpenAI造手机:2028年量产,要重写交互逻辑

有消息称,OpenAI正与联发科及高通共同推进手机处理器方案,立讯精密被指为独家代工方,计划在2028年进入量产阶段,初期对准全球每年约3—4亿台的高端机市场。这款产品的关键并非“更强芯片”,而是让AI agent替代传统App:用户不必点开应用,而是以对话直接完成任务。外观由前苹果首席设计官Jony Ive主导,OpenAI硬件团队规模据称已扩至200人。其底层逻辑在于:只有把操作系统与硬件一并握在手里,AI agent才能持续获取上下文并提供"全面服务"。相关传闻发酵后,立讯精密周一股价直接涨停。

点评:苹果用十五年把“App生态”推成默认范式,而OpenAI押注下一代入口应由agent改写。

Anthropic估值破万亿,但用户在为暗涨买单

Anthropic估值据称从3800亿跃升至1万亿美元,企业端份额达到73%,Claude Code年化收入约25亿美元。与此同时,重度用户却频频吐槽“Claude贵到用不起”——在Opus 4.7版本中,相同任务的Token消耗疑似悄然增加约35%;当订阅额度耗尽后,系统会自动转为按量计费,且每日扣费上限高达$2000,同时还收紧了通过第三方框架降本的通路。其2024年毛利率仍为-94%,预计到2027年才可能停止大规模烧钱。一边是订阅高速扩张,一边是通过“分层定价”把成本缓慢转移到重度人群。

点评:当用户迁移门槛足够高,提价不一定需要“官宣提价”。

Claude免费交互式图表上线,对标Gemini每月200美元功能

Anthropic为Claude上线交互式图表与流程图生成功能,免费用户也可直接使用,对标Google Gemini高级版每月200美元才提供的同类能力。该能力以代码生成驱动,并可与第三方应用进行联动。与此同时,OpenAI与Google也在推出相近功能但侧重点不同:OpenAI更偏教育用途,Google更偏图像标注,而Claude更像通用白板工具。

点评:当模型跑分拉不开距离,“更会表达与呈现”正在成为新的竞争维度。

英伟达开源Lyra 2.0:单张2D照片生成可漫游3D世界

英伟达宣布免费开源Lyra 2.0,可把单张2D图片转化为可交互、可漫游的3D世界,面向机器人导航与具身AI仿真等用途。其底座为140亿参数的Wan 2.1扩散Transformer:标准流程需35步去噪,而蒸馏版仅要4步。通过几何路由与自增强训练,缓解了“转身就忘”的空间遗忘与时间漂移问题,长时程3D一致性显著优于以往方案。

点评:生成式AI从“出一张图”走向“搭一个世界”,具身智能的数据瓶颈才算真正开始松动。

全球首个医疗视频理解大模型开源

uAI Nexus MedVLM作为全球首个开源医疗视频理解大模型发布,支持4B/7B参数规模,可单卡部署,覆盖内镜、腹腔镜、机器人手术等多类场景,并同步发布6245个视频-指令测试集作为公共评测标准。其在手术安全评估上准确率达到89.7%,而GPT-5.4仅16.4%;时空动作定位mIoU达到Gemini-3.1的3.2倍。

点评:通用大模型在垂直专业里的“降维神话”,正被越来越多的行业标尺逐一拆穿。

GPT-5.5 Pro视觉智商145,跨入门萨门槛

OpenAI的GPT-5.5 Pro在视觉智商测试中取得145分,超过99.9%人类,被称首次达到门萨俱乐部门槛;其文本智商为130分,视觉较文本高出15分。同时,Token消耗减少45.6%,智能分数提升1.77倍。OpenAI也被认为进入“月更”节奏。

点评:当AI在智商指标上全面超过个体,“它是否真的理解”的争论往往已不再影响权力交接。

23岁门外汉携ChatGPT,80分钟破解60年数学猜想

23岁、缺乏高数背景的Liam Price与ChatGPT通过“直觉式提示”协作,在80分钟内解决了困扰数学界60年的Erdős Problem#1196,方案结合马尔可夫链与冯·曼戈尔特权重。陶哲轩评价称:过去60年人类研究者可能整体走偏,而AI没有历史路径依赖的包袱。

二本女生用免费AI考上北大,真相是边界感

陈雨欣借助DeepSeek、豆包等免费AI工具跨专业考入北大社会工作专业(全国仅招11人)。关键并非工具本身,而在于给AI设定不同角色(如出题老师、面试官),并严格切分"学习阶段"与"闭卷模拟阶段",最终累计产出近30万字练习材料。

AI一夜清理5000个GitHub Issue,成本不到1000美元

OpenClaw创始人开发ClawSweeper工具,通过50个Codex实例并行扫描,一天内关闭5000多个无效Issue,平均单个成本约0.2美元。其设计原则极度保守——仅在7类明确情形下执行关闭、不触碰维护者条目,并将全部审查记录公开可查。唯一的主要瓶颈来自GitHub API的速率限制。

亚马逊追加投资Anthropic,累计达130亿美元

亚马逊再度向Anthropic投入50亿美元,使累计投资达到130亿美元,并计划后续再追加200亿美元;同期谷歌也向Anthropic投入400亿美元。两大云厂同时押注同一家公司,本质是在为AGI时代的“算力—模型”绑定关系提前买保险。

腾讯阿里洽谈以200亿美元估值投资DeepSeek

据高盛披露,腾讯与阿里巴巴正在洽谈以逾200亿美元估值投资DeepSeek。同期智谱估值约530亿美元、MiniMax约310亿美元。国内模型阵营正进入“差异化定价权”阶段,编程能力、任务完成率与多模态能力逐渐成为分水岭。

无界动力天使轮累计融资超2亿美元,斩获5亿元订单

通用具身智能公司无界动力完成天使++轮融资,天使轮累计融资超2亿美元,并与远景科技集团签下5亿元全球市场订单,覆盖欧洲、亚洲多个国家与地区。其技术路线选择隐空间世界模型而非主流VLA架构,并已与汽车产业链头部企业达成战略合作。

清华丁宁创立"自然意志",估值40亿

清华大学助理教授丁宁创立通用物理智能公司"自然意志",聚焦“具身大脑”方向,IDG资本、峰瑞资本、真格基金参与天使轮投资,估值达40亿人民币。丁宁在谷歌学术引用超7000次,曾发表Nature Machine Intelligence封面论文。

美国NSA秘密部署Anthropic Mythos做漏洞挖掘

尽管五角大楼将Anthropic列为"供应链风险",但美国国安局据称已秘密使用Mythos大模型开展漏洞发现与防御性网络安全任务。白宫计划向多个联邦机构开放定制版本,Anthropic为相关项目提供1亿美元额度,且据称已识别数千个零日漏洞。

AI高管成袭击目标,黄仁勋年安保费345万美元

英伟达2025年为黄仁勋支付的住宅安保等费用达345.3万美元,奥特曼等AI高管也被认为已成为现实世界的袭击目标。Pew调查显示,50%美国成年人对AI“担忧多于兴奋”,57%认为AI带来的社会风险高于收益。企业叙事里的“革命性红利”与公众感受到的负面冲击之间,出现了明显错位。

奥特曼为枪击案AI使用记录向加拿大社区道歉

OpenAI CEO奥特曼就加拿大Tumbler Ridge社区枪击案相关AI使用记录公开道歉。该社区今年2月发生造成8人死亡的枪击事件,嫌疑人曾使用ChatGPT账号发布暴力内容。此前OpenAI员工建议向执法部门报告,但管理层未采纳。加拿大正考虑禁止16岁以下青少年使用AI聊天机器人。

Meta员工疯狂刷Token,一月烧掉200万美元

Meta内部名为"Claudeonomics"的排行榜引发8.5万员工比拼Token消耗,最高个人单月消耗3285亿Token、成本约200万美元,全公司30天总消耗超过60万亿Token,并出现外挂刷分、修改系统数据等作弊行为。尽管Meta随后撤下排行榜,但Token用量已被纳入绩效评估。

Token不是货币,是智能经济的计量协议

腾讯科技深度文章指出,Token本质并非传统货币,而是兼具基础设施、流量商品、无形资产与知识产权属性的新型价值载体。中国日均Token调用量已突破140万亿,相比2024年初的1000亿增长逾千倍,部分模型API价格降幅超过95%。Token的主要消耗者正从人类转向机器,这意味着上限不再由人口规模决定,而更取决于经济体系可创造的价值总量。

AI是匹脱缰野马,Harness才是关键能力

小马智行CTO楼天城在专访中提出,AI已具备工具调用与自我演进能力,人类角色将从“教练”转向“执行者”。其PonyWorld世界模型2.0让AI成为总教练,能够自我诊断并定向进化。当AI司机的安全性全面超过人类后,再让人类工程师手把手教AI开车,"无异于让业余棋手去辅导AlphaGo"。

奇点临近:全球AI终局只剩OpenAI和Anthropic的双人舞

新智元分析认为,OpenAI(30.5GW算力)与Anthropic(5.5+GW)已形成断层优势。AI能力跃迁周期从2024年的12个月压缩到2026年的3个月。GPT-5.5依托Blackwell集群体现算力优势,而Anthropic则更依赖ASIC优化。谷歌400亿美元押注Anthropic,本质上购买的不是当下结果,而是未来的加速度。

DeepMind开源TIPSv2

通过iBOT++、Head-only EMA与多粒度文本三大创新,零样本分割mIoU提升+14.1,9项任务全面领先。

斯坦福LLM-as-a-Verifier框架

通过细粒度评分、多次验证和评估标准分解,在Terminal-Bench和SWE-Bench Verified上拿下SOTA,超越Claude Mythos和GPT-5.5。

上交大开源SkVM

面向Skill的语言虚拟机,可让30B小模型获得匹配Opus 4.6的精度,减少40% Token消耗、最高50倍速度提升。

今天最耐人寻味的对照在于:DeepSeek把价格长期压到一折,而Anthropic却让重度用户在Token上“悄悄多付”约35%。前者借"AGI for Everyone"做支点,把推理成本的工程红利几乎原封不动回馈开发者;后者在万亿估值光环下,把增量费用藏进Token计数,逐步加码。这可视作大模型行业首次明牌的“路线分叉”——开源/低价路径靠规模与效率把价格打到地板,闭源路径靠迁移成本与分层定价强化留存与变现。对开发者而言,选模型不再只是看跑分,更要看“账单结构”。便宜未必代表能力差,昂贵也未必等同护城河——真正决定胜负的,是谁能让客户愿意走进来、也愿意长期留下来。

以上内容基于公开信息整理分析,仅供参考交流。观点不构成任何投资建议。