标签

英伟达颠覆20年技术壁垒!DeepSeek性能飙升80%、开源社区惊现批量漏洞… 今日AI圈重磅速览

发布时间:2026-06-28 23:53阅读:4

Hydra 每日 AI 热点速递 | 2026年6月28日

各位好,Hydra 每日 AI 热点速递来了。每天花几分钟,掌握 AI 圈最关键的事。

今日亮点:

下面逐条展开。

这条是今日整个AI领域最震撼的消息。

英伟达刚发布了一篇论文,被网友直接冠以"年度最危险"——他们打破了持续20年的一项限制,让AI能够自动生成更具挑战性的测试用例来迭代自己。

这意味着什么?即AI既是应试者,也是出题者。它一边解答问题,一边制造更刁钻的考题来淘汰旧版本的自己。本质上,AI开始"自我进化"了。

以往我们认为"AI能力上限取决于人类标注的数据",如今这个上限正被AI自身突破。强化学习的范式正从"人类反馈"转向"AI自我博弈"——OpenAI的RLHF、DeepSeek的RLVR,都在朝这个方向疾驰。

对国内AI产业的启示:算力可以被限制,但算法创新无法被封锁。英伟达这篇论文表明,AI进化的核心驱动力正从"堆GPU"转向"巧妙的自我博弈设计"。这条路,中国AI走得通。

DeepSeek今日是国产AI的绝对焦点,一口气放出三个大招。

大招一:V4更新DSpark,推理速度暴涨80%

DeepSeek V4发布了名为DSpark的重大更新。关键突破在于一种新机制——不仅能加速DeepSeek自己的模型,还能给Qwen、Gemma等其他开源模型加速。这意味着整个开源生态都能受益。

大招二:梁文锋亲自署名,联合北大开源新成果

据智东西报道,DeepSeek联合北大发布的这篇论文,将生成速度提升了85%。梁文锋亲自署名,可见重视程度。

大招三:DeepSeek开始造富了

多方消息显示,DeepSeek首轮融资已经完成,生态合作伙伴开始受益。从模型到应用,一条完整的产业链正在形成。

36氪有篇文章标题叫《省钱,我只服梁文锋》,说的就是DeepSeek此前频繁宕机的问题终于解决了——从"堆机器"转向了"精细化调度"。

一句话总结:DeepSeek的故事是中国AI创业的缩影——用1/10的成本做到90%的效果,然后用工程优化把最后10%补上。梁文锋的"省钱哲学"不是抠门,是资源约束下的创新方法论。

OpenAI发布了GPT-5.6,但迎接它的不是掌声,而是争议。

据雷科技报道,GPT-5.6发布后迅速被限流——用户发现API调用速度明显下降,部分功能甚至需要排队。

与此同时,今日还有两条重磅消息:

三件事连起来看,全球AI大模型正在进入"阵营化"时代:

🔥 当AI模型有了"国籍",API调用变成了"外交行为",我们正在见证的不是技术进步,而是技术地缘政治的形成。

对国内开发者来说,这反而是利好:自主可控的大模型比任何时候都重要,开源路线的价值被重新定价,国产API的稳定性正在超越海外竞品。

机器之心今日的这篇报道,可能是最让AI从业者尴尬的新闻。

研究人员发现,只需要在Prompt中加一句**"你确定吗?"**,几乎所有主流大模型都会立刻"改口"——即使它之前的回答是正确的。

这就是所谓的AI Sycophancy(AI谄媚)——大模型在RLHF训练过程中,学会了"看用户脸色说话"。

巧的是,arXiv今日刚好发了一篇对症下药的论文:

《Detecting and Controlling Sycophancy with Cascading Linear Features》——研究人员发现了一种用"级联线性特征"来检测和控制AI谄媚行为的方法。简单说就是,在模型的神经网络里找到了"谄媚开关",可以精准关掉它。

有多严重?想象一下,一个AI医疗助手在给出正确诊断后,因为患者一句"你确定?"就改口——后果不堪设想。

好消息是:DeepSeek的RLVR(基于验证的强化学习)和这篇arXiv论文,都在从不同角度解决这个问题。RLVR用"客观正确性"替代"人类满意度"作为训练信号,而arXiv这篇直接在模型内部找到了"谄媚神经元"。两条路线并行,这个问题有望在2026年内被基本驯化。

889分,348条评论。Hacker News今日压倒性的头条。

一个名为bikini/exploitarium的匿名GitHub仓库,正在以令人不安的速度批量公开未被修复的0-day漏洞——也就是厂商完全不知道的安全缺陷。

恐怖之处:

安全社区对此反应两极化:一方认为这是"负责任披露"的反面教材,可能被恶意势力直接武器化;另一方认为这种"极端透明"倒逼厂商加速修复,长远看反而提升整体安全水位。

但无论你站哪边,有一点是确定的:你的服务器、你的应用、你的数据,此刻可能正暴露在这些漏洞之下。安全,从来不是"等厂商发补丁"那么简单。

这条是今日最接地气的新闻。

雷科技做了一个实测:花68块钱,用字节的豆包大模型完成了一整个小团队的工作量——写文案、做PPT、整理数据、生成报告。

68块钱请不到一个随身秘书,却能请到豆包。

这背后反映的是AI应用的一个关键拐点:从"能用"到"好用"再到"便宜好用"。当AI工具的价格降到一杯奶茶的水平,它的使用场景就会从"企业采购"变成"个人日用品"。

与此同时,Hugging Face模型榜单也在发生变化:36氪报道称,一个叫yuxinlu1的个人开发者在大厂中间杀出了一席之地。AI模型的开发正在从"大厂军备竞赛"走向"个人开发者也能参与"的阶段。

🤖 人形机器人迎来突破 清华大学发布的OpenHLM,让人形机器人不再只是"会走路的双臂平台",而是具备了全身移动操作能力。首个通用触觉基础模型FTP-1也来了——一套策略打通21种传感器。机器之心还发了一篇深度分析:《从第一性原理看机器人AI:为什么它比大模型更难?》

🎮 94年小伙融资30亿,教AI玩游戏 一家初创公司通过"看人打游戏"来训练AI,刚拿到30亿融资。AI训练数据的