标签

AI行业动态·2026年6月7日

发布时间:2026-06-07 14:05来源:微信阅读:2

1. 告别“凭感觉写代码”, GitHub 开源 Spec Kit 强制 AI 先写规范再干活

GitHub 推出了一款名为 Spec Kit 的开源工具包,直击“Vibe Coding”(凭感觉编程)的软肋。以往 AI 编码常因提示词模糊导致需求遗漏和反复返工,而 Spec Kit 主张“先规范,后实现”的反向流程。它要求先定义产品功能、明确差距并制定技术计划,将规范转化为可执行的开发合约,再交由 Agent 执行。目前该工具已支持 Copilot 、 Claude Code 、 Cursor 等 30 多种 Agent ,并在 GitHub 上获得了超过 10.9 万颗星。这种“契约式”的开发思路,或许能显著提升 AI 代码的落地质量。(值得推荐)

2. 经典库大升级! OpenCV 5 来了:原生支持大模型, ONNX 覆盖率暴涨

计算机视觉领域的“扛把子” OpenCV 迎来了 5.0 版本。这次更新堪称重磅,不仅重构了基于图的 DNN 引擎,将 ONNX 算子覆盖率从 4.x 版本的不到 23% 提升至 80% 以上,更实现了对 Transformer 、视觉语言模型( VLM )和大语言模型( LLM )的原生支持。此外,新版本在 Python 集成、硬件加速层、 FP16/BF16 支持等方面均有优化。作为一个日安装量超百万次的底层库, OpenCV 5 的发布将极大降低大模型在视觉领域的应用门槛。(行业基石)

3. 想知道马斯克在想什么?这个开源工具能绘制公众人物的“思维地图”

Hugging Face 上出现了一个名为 Persona Atlas 的有趣项目,它利用工具调用代理进行网络搜索,生成公众人物的资料和风格假设,并模拟其回答关于身份、伦理的十个开放性问题。通过将这些回答转化为嵌入向量,它能在向量空间中比较不同人物的思维距离,并绘制出基于特质锚点的热力图。前端采用 Gradio 构建,提供研究、比较和追溯功能,无需 token 即可直接体验。这对于研究 Agent 的人格化模拟和公众人物画像来说,是一个极具创意的玩具。

4. 美国众议院搞事情:提案禁止各州自行制定 AI 法规,权力收归联邦

美国众议院议员提出了一项新的法案草案,核心意图非常明确:禁止美国各州自行制定人工智能相关的法规,试图将 AI 的监管权力彻底集中到联邦层面。这一提案若通过,将重塑美国 AI 监管的格局,究竟是会统一标准促进行业发展,还是会因缺乏地方灵活性而引发争议,目前尚不可知。(意味深长)

5. 谷歌每月豪掷 9.2 亿美元,只为租用 xAI 数据中心的算力

科技巨头之间的算力合作令人咋舌。谷歌与 SpaceX 达成了一项巨额协议,每月支付 9.2 亿美元,以获取位于 xAI 数据中心的计算能力。这笔交易的具体细节于本周披露,显示出谷歌在算力扩充上的激进策略,同时也暗示了基础设施共享在 AI 竞争中的重要性。(重磅交易)

6. 历久弥新!阶跃首席科学家张祥雨的 ResNet 拿下 CVPR 2026 时间检验奖

在 CVPR 2026 大会上,经典论文 ResNet 荣获了“时间检验奖”( Time Test Award )。该论文的合著者之一、现任阶跃星辰首席科学家张祥雨,再次因其开创性的贡献受到业界瞩目。 ResNet 作为深度学习领域的里程碑式工作,至今仍深刻影响着计算机视觉的发展,这一奖项可谓实至名归。

7. 再次祝贺:阶跃张祥雨 ResNet 荣膺 CVPR 2026 时间检验奖

这是一条值得再次强调的喜讯:阶跃首席科学家张祥雨合著的 ResNet 论文,在 CVPR 2026 上被授予“时间检验奖”。这不仅是对个人学术成就的最高褒奖,也证明了扎实的基础研究在 AI 快速迭代的今天依然具有不可磨灭的价值。(实至名归)

8. 海螺 AI 联手上影节: 6 月中旬邀你共赴 AI 影像开放日

MiniMax 旗下的海螺 AI 作为第 28 届上海国际电影节的独家 AI 影像战略合作伙伴,将于 6 月 14 日至 15 日举办开放日活动。现场将设置 AI 片场专属 Booth ,展出四对“影视从业者+AI 创作者”的组合作品及其创作过程,并设有创作体验区供观众交流。对 AI 影像创作感兴趣的朋友不容错过。

9. Gary Marcus 发声:谈谈 AI 领域的“黑色星期五”

知名 AI 评论家 Gary Marcus 发布了一篇新文章,针对 AI 领域近期发生的一系列事件进行了犀利点评,将其形容为“黑色星期五”。他在文章中表达了对当前 AI 发展路径的深刻反思和担忧。虽然老马常被视为“唱衰派”,但他提出的问题往往切中要害,值得从业者深思。(观点犀利)

10. 玩转多模型金融游戏:五个小模型如何模拟出五种“人格”?

Thousand Token Wood v2 项目展示了如何用小模型构建多智能体金融游戏。它使用了四个不同实验室的小模型(如 gpt-oss-20b 、 MiniCPM3-4B 等)来驱动游戏。核心发现显示,小模型虽然在推理上不可靠,但通过结构化提示、容忍性 JSON 解析层以及微调(如 0.5B 模型实现了 0% 自成交),可以成为可靠的格式生成器。该项目还解决了 vLLM 的依赖摩擦问题,并通过信息隔离确保了内幕信息不泄露。(技术干货)

11. Hugging Face 推出求职神器: DeepSeek 找职位, Qwen 帮你打分

Hugging Face 发布了一款基于 AI 的求职搜索工具 Job Searcher 。用户上传简历后,系统利用教师模型 DeepSeek V4 Pro 生成 LinkedIn 搜索查询,通过 JobSpy 抓取职位,最后用经过 LoRA 微调的学生模型 Qwen3-8B ( 8B 参数)对职位进行评分。评分维度涵盖技能匹配、经验相关性等五个方面。项目训练在 Modal 平台单张 A100 上完成,推理部署于 Hugging Face ZeroGPU Space ,且完全开源。(工具推荐)

12. 性价比之王? MiniMax M3 代码审计表现硬刚 Claude Opus ,成本仅 1/18

一场硬核的代码审计对比测试结果出炉:在预埋 17 个已知 bug 的代码库中, MiniMax M3 和 Claude Opus 4.8 均成功找出了 13 个 bug 。然而,成本差异巨大——MiniMax M3 仅花费了 0.07 美元,而 Claude Opus 花费了 1.30 美 (内容摘录整理自「 AI HOT 日报 aihot.virxact.com 」