AI前沿速递

发布时间：2026-06-18 02:23阅读：14

Anthropic似乎已搁置了引发开发者强烈不满的定价调整方案。多位开发者透露，他们收到了内部邮件通知，原计划本周启动的Agent SDK和"claude -p"计费模式调整——将二者从订阅限制迁移至独立月度额度——已被无限期暂停。Anthropic官方尚未正式确认这一转变，也未透露后续安排。

这是一款能在编码代理浪费Token之前，精准推送所需上下文的工具。Archex可将代码仓库转换为带预算标记的排序符号和依赖项包，完全本地运行、无需API密钥，并能作为技能无缝集成到Claude Code中。它提供的是上下文，而非直接答案。

投机解码现已在主流本地推理引擎中正式启用。英伟达与GGML合作将EAGLE3整合进llama.cpp，通过轻量级解码器快速生成候选Token，再对完整模型进行验证校对。

如今你完全可以在消费级设备上运行万亿参数代码模型。Unsloth推出的新型量化工具，通过智能选择待压缩层，使基Mi K2.7-Code的内存占用降低近一半，让模型可在普通硬件配置中流畅运行。详细教程和GGUF文件已同步发布。

一位机器学习工程师在四年前的旧款笔记本上成功运行了代理编码应用，且效果相当可观。薇姬·博伊基斯分享，本地代理循环如今在2022款Mac上可达前沿精度的约75%，在Docker封闭沙箱中运行Gemma 4通过Pi和LM Studio。她客观分析了当前的局限与能力边界。

设备端LLM在React Native页面中的传输变得更加便捷。最新版react-native-executorch新增Gemma 4的Vulkan和MLX加速支持，使移动应用无需编写原生推理代码即可离线运行强大模型。该版本还悄然优化了设备端"耳语"功能并提升了速度。建议查阅完整更新日志。

过去一年间，数千网站纷纷添加了特定文件，期待借此提升在AI搜索中的可见度。谷歌近期更新了相关指南，直面这一现象。思科、Cloudflare、Docker与摩根大通携手合作，在开源代码公开前完成漏洞修复工作。

Chainguard发起的雅典娜联盟汇聚了二十余家机构的边境AI漏洞情报，专注于应对一个全新时代——AI系统发现严重漏洞的速度远超传统协调披露机制的响应能力。联盟已正式启动，首批漏洞披露将于下月公布。