AI预判要点
在早期的谈判阶段,公司的估值已经被推高到250亿美元。
相比之前的标杆规模,数亿甚至更高的幅度意味着增长大约是前者的两倍以上。就在同一周,Walden Yan 的“Multi-Agents:What's Actually Working”帖子在网上迅速扩散;据称,Devin 的企业使用率在短短六个月里提升了8倍。
围绕单个接口背后所做的六种推测解码思路,给出了对应的参考仓库。Shreyansh Singh 在 Qwen2.5-7B 上采用共享评估来实现 EAGLE-3、Medusa-1、PARD、Draft 模型,并结合 N-gram 与尾字符解码。结果显示:在接受率达到60%的情况下,EAGLE-3 获得了1.35倍加速;美杜莎-1 则达到2.30倍非vLLM表现。
英伟达把 Blackwell 的部署合作伙伴送往 DeepSeek V4。GB200 NVL72 在 1M 令牌上下文条件下,为 V4-Pro 提供“"超过150令牌/秒/用户"”。同时,Day-0 NIM、SGLang 与 vLLM 的配方也被披露,其中包含对多达100多个 GPU 的预填充与解码分解。英伟达还在同一版本中完成了对 DeepSeek 的华为 Ascend 的验证。
Vrypan:决定论其实是 LLM 辅助编码的错误框架;真正重要的是可预测性。天气能用确定性的方式描述,但并不意味着它可预测;赌场赔率属于非确定性,却能在统计层面上被看作可预测。软件在系统层面从来都不是确定性的。
Sapiens2 从以人为核心的视角重新定义了 SOTA。0.4B 到 5B 参数范围覆盖,原生达到 1K 分辨率,并推出分层 4K 版本。其方法将掩蔽图像重建与自我提炼的对比目标结合,并在约10亿张精心挑选的人类图像上进行预训练。具体效果包括身体部位分割,mIoU 达到24.3;法线估计角误差降低45.6%。进一步扩展到点地图与反照率估计。
Credo AI 对企业代理式编码提出了四支柱式框架。
分别是:规则系统、命令与计划、文档作为约束,以及人为监督。对限制保持诚实——它们拒绝宣传“精确速度乘数”。最终并非靠快速工程取胜,而是依靠基础设施投入来推动效果落地。