标签

AI 实力进阶:SOTA 模型格局解析

近期在使用 claude 4.8 探讨信息安全议题时,偶尔会遭遇模型拒答的情况。其给出的解释是自身能力过于强劲,因而增设了额外的安全防护机制,这有时会导致误判并错误地拒绝回答。如此自信甚至略带自夸的模型,我尚属首次见识。但细想之下也能释然,毕竟 claude 的实力确实不容小觑。所谓 SOTA 模型,即 state of the art,我可将其译为前沿大模型,它们与后续的其他模型之间已拉开了显著差距。SOTA 阵营即所谓的“御三家”:claude、openai 和 gemini。实际体验下来,三者各有千

2026-06-03 21:20:11  |  3 阅读

混合架构新突破!HMSTUNet刷新人群计数性能纪录

计算机视觉领域再次传来重磅消息!研究团队Yue Zhang、Yafu Li、Leyang Cui(通讯作者)等学者联合发布HMSTUNet混合多尺度Transformer-CNN U型网络,创新性整合CNN局部特征提取能力与Transformer全局建模优势,成功破解人群计数难题,在五大权威基准数据集上全面刷新SOTA性能。DOI:https://doi.org/10.1162/COLI.a.16当前人群计数算法主要分为CNN与Transformer两大技术路线,但各自存在明显局限:CNN网络感受野范围有

2026-05-19 14:48:06  |  5 阅读

AI预判要点

在早期的谈判阶段,公司的估值已经被推高到250亿美元。相比之前的标杆规模,数亿甚至更高的幅度意味着增长大约是前者的两倍以上。就在同一周,Walden Yan 的“Multi-Agents:What's Actually Working”帖子在网上迅速扩散;据称,Devin 的企业使用率在短短六个月里提升了8倍。围绕单个接口背后所做的六种推测解码思路,给出了对应的参考仓库。Shreyansh Singh 在 Qwen2.5-7B 上采用共享评估来实现 EAGLE-3、Medusa-1、PARD、Dr

2026-04-28 11:12:56  |  9 阅读