2026.6.29人工智能快讯
📅 2026年6月29日 星期一 让普通人轻松读懂的AI资讯,每日仅需5分钟,轻松掌握AI新动态
让普通人轻松读懂的AI资讯,每日仅需5分钟,轻松掌握AI新动态
🤩 AI热点速递 尖端模型 · 技术革新
AI技术前沿 1️⃣ 小红书对外开放RedKnot推理引擎:KV Cache按注意力头拆分实现长文本提速 深度解析:小红书RED AI实验室推出推理提速引擎RedKnot,核心策略是将KV Cache沿着"注意力头"维度进行拆分——多数注意力头具有局部特性(仅聚焦邻近token),无需全部存储。依托"头分类稀疏化+稀疏FFN+SegPagedAttention"三大机制统一算法与存储颗粒度。实测数据显示,在8卡H800环境下,首Token响应时长(TTFT)最高提升1.6-3.54倍,单卡并发处理能力增强4.7-7.8倍,长文本推理开销显著缩减。 与你何干? 使用小红书等平台时,AI评论辅助、智能推荐反馈更迅捷更经济 开发者可依托开源架构进行深度定制,削减自有大型模型部署开支 此乃国内头部企业在推理效能领域的又一关键开源成果,与DeepSeek DSpark构建"推理优化双驱动"格局 📎