千问3.7-Max发布:国产最强,35小时自主任务表现惊艳
新浪科技5月20日早间资讯,阿里巴巴推出了全新的千问旗舰版Qwen3.7-Max。在第三方Arena全球大模型盲测榜单上,该模型力压Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini等顶尖产品难分伯仲,稳居国产榜单首位。 据了解,Qwen3.7专为当下智能体应用量身打造,在编程与逻辑推理等关键领域取得重大进展,具备全自主执行35小时超长复杂任务的能力:在某款新型芯片平台上,Qwen3.7-Max依靠自主编写代码及逾千次工具调用,成功达成核心内核的自我迭
AI演进新纪元:从辅助工具到自主系统
AI领域正经历深刻变革,以下是一些关键要点。简要概括:2023年:2024年:2025至2026年:换句话说:行业焦点已从:“AI协助你”转向:“AI独立完成”------------------------------------------------------------------------今年最有可能的突破将出现在长周期任务领域。我们正进入一个新时代:大型语言模型(LLM)通过与智能体(Agent)环境互动,学习如何执行长期且复杂的任务。这可能是LLM的真正价值所在。以网络安全为例:设想一个
优必选盘中上扬近7% 新推具身世界模型Thinker-WM
以香港为起点,面向全球视野。新浪财经全球资本峰会金曜奖投票已正式开启!用你的一票去挖掘最具价值的资本力量,每一张投票都举足轻重 点击投票 优必选(09880)在盘中逆势走高,涨幅一度接近7%。截至发稿,股价上涨4.10%,报114.30港元,成交额达到8.91亿港元。 近日,优必选官微发布消息称,公司立足工业场景真实作业需求,并沿着具身智能技术演进的方向推进研发。依托自研具身智能大模型Thinker,公司重磅推出全新具身智能世界模型Thinker-WM,旨在构建物理AI基座,推动具身大脑架构及核心能力实现
Kimi深夜发布K2.6模型 三百智能体协同作业
技术迭代与资本竞争已形成双向驱动。4月21日凌晨,大模型初创企业月之暗面Kimi发布并开源Kimi K2.6模型,专注于代码生成、长程任务处理与智能体集群协作。根据官方信息,Kimi K2.6在长程编码能力方面可支持13小时不间断编码工作;智能体集群支持300个子智能体并行执行4000个协作步骤;自主智能体具备持久化自动化执行能力,已适配当前火热的OpenClaw、Hermes智能体框架;多模态与设计方面已支持代码驱动的视觉创作。上述四方面能力的提升并非盲目堆砌,背后是当前企业与开发者群体面对AI升级的核
智谱推出GLM-5.1旗舰开源模型:可连续工作8小时,价格上调一成
4 月 8 日,智谱对外发布新一代开源模型 GLM-5.1。官方表示,这是当前全球能力最强的开源模型,也是首个可实现 8 小时级持续运行的开源模型。在贴近真实软件开发场景的 SWE-bench Pro 基准中,GLM-5.1 也成为首个成绩超越 Opus 4.6 的国产模型。 据 OpenRouter 信息,随着此次新模型上线,智谱 GLM 的价格同步上调 10%。调价之后,GLM-5.1 在 Coding 场景中的缓存命中 Token 定价,已经接近 Anthropic 旗下 Claude Sonnet