标签

智能体纪元正式开启

2026年,人工智能领域正迎来一场颠覆性的变革。三年前,ChatGPT横空出世,全球惊叹于AI“能做什么”;而今,行业焦点已彻底转向“AI能创造多少价值”。这标志着AI发展史上的关键转折点——从“技术实验”阶段正式迈入“规模化价值创造”的黄金时期。最核心的特征,便是智能体(Agent)的全面普及与落地。以往的AI仅是“你问我答”的聊天机器人,宛如一位聪明的实习生,指令一步,执行一步。如今的AI智能体,已进化为拥有自主感知、规划及执行能力的“数字员工”,能够独立完成目标拆解与闭环操作。在企业端,单个AI智能

2026-06-03 07:50:46  |  10 阅读

AI 榜单僵局:Claude 继续霸榜前四

Arena 排行榜 · 2026.06.01继上周发布「前四名皆被 Claude 占据」的报道后,本周再次查看 Arena 文本榜单,发现前四席位依旧由 Claude 牢牢把控,分数波动微乎其微。1502、1500、1498、1494,冠亚季殿军悉数落入 Anthropic 囊中。总投票数已从 629 万攀升至 653 万,参评模型数量维持在 360 个。简而言之,头部阵营格局已定,变动仅体现于第 8 至 12 名的细微位次更替,以及部分模型分数 ±1~2 分的轻微调整。与 5 月 25 日的榜单相比,前

2026-06-01 12:51:54  |  5 阅读

AI周报:苹果整合Gemini、国家动员全民学AI、技术加速渗透实体店

帮实体店主率先洞察AI大势今日为5月30日,星期六。近48小时内,AI领域发生数件与你的经营息息相关的大事:苹果携手谷歌,计划将Gemini大模型植入iPhone,赋能全新Siri功能;OpenAI发布实时翻译模型,覆盖70多种语言,直接利好跨境服务行业;四部委联合发文,号召"提升全民人工智能素养",这确是一份动员令;Perplexity接入微软Office,你常用的Word和Excel将内置AI助手;国产大模型阶跃星辰推出Step 3.7 Flash,中文模型效能再升级;FaceMind

2026-05-30 10:18:19  |  8 阅读

AI周报:腾讯马维斯上线,GPT-5.6曝光,高考首次限制AI

每周四,为您梳理AI圈核心动态。本周最大焦点:腾讯“马维斯”发布,AI从应用层迈向系统层。5月20日,腾讯推出操作系统级AI助手Marvis,Win/Mac/安卓三端开放,无需邀请。为何关键?过往AI仅限于“对话”,马维斯则深入系统底层,让电脑可被指挥。它能:调用系统设置、检索本地文件/图文、跨管手机App、清理优化。架构为1主+5分。双模式:效率(云端混元+DeepSeek)与隐私(本地Qwen)。对决策者:AI正从聊天机器人演变为数字员工,关键在于“指挥”而非“使用”。GPT-5.6意外泄露:150万

2026-05-28 13:27:03  |  5 阅读

5 月 22 日 AI 快讯:政策资金双驱动,国产模型提速降价,三大零成本风口来袭

发改委正式宣布:正着手制定「人工智能 +」落地配套政策国内首份 AI 应用伦理安全指南现已发布本届链博会首次设立 AI 专区,超百家 AI 初创项目亮相智谱推出 GLM-5.1 极速版,处理速度提升 3 倍且价格下调 30%字节跳动开源 Lance 3B 多模态大模型,支持免费商业使用智谱携手清华发布 ZCube 组网架构,推理成本降低 30%剪映与 Gemini 深度打通,AI 视频剪辑效率提升 3 倍警惕假冒 GLM-5.1 极速版的钓鱼链接:近期大量微信群、弹窗散布的「GLM-5.1 国内免费用」均

2026-05-23 10:58:12  |  6 阅读
千问3.7-Max发布:国产最强,35小时自主任务表现惊艳

千问3.7-Max发布:国产最强,35小时自主任务表现惊艳

新浪科技5月20日早间资讯,阿里巴巴推出了全新的千问旗舰版Qwen3.7-Max。在第三方Arena全球大模型盲测榜单上,该模型力压Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini等顶尖产品难分伯仲,稳居国产榜单首位。 据了解,Qwen3.7专为当下智能体应用量身打造,在编程与逻辑推理等关键领域取得重大进展,具备全自主执行35小时超长复杂任务的能力:在某款新型芯片平台上,Qwen3.7-Max依靠自主编写代码及逾千次工具调用,成功达成核心内核的自我迭

2026-05-20 11:51:22  |  6 阅读

AI大模型风云:今日要闻速递

当前日期为2026年5月18日,以下为你汇总近期AI大模型领域的重大进展,涵盖国产大模型的商业表现、谷歌I/O大会前的最新动向以及国内企业的融资与产品发布情况:🚀 国产大模型表现亮眼,DeepSeek完成巨额融资* 周调用量问鼎全球:最新统计数据表明,中国AI大模型的周调用量连续两周蝉联全球榜首,达到美国的2.11倍(中国7.94万亿Token,美国3.76万亿Token)。其中,腾讯的 Hy3 preview 大模型稳居调用量冠军宝座,DeepSeek同样有三款模型入围榜单。* DeepSeek创造融资

2026-05-18 16:06:55  |  5 阅读

AI 编程变天:2026 年五大关键趋势揭秘

Uber 首席技术官近期向高层汇报了一件颇为尴尬的事:公司原本规划用于 2026 全年的 AI 工具预算,仅在头四个月便消耗殆尽。这并非预算编制不足,而是无人料到 AI 编程工具的使用强度会如此惊人。95% 的工程师每月都在使用,代码仓库中 70% 的代码由 AI 生成,每位工程师每月的 AI 工具开销在 500 至 2000 美元之间。Uber 拥有约 6000 名工程师,这笔账可不算小。与此同时,GitHub Copilot 的市场份额已从 80% 下滑至 55%,而 Cursor 的年度经常性收入(

2026-05-18 16:02:51  |  6 阅读

AI Daily | DeepSeek 多模态论文亮相,国产模型周调用量首超美国

五一假期刚刚收尾,OpenAI 便投下了一颗重磅炸弹。5 月 6 日凌晨,ChatGPT 的默认模型悄然从 GPT-5.3 切换为 GPT-5.5 Instant。坦率而言,此次升级最值得留意的并非参数规模的扩大或推理性能的提升,而是一项偏向实用的改进——幻觉率骤降 52.5%。这意味着什么?以往向大模型提问时,它可能信心满满地抛出一个错误答案。如今 GPT-5.5 学会了“知之为知之”——减少信口开河,把握分寸,不再絮絮叨叨。OpenAI 官方公布的四项核心升级方向为:幻觉减少、协作能力增强、输出更为克

2026-05-10 22:21:07  |  6 阅读

AI编程挑战与具身智能新进展

5月8日前后,AI圈被一个benchmark结果"全员打沉默了"。事件是什么?SWE-Bench(AI编程能力测试标杆)的创建者,联合Meta FAIR、斯坦福、哈佛等机构,发布了一个全新的、"地狱级"的benchmark,叫ProgramBench。与以往测试"写个函数"、"修个bug"不同,ProgramBench要求AI根据功能描述和文档,从零开始重新构建一个真实可用的软件系统——比如ffmpeg、SQLite、ripgrep这种级别的

2026-05-10 14:06:44  |  11 阅读

百亿融资背后的AI底盘与商业化路径

关于 DeepSeek 与 Kimi 的融资动态,全网讨论的焦点多集中在几百亿美金估值、谁会成为中国版 OpenAI,以及 AI 圈是否将再度进入新一轮内卷。不过,很少有人意识到:这两次看似寻常的创业融资,实际上对应的是中国 AI 产业的一次战略级布局,指向我们与美国进行 AI 竞争的关键“底牌”。先抛出一个鲜少被追问的问题:国家集成电路产业投资基金,也就是常说的国家大基金,过去长期聚焦投芯片制造、半导体设备等赛道。可这一次却破例率先押注一家做 AI 大模型的公司。要明白,大基金的每一笔投入都不是纯粹的资

2026-05-09 07:11:54  |  4 阅读

产业链资本携手入局,上海大模型IPO节奏或加快

国产大模型阵营的资本化进展,再次进入提速阶段。 据5月8日,中国证券报记者从业内人士处获悉,上海大模型公司阶跃星辰预计将完成近25亿美元融资,并同时撤回红筹架构。业内普遍认为,这些举措是其筹备赴港IPO的重要前置工作。 从工商信息可见,今年4月,阶跃星辰的企业类型由有限责任公司调整为股份有限公司。此前,国产大模型企业MiniMax与智谱也已陆续在港股完成上市。 对于上述情况,记者向阶跃星辰求证,截至发稿,公司暂未作出回应。 一次“产业背书”的战略融资 此次融资的显著特点之一,在于出资方的产业构成。华勤技术

2026-05-08 17:38:28  |  6 阅读
六家国产大模型因子竞赛:谁能挖到最强Alpha?

六家国产大模型因子竞赛:谁能挖到最强Alpha?

在上一期(融量AlphaMind因子投研新范式—Agent自动投研)中,我们系统介绍了如何把大模型 AI 与 AlphaMind 平台的 MCP 工具链结合起来,完成因子优化与因子挖掘的自动化工作。依托 AI Agent 的自我迭代能力和标准化投研流程,仅经历数轮迭代,就能从最基础的因子一路打磨到更高性能的 Alpha,充分说明了 AI 在量化投研中的高效落地价值。本期内容将承接这一路径,进一步展开……同样的任务、同样的平台、同样的20轮迭代。六个国产大模型同时参与“换手率反转因子”挑战,谁能把它挖到最好

2026-05-08 13:44:21  |  20 阅读

智能体浪潮:中美AI竞赛新焦点,谁能挑战OpenAI?

智能体元年,中美AI战火蔓延至“智能体”领域:谁在挑战OpenAI的地位?编辑:ForceInstitute| 国内模型集体发力,不仅是成本优势,更是规则制定者2026年的春季,AI领域的隐秘较量终于浮出水面。大洋彼岸,有消息称Anthropic的年度经常性收入已突破300亿美元,超越OpenAI,成为全球AI收入增长最快的企业。与此同时,在国内,一个令人瞩目的趋势正在显现:根据OpenRouter的数据,截至4月7日,中国AI大模型的调用量已连续五周领先于美国。一场由“智能体”(Agent)引发的Tok

2026-05-05 07:14:47  |  7 阅读

2026年大模型冲刺加速:具身智能成本破15万

进入2026年,AI发展正以更快的节奏在全球扩散。从斯坦福近期出炉的《AI指数报告》,到国产大模型在海外市场频频亮相,再到人形机器人成本跌破15万元线——这些数据背后,指向的都是一场正在加速的产业变革。下面为你梳理近期最值得重点关注的AI技术动态。斯坦福大学以人为本人工智能研究院在2026年4月发布了最新《AI指数报告》,并通过12张关键图表呈现全球AI发展全貌。📊 模型研发:美中领跑,欧洲相对滞后在2025年全球主要AI模型成果中,美国贡献50个、中国贡献30个,而欧洲仅有2个,差距显著。另一个现象是:

2026-05-04 20:22:34  |  5 阅读