标签

学术AI下半年五大趋势预测:对错半年后见

发布时间:2026-06-26 21:33阅读:3

这一篇我想做一件我一直犹豫要不要做的事。

写预测。

我从今年 3 月开始系统观察学术 AI 生态。这 4 个月里我写了 17 篇文章,从Harvard 开源了让 AI 当科学家的平台。50 万次分析,覆盖 113 个国家。我以为 26.5k 星已经到顶——直到读到这个 160K 科学家用的科研 skill 库,最近一篇是我让组里 3 位博士用 AI 工具 6 个月。真实数据让我后悔一件事。

每一篇我写完都觉得自己看到了一个点。但 17 个点连起来之后,我开始隐约看到一些趋势。

不是确定的判断。是几条我能感觉到但没法完全证明的方向。

我之前一直不愿意写预测。觉得应该谨慎,应该等数据充分了再下结论。但这两周我改了主意。理由是预测本身的价值不在于猜对未来。是在于把当下看到的趋势落成具体可验证的判断。

落成判断有两个好处。一是我自己 6 个月后可以诚实回头看,对了多少错了多少。二是你作为读者可以拿这些判断去检验你自己看到的趋势是不是跟我一致。

这一篇我写下来 3 件我相对有把握的预测,2 件我自己也不确定的预测。半年后无论对错,我都会回来写一篇"对账"文。

预测有两种。一种是"基于趋势线的外推"。一种是"基于结构性变化的判断"。

外推型预测最容易做。看到一个曲线在涨就猜它继续涨。这种预测准确率不高,因为它假设趋势线不变。

我下面要写的不是外推型预测。是基于我看到的几个结构性变化推出来的判断。

我看到的结构性变化主要有 3 个。

第一个:学术 AI 工具的"基础设施化"正在完成。AI 工具不再是"某个人写的脚本",已经成为可装可拆可组合的工具组件。这件事跟 1990 年代末互联网从"业余爱好"转为"基础设施"的过程很像。

第二个:商业公司开始为学术圈做专属产品。Anthropic Claude for Life Sciences 是第一个明确信号。这意味着学术圈变成了 AI 公司主动争夺的市场,而不是无意中受惠的市场。

第三个:学术评价系统对 AI 的态度正在从"禁止"转向"披露"。所有顶会顶刊都意识到一件事:AI 没办法禁,只能管。

下面 3 个预测,都是基于这 3 个结构性变化的外延。

我在Harvard 开源了让 AI 当科学家的平台。50 万次分析,覆盖 113 个国家。那篇里讲过 ToolUniverse。它是 Harvard Medical School 的项目,专门为生物医学做的 AI agent 工具集成平台,接入了 1000 多个生物医学工具和数据库。

它现在被 113 个国家的研究者用,累计跑了 50 多万次分析。

我的预测是:下半年(7 月到 12 月)会出现至少 1 个非生物医学领域的"ToolUniverse 级别"项目。

最可能出现的领域按概率排:化学 > 材料科学 > 物理学 > 地球科学 > 计算社会科学。

为什么我有信心:

第一,ToolUniverse 的核心架构(基于 MCP 的工具协议 + 数据库 API 接入)是可被其他学科直接复用的。它不是"只能为生物医学服务",是"被生物医学先做出来"。

第二,化学领域已经有所有需要的底座条件。RDKit、PyMol、AutoDock、ChemDraw 这一类化学软件早已 API 化。PubChem、ChEMBL、Reaxys 这一类数据库也成熟。缺的只是一个把这些东西用 MCP 协议接入 LLM 的开源项目。

第三,化学领域的 AI 应用市场比生物医学还大。制药公司、材料公司、化工公司都有强烈付费意愿。一个开源版本只要做出来,使用量会很快超过 ToolUniverse 现在的量。

我的具体预测是:12 月底之前,会看到一个名字类似"ChemUniverse"或者"MatToolBox"的项目出现,GitHub 星数过 1k,跨 50+ 国家使用。

这件事如果发生,意味着学术 AI 工具的"基础设施化"已经从单一领域跨到多领域。这个时候你公司号读者大部分会感受到工具的可用性在大幅提升。

如果半年后这件事没发生,我会承认我低估了基础设施搭建的工程难度。

我在你的论文很可能被 AI 评审过——ICLR 2026 实锤 21% 同行评议是 AI 写的那篇里讲过 ICLR 21% AI 审稿事件。这件事对学术评议系统是个不可逆的冲击。

事件发生之后,顶会顶刊有两个方向可选。一是加强"禁止 AI 审稿"的规定,加强对审稿人的检测。二是承认 AI 审稿不可能完全禁,转为要求"披露 AI 使用"。

我的预测是:下半年会有至少 3 个顶级会议或期刊公开宣布转向第二条路。

具体说,我预测 NeurIPS、ICML、ICLR 这三家会议里至少有一家在 12 月底前正式发布"AI 审稿披露要求"。具体内容大概是:审稿人在提交评审意见时,必须勾选"是否使用 AI 辅助",并简述使用范围。这件事不是为了追究审稿人,是为了让作者知道自己的论文是被人审的还是被 AI 审的。

顶级期刊方面,我预测 Nature 系列至少有 1 本(最可能是 Nature Methods 或 Nature Machine Intelligence)在 12 月底前出台"评审 AI 披露"政策。

为什么我有信心:

第一,禁不住。ICLR 21% 这个数字已经证明禁止政策完全失败。下一步只能是承认 + 披露。

第二,已经有先例。Wiley 和 Elsevier 之前都对作者要求 AI 披露,把同样的逻辑应用到审稿人是顺理成章的下一步。

第三,学术圈的舆论已经准备好了。我看英文 Twitter / X 上对这件事的讨论,过去 3 个月已经从"应该禁止"转为"应该怎么管"。舆论一旦从问 'should we' 到问 'how should we' 就意味着政策转向不远了。

如果半年后这件事没发生,我会承认我低估了学术官僚系统的惰性。

这个预测比前两个更接近"希望",但我也有一些理由。

我在我以为 26.5k 星已经到顶——直到读到这个 160K 科学家用的科研 skill 库和我又发现一个 220k 星的 Claude Skill——是 Karpathy 留下的 4 条编程铁律那两篇里反复讲过一句话:中文圈贡献的学术 AI 开源工具几乎为零。

我的预测是:12 月底之前,会出现一个由中国大陆研究者维护的、星数过 5,000 的学术 AI 开源项目。

具体说,最可能的方向不是"做一个新的 framework",是"做一个针对中国学术圈特殊场景的工具"。比如:

针对中文 SCI 投稿的"中英写作转换 Skill"。针对国自然申请书撰写的专门 Skill。针对中国某个学科(比如中医药、中文 NLP、教育心理学)的专门数据库 + 工具整合。针对国内特有评价指标(CSCD、CSSCI 这类)的辅助工具。

为什么我有信心:

第一,海外华人科学家已经证明华人在这个方向上的工程能力。国内的优秀工程师 + 研究者不会缺席。

第二,国内的学术 AI 需求是真实的、独特的、海外工具很难满足的。这种"特殊需求 + 强工程能力"的组合最容易催生爆款开源项目。

第三,诺丁汉物理教授公开承认这篇文章一部分是 Claude 写的。请你识别哪段。之后,国内学术圈对 AI 工具的好奇心明显涨了。一个开源项目只要做得好,被国内学者接受的速度会比 6 个月前快很多。

如果半年后这件事没发生,我会承认中文学术圈的开源贡献文化比我想象的弱。

我之前在Anthropic 公布数据:50% 研究者已选 Claude——AI 公司第一次为科研做专属产品那篇里写了 Anthropic 推出 Claude for Life Sciences 的事。当时我隐约觉得这只是开始,未来会看到更多"科研专属模型"。

我现在不确定。

不确定的理由有 3 个。

第一:通用模型仍然在快速进步。GPT-5、Claude Opus 4.5、Gemini 3.5 在多个科研 benchmark 上已经超过专门为科研训练的小模型。专属模型如果在性能上跑不过通用模型,存在意义就受质疑。

第二:科研需求碎片化严重。生物医学跟材料科学跟社会科学的需求差异太大。一个"统一的科研专属模型"几乎不可能做。如果 AI 公司要为每个学科做单独模型,经济上不划算。

第三:现在的趋势看起来是"工具层专属化"而不是"模型层专属化"。也就是 ToolUniverse、K-Dense 这种工具集成层在向学科细分,但底下的 LLM 还是通用的。这跟"AI 公司推专属模型"的方向是反向的。

所以我对"AI 公司推出科研专属模型"这件事下半年发生的概率,从 6 个月前的 70% 调到了 35%。

如果半年后真的有公司推出科研专属模型,我会承认我对模型层差异化潜力的判断错了。

这件事我犹豫了很久要不要写出来。

我看到很多国内高校在试验各种"AI 在教学中的应用"。教育部 4 月发布的《"人工智能+教育"行动计划》也明确支持。直觉上,下半年应该会有 985 高校公开成立专门的"AI 协作研究中心"或类似机构。

但我的直觉可能错。

第一个反向理由:国内高校对设立官方"AI 中心"这件事可能很保守。教育部政策推动是一回事,具体高校实施是另一回事。设立一个机构涉及编制、经费、领导汇报,周期可能比下半年更长。

第二个反向理由:国内高校的 AI 战略可能选择"分散植入"而不是"集中设立中心"。也就是让每个院系自己负责 AI 协作,而不是设一个跨院系的中心。分散植入比设中心更难被外界识别,所以我看不到。

第三个反向理由:AI 协作这件事是研究者层面的事,不是机构层面的事。很多高校可能选择"让老师们自己用",不专门搞机构化。

所以我对"下半年国内会出现 985 高校公开成立 AI 协作研究中心"这件事的概率,从 70% 调到了 40%。

如果半年后真的有 985 公开成立这种中心,我会承认我对国内高校官方化 AI 这件事的速度判断错了。

把预测写出来不算完。我得定一个验证方式,让 6 个月后这件事是可验证的,不是我自己说对就对。

我打算这样验证:

预测 1(非生物医学 ToolUniverse):12 月 31 日检查 GitHub trending 和 Nature / Science 上是否出现非生物医学领域的 1k+ 星 + 跨 50 国家使用的 AI 工具集成项目。

预测 2(AI 审稿披露):12 月 31 日检查 NeurIPS、ICML、ICLR、Nature 系列是否有任何一家公布"AI 审稿披露要求"。

预测 3(中文 5,000+ 星项目):12 月 31 日在 GitHub 上按"academic" + "Chinese" / "中文" 关键词检索,看是否有大陆维护者的 5,000+ 星项目。

预测 4(科研专属模型):12 月 31 日检查 Anthropic、OpenAI、Google 是否各自推出过新的"科研专属"模型变体。

预测 5(985 AI 协作中心):12 月 31 日按"AI 协作研究中心""人工智能研究院"等关键词检索 985 高校官网,看是否有新增的专门机构。

5 个判定标准。半年后我会逐条对账。

写到这里我必须诚实说一件事。

写预测的过程让我对自己 6 个月的观察到底有多深这件事,有了新的判断。

如果我看到的趋势是真的,5 个预测应该有 3-4 个会对。

如果我看到的趋势其实是错觉,5 个预测可能 1-2 个对,剩下几个都错。

这是个对自己观察能力的硬测试。我之前从来没让自己被这样测试过。

我做 10 年高校老师,我习惯了"做出研究判断",但我很少为这些判断设定可验证的截止日期。学术界本来就允许判断慢慢沉淀。但写预测把这个习惯打破了。

我半年后必须回来认输或者认对。

我有点紧张。

但我觉得这件事对我作为研究者是好的。习惯于让自己被验证,比习惯于慢慢沉淀更让人成长。

如果你也对学术 AI 生态在观察,我想问你 3 件事。

第一,我这 5 个预测里你觉得哪一个最不可能发生?为什么?

第二,你自己看到的趋势里,有什么是我这 17 篇文章里没提过但你觉得很重要的?

第三,如果你也愿意写一份自己的"半年预测",评论区贴你的链接。半年后我们一起对账。

我不需要你认同我。我需要你跟我一起验证。

学术研究就是这件事。验证比观点重要。

12 月 31 日我会回来。