标签

医疗 AI 迈向 Agent OS 时代 谁来筑基?

发布时间:2026-05-29 18:15来源:微信阅读:4

一位年届五旬、既往有高血压且对青霉素过敏的肺炎病患,应当采取何种抗生素治疗策略?

时间来到 2026 年春季,国内某医院呼吸科会诊间,主治医师未查阅指南,也未检索 PubMed。他借助了一款名为“证元芳”的软件,仅输入简短的病情描述。三十秒后,屏幕呈现分级建议——首选方案、替代方案及禁忌事项清晰可见,每项判断均附有具体循证依据:源自哪份指南、第几页、原文出处。

此为中国港股上市公司研发的医疗 AI 应用。其设计理念极为单纯:答案必须附带证据。

放眼望去,证元芳并非孤军奋战。海外的 OpenEvidence 截至 2026 年初估值约 120 亿美元,据称其覆盖了约 40% 的美国医生;Hippocratic AI 致力于成为“有副驾的护士”,Glass Health 则定位为“医生的病历笔记本”。在诸多公开评价中,这一浪潮被定义为“AI 终于学会引用了”。

这种“引用”仅仅是表层,更值得关注的是正在发生的变革:在 AI Agent 演进至操作系统阶段的背景下,医疗领域涌现出集“循证 + 多智能体协作 + 技能商店”于一体的下一代产品。它既非聊天框,亦非搜索框,更像是“医疗版的 Agent OS”。

在这条探索之路上,OpenEvidence 是标杆,而证元芳及其背后的轻松健康集团(HKEX:02661),则代表了中国市场的典型实践。

过去三年间,医疗 AI 的产品形态主要分化为三条路径。

第一条是“检索流”——将 PubMed、UpToDate、临床指南构建为向量库,辅以对话框,旨在回答医生疑问。此路虽最熟悉,但天花板较低,其核心能力实为“更优秀的搜索引擎”。

第二条是“生成流”——依托通用大模型外挂医学知识库,进行开放式问答。此路虽听起来动听,却未获医生群体认可,核心痛点在于“幻觉”:答案看似合理,引用却经不起推敲。在中国,曾有一段时间“医疗大模型”发布会层出不穷,但真正能进入医院日常使用的却寥寥无几。

第三条是“循证智能体流”——依据循证医学方法论重构产品。其核心不在于“回答速度”,而在于“回答过程可被复核”。OpenEvidence 走通此路后,市场开始重新审视:当一家美国初创公司能在两年内将 40% 的美国医生纳入工作流,这便验证了“医生愿意为可核查的 AI 答案投入注意力”这一事实。

中国市场的窗口亦在 2025 年下半年集中开启。2025 年 10 月,国家卫健委、国家中医药局、国家疾控局联合发布《关于促进和规范“人工智能+医疗卫生”应用发展的实施意见》,明确了 2027、2030 两个阶段性目标;北京、四川、上海等地相继出台地方实施细则。“严肃医疗 AI”由此拥有了清晰的政策导向。

然而,这三条路本质上都属于“产品层”叙事——聚焦于“医生问什么、AI 答什么”。真正缺失的是更深一层的架构:当多个智能体需协作完成临床任务(如病例研讨、用药审核、临床方案设计),当不同医院、科室需将领域知识接入 AI 且确保数据隔离与合规审计时,谁来承担这一重任?

通俗地说,便是:医疗 AI 急需一个操作系统。

证元芳于 2026 年 3 月面世,其英文名为 QSevidence,其中“evidence”即为产品的核心。

与多数医疗大模型外挂场景迥异,证元芳的工作流反向操作:先判定该问题在医学知识库中是否存在可信证据及证据等级,随后生成答案,再将每项判断对应的证据链挂载于答案下方。我们的内部团队将此机制称为“System 2 慢思考”,意为不急于回应,而是先行走完证据流程。

支撑此机制的,是公司自建的全球医学知识融合底座及 5000 万实体级别的医学大图谱。在医学知识图谱领域,单源数据较为常见,而多源、跨语种、跨形态的融合则相对稀少。

该架构于 2026 年 5 月接受了一次外部检验。中国信通院旗下的泰尔实验室对证元芳进行了“医疗健康智能助手(MedClaw)能力测评”,13 项功能用例全部通过——涵盖循证问答即时响应、证据