标签

医疗AI新趋势:从大模型迈向智能体时代

发布时间:2026-07-01 16:53阅读:2

近年来,随着ChatGPT、DeepSeek等大模型技术的迅猛进步,人工智能正快速渗透医疗领域。从智能问诊、报告解读到辅助诊断、健康管理,各类AI应用层出不穷,“医疗大模型”已成为智慧医院建设的热门概念。但在医疗场景深化应用过程中,业界逐渐发现一个关键问题:仅具备对话和问答能力的大模型,已难以满足复杂医疗业务的现实需求。

当患者询问检查结果时,AI需主动查询医院系统;当医生制定诊疗方案时,AI要综合分析病历、检验、影像等多源数据;当医院开展慢病管理时,AI还需持续跟踪患者状态并主动干预。这些任务显然超出了传统聊天机器人的能力范围。

在此背景下,“医疗智能体(Medical Agent)”成为医疗人工智能发展的新方向。近期发表于《中国数字医学》的《医疗智能体研究与应用进展》一文,系统梳理了医疗智能体的发展现状、核心技术架构及应用趋势。本文结合该论文,拆解医疗智能体的底层技术逻辑,帮助读者理解:医疗AI为何正从“大模型时代”迈向“智能体时代”。

医疗智能体

让AI从“会回答”转向“会做事”

医疗智能体是面向卫生健康领域,以大语言模型(LLM)为核心,具备规划、记忆、工具调用及行动能力的人工智能系统。

与传统医疗AI相比,其最大区别在于不仅能理解问题、生成答案,还能自主完成复杂任务。

例如,在智能问诊场景中,传统AI主要承担知识问答角色;而医疗智能体可根据患者描述主动追问病情、调用知识库分析、结合诊疗规范推理,并生成后续处理建议。

在报告解读、辅助诊断、健康管理、互联网医院服务等场景中,医疗智能体同样展现出更强的任务执行能力。本质上,医疗智能体正推动医疗人工智能从“工具型AI”向“执行型AI”演进。

政策与需求双轮驱动

医疗智能体迎来发展窗口期

从产业角度看,医疗智能体的兴起源于技术突破,也与政策推动和临床需求密切相关。

近年来,国家层面陆续出台多项人工智能相关政策。《国务院关于深入实施“人工智能+”行动的意见》《关于促进和规范“人工智能+医疗卫生”应用发展的实施意见》等文件明确要求,加快推动人工智能与医疗卫生深度融合。

根据相关规划,到2027年,智能终端、智能体等应用普及率将超70%,重点发展“模型即服务(MaaS)”“智能体即服务(Agent as a Service)”等新业态,并形成一批面向专病专科的垂直大模型和智能体应用。

同时,全球人工智能监管体系不断完善。例如,欧盟《人工智能法案》将医疗人工智能明确纳入高风险应用领域,对模型透明性、安全性和责任归属提出更严格要求;我国《网络安全法》等法规也强调人工智能伦理规范和安全监管。可见,医疗智能体发展正进入“技术创新”与“规范治理”同步推进的新阶段。

医疗智能体的核心架构

构建“感知—决策—执行”闭环

那么,一个医疗智能体究竟如何工作?

其底层本质是一个以大语言模型为决策中枢,通过规划、记忆、工具调用与行动模块协同工作的闭环系统。

用户发起任务后,智能体首先理解分析任务,随后制定执行计划、调用所需资源、完成任务执行,并根据执行结果持续优化决策。整个过程类似医生临床思考模式,因此被概括为“感知—决策—执行”闭环。

医疗智能体功能架构

从技术层面看,医疗智能体主要由五大核心模块构成。

1. 大语言模型:医疗智能体的“大脑”

大语言模型(LLM)是医疗智能体的核心。通过海量文本预训练和自监督学习,大模型能掌握医学知识、语言规律及复杂语义关系,形成较强的上下文理解和推理能力。

在医疗智能体架构中,大模型承担任务理解、意图识别、决策生成及整体编排职责,相当于系统的“大脑”。无论是患者咨询、诊疗辅助还是运营管理任务,最终都由大模型完成理解和决策。但仅有大模型不足以支撑复杂医疗场景,因此需要其他能力模块协同。

2. 规划能力:让AI具备临床思维

在真实医疗场景中,许多任务复杂度高,难以一步完成。因此,医疗智能体需具备规划(Planning)能力。规划模块的核心作用是将复杂任务拆解为多个可执行子任务,并根据执行结果动态调整策略。常见方法包括思维链(CoT)、思维树(ToT)及ReAct框架等。

以“胸痛待查”为例,智能体不会直接给出诊断结果,而是按临床思维路径逐步推理:首先评估生命体征是否稳定;随后分析心电图及相关检查结果;进一步鉴别心源性与非心源性疾病;最后形成诊疗建议。这种逐步推理过程,提升了诊断准确率,也增强了决策可解释性。

3. 记忆能力:让AI拥有持续认知能力

规划能力决定智能体如何思考,记忆能力则决定智能体能记住什么。论文将智能体记忆划分为短期记忆和长期记忆两类。

短期记忆主要用于保存当前任务的上下文信息。例如,在多轮问诊中,智能体能持续记住患者提到的“咳嗽3天”“午后低热”“咽痛”等信息,保持对话连续性,避免重复询问。

长期记忆则依赖向量数据库、知识图谱及检索增强生成(RAG)等技术实现。通过长期记忆,智能体能快速检索患者既往病史、检查记录、过敏信息及临床指南等,为连续诊疗和长期健康管理提供支持。

可以说,记忆系统是医疗智能体实现个性化服务的重要基础。

4. 工具调用与行动能力:让AI真正连接现实世界

这是医疗智能体区别于传统大模型的关键能力之一。

真实医疗业务涉及大量外部系统和工具,仅靠模型自身知识远远不够。因此,智能体需通过标准化接口连接医院HIS、EMR、LIS、PACS等业务系统,并根据任务需要调用相应工具。

近年来,随着模型上下文协议(MCP)等新型标准发展,医疗智能体正逐步实现对异构系统资源的统一发现、描述和调用。在此基础上,行动模块将决策结果转化为具体执行行为。

例如:查询检查结果、生成病历摘要、发起患者随访、推送健康宣教、触发风险预警等。

同时,行动结果作为新输入反馈系统,形成持续优化的认知循环。强化学习(RL)采用的“试错—反馈—优化”机制,也被广泛应用于这一过程。

从单智能体走向多智能体协同

随着医疗场景复杂度提升,单一智能体逐渐暴露出知识覆盖面有限、任务处理深度不足及并发能力受限等问题。

特别是在多学科联合会诊(MDT)、全病程管理、医院运营管理等复杂场景中,越来越多研究开始探索多智能体协同架构。

多智能体协同模式

其核心思想是构建多个具备明确分工的智能体角色,通过共享上下文和协同决策共同完成复杂任务。

例如:导诊智能体负责患者分流、问诊智能体负责病情采集、诊断智能体负责疾病推理、随访智能体负责院后管理、运营智能体负责资源调度。多个智能体通过主从式、流水线式等协同模式共同工作,实现比单一智能体更强的综合能力。

医疗智能体如何部署落地?

随着医疗智能体进入实际应用阶段,其部署模式呈现多样化特征。总结了当前较为主流的四种部署方式:

● 公有云部署适用于医学科普、健康咨询等低敏感场景,具有部署快速、成本较低的优势;

● 私有化部署是当前医院最主流的模式,所有模型和数据保留在院内环境中,更符合医疗数据安全要求;

● 混合云模式兼顾安全性与成本优势,将敏感数据保留在本地,将计算密集型任务放在云端处理;

● 边缘计算模式则将轻量化智能体直接部署在床旁设备或移动终端,实现低延迟和实时响应。

未来,不同部署模式将根据医疗机构规模、数据安全要求及业务需求长期共存。

从发展历程看,医疗人工智能正在经历重要转变。过去,行业关注“大模型能不能回答问题”;今天,越来越多人开始关注“AI能不能真正完成工作”。

医疗智能体以大语言模型为核心,通过规划、记忆、工具调用和行动能力的深度融合,构建完整的“感知—决策—执行”闭环,让人工智能从单纯的信息生成工具逐步成长为能参与医疗业务流程的数字助手。

【免责声明】公众号所载内容