AI作为健康决定因素:构建算法流行病学框架
一、引言:AI作为一种新型健康决定因素
仅仅两年时间,人工智能(AI)已从实验室的科研工具蜕变为日常生活的基石。ChatGPT在发布两个月内便积累了1亿用户;展望2025年,预计六分之一的美国家庭每月至少利用一次AI聊天机器人获取健康资讯,三分之二的美国医生在临床诊疗中会借助AI。到了2026年初,OpenAI推出的ChatGPT Health更是集成了病历档案与可穿戴设备数据,这标志着AI已深度融入医疗决策与服务的底层架构之中。
这种深度嵌入是一把双刃剑。一方面,AI辅助患者理解晦涩的医学术语,为医疗资源匮乏者提供心理援助,基于AI的分流系统优化了急诊科优先级;另一方面,陪伴型聊天机器人可能引发青少年的情感依赖,过度依赖AI的学生脑神经连接性减弱,且AI生成的错误健康资讯已难以与人类撰写的内容区分开来。
面对这一现状,流行病学领域却缺乏对AI影响人群健康进行概念界定、度量及研究的框架。我们虽有针对空气污染、营养、烟草及社交媒体的研究方案,却唯独缺少针对AI的系统性研究体系。本文旨在填补这一空白,论证AI作为一种健康决定因素,必须通过借鉴环境流行病学的方法来进行系统性的探究。
二、现有研究范式的局限:微观实验难以捕捉宏观效应
当前的文献多将AI视为一种单一暴露源,但研究往往局限于狭隘的实验场景:
1、AI生成文本作为说服手段:研究发现AI生成的政策论点在改变态度上的效果与人类相当,且AI生成的虚假信息极难被识破。
2、AI交互作为暴露源:与带有偏见的模型协作会改变作者的观点,有偏见的AI搜索建议也会左右投票倾向。
3、临床环境中的算法偏见:基于历史成本数据训练的算法往往系统性地低估黑人患者的病情严重度,大语言模型在分诊建议中表现出基于口音的隐蔽歧视。
这些研究的共同短板在于:将AI暴露定义为低维度的“治疗”,在特定任务场景下交付,且仅在短时间内评估结果。这好比试图通过测量一顿饭来研究饮食习惯对健康的长期影响——有助于理解机制,却无法捕捉持续饮食模式带来的后果。此外,证据积累往往滞后于技术迭代:严谨的实验往往基于过时的模型,而AI暴露的生态图景却日新月异。
关键的公共卫生问题仍未得到解答:长期使用AI对抑郁及认知功能有何影响?持续依赖AI获取健康建议会怎样改变就医行为?平台治理的变革是否会在人群层面改变心理健康结局?要回答这些问题,亟需一种基于人群的流行病学新范式。
三、理论框架:将AI定义为算法健康决定因素
本文提出借鉴环境流行病学的概念模型,将AI界定为一种算法健康决定因素。
1、AI的独特属性
AI绝非普通的数字技术,它具备四个独特的因果特性:
●生成新颖内容:区别于宽带或电子病历仅传输信息,AI创造文本、图像和推荐,既是媒介也是信息本身。
●实时适应性:AI根据个体实时状况调整,构建了暴露与行为之间的反馈循环。
●跨类别运作:同时重塑信息环境、改变健康行为并重构社会关系。
●非平稳性与不透明性:模型更新改变了“智能体”的形态,且聊天机器人模仿人类的设计让个体难以察觉自己何时被AI改变。
2、区分环境AI暴露与个人AI暴露
借鉴空气污染流行病学,框架将环境AI暴露与个人AI暴露区分开来:
●环境AI暴露:指共享算法层的信息与制度环境。算法筛选新闻源、排序搜索结果、分诊急诊患者、评估信贷申请及审核在线内容——即便个人并未直接使用AI。例如,未使用ChatGPT的人可能仍受AI裁决的保险索赔、算法策划的社交媒体源或算法分诊设定的急诊等待时长的影响。世界银行利用AI估算贫困,全球基金利用AI模型量化疟疾发病率,这些都属于环境暴露范畴。
●个人AI暴露:指直接、自愿的AI系统交互,如咨询聊天机器人获取健康建议、依赖AI寻求情感慰藉、与语言模型协作写作或使用症状自查工具。这类似于个人污染暴露,因访问权限、偏好、素养及目的而异。
这一区分厘清了“不使用AI”并不等同于“未暴露于AI”。它明确了不同的干预目标——针对环境暴露需加强监管,针对个人暴露则需开展行为与教育干预。
四、AI在流行病学模型中的因果角色
根据研究问题,AI在流行病学模型中可扮演至少四种角色:
1、作为暴露源:直接接触AI生成的内容或交互影响健康。例如,青少年每日使用陪伴型聊天机器人对抑郁的影响,或人群接触AI策划的健康虚假信息。
2、作为混杂因素:AI算法塑造了人们获取的内容及后续结果,引入了偏差。例如,研究社交媒体使用与抑郁的关系时,若忽略算法策划,就会受到未测量的AI混杂干扰。
3、作为中介变量:AI传递上游决定因素。例如,收入决定了获取优质AI工具的权限,这进而塑造了健康信息的质量,最终影响健康决策——将AI置于社会经济地位与健康之间的因果链条上。
4、作为效应修饰符:AI改变既定关系的强弱。例如,高质量的AI决策支持可能缓冲医生经验不足对诊断准确性的负面影响;AI生成的错误信息可能放大低健康素养对不良健康选择的冲击。
此外,AI打破了经典流行病学的稳定单元处理值假设。首先,通过干扰机制:算法基于集体行为策划共享环境,个体的AI交互可改变其同伴的算法信息源。其次,通过多重版本的治疗:生成系统实时适配每个用户,名义上相同的“暴露”对每个人而言都是独特的定制化干预。
五、测量AI暴露的维度
为了使AI暴露成为流行病学的研究构念,文章提出了两个层面的测量架构:
1、个体层面
●访问:连接性、设备、技术能力。
●工具组合:使用的系统、渠道。
●强度:频率、持续时间及轨迹。
●目的:教育、工作、健康、情感支持、娱乐。
●依赖:依赖程度及社会接受度。
这些维度会产生不同的流行病学预测指标。例如,AI使用强度随教育水平急剧波动,这引发了关于AI作为社会经济健康差异中介的假设。使用目的随种族/民族而异,黑人成年人更多使用AI获取健康信息,而其他/多种族成年人则在教育和互联网搜索方面领先。若与健康相关的AI使用带来风险或收益,黑人成年人将首当其冲地受到影响。
2、机构层面
●监管环境:数据保护法、AI专项法规。
●平台治理:数据留存、安全过滤器、匿名保障。
●模型属性:训练数据来源、偏见特征、更新频率。
六、人群数据揭示的测量缺口
目前关于AI使用的大多知识来源于平台数据(如ChatGPT交互日志、应用遥测、网络流量),这些数据仅捕获活跃用户,缺乏人群分母,且系统性排除了未暴露群体。
全国代表性调查描绘了不同的图景。美国之声综合调查发现,57%的美国成年人出于至少一个个人目的使用生成式AI,但这掩盖了巨大的差异。每日使用集中在受过大学教育的成年人(20-21%)与非大学教育成年人(8%)之间呈现出阶梯状分布。在种族/民族群体中,每日使用率从西班牙裔(12%)到其他/多种族(30%)不等。与健康相关的AI使用展现出独特的人口学特征:黑人成年人报告的使用率最高(30%),而白人(16%)和西班牙裔(9%)相对较低。
这些模式表明,AI暴露并非均匀分布,其健康影响可能具有异质性。黑人成年人中与健康相关的AI使用集中,意味着AI介导的信息健康影响将首先不成比例地波及这一群体。教育梯度也暗示AI可能在社会经济健康梯度的形成中发挥中介作用。
七、对实践、公平与治理的影响
1、对流行病学实践的影响
AI暴露应像饮食、运动和屏幕时间一样,在人群健康研究中常规测量。自我报告是务实的起点,但需通过智能手机被动感知进行校准。研究设计必须适应随时间演变、具有适应性的暴露:边缘结构模型、g计算、目标试验模拟以及利用政策变革的准实验方法尤为适用。
2、对健康公平的影响
若AI塑造健康,缺乏优质AI访问将构成健康公平问题,但差异化的伤害亦是挑战。未获得优质AI的人群可能处于劣势;而暴露最严重的人群——形成准社会关系的青少年、使用不受监管治疗机器人的危机个体——可能承担不成比例的伤害。
算法内化并复制其训练数据中嵌入的社会结构。当临床算法系统性地低估黑人患者的病情严重度,或语言模型对非标准口音表现出隐蔽偏见时,便体现了这一点。伤害的分布很少是简单的累加:处于多重边缘化身份交叉点的个体将经历复合的、结构独特的AI暴露。环境AI暴露的非局部性增加了另一维度。AI模型常将零散的监测数据转化为全球优先事项的可比健康损失度量,其内含的假设决定了哪些人群和风险在政策辩论中变得可见。因此,AI可能成为自动化不平等的机制——即在监视能识别其之前大规模传播的伤害。
3、对AI治理的影响
若AI系统塑造人群健康,运营它们的实体便有责任支持独立研究。但类比并不适用:AI公司控制着研究其产品所需的数据。在环境和药物研究中,政府强制报告赋予了研究人员独立访问权。对于AI,平台遥测数据仍属私有。缩小这一差距需要强制数据共享、独立审计、隐私保护访问协议以及类似药物警戒网络的AI暴露注册系统。
八、结论
AI已通过人们接触的信息、遵循的建议以及代表的临床决策来塑造健康。本文提出的框架区分了环境与个人暴露,明确了AI在流行病学模型中的因果角色,并概述了必须测量的暴露维度。
AI渗透进健康相关领域的速度远超其研究能力,两者间的差距正在扩大。缩小这一差距需要新的数据基础设施、新的研究设计,以及公众、流行病学家、计算机科学家、控制数据的平台及监管AI的机构间的通力合作。