图片

一、引言:看不见的价值预设 

20265月,来自哈佛医学院、贝斯以色列女执事医疗中心等顶尖机构的科研团队发布了这项发人深省的研究。当我们谈论医疗AI时,我们通常关注它的准确率、幻觉率或安全性。但有一个更深层的维度长期被忽视:价值观

医学本质上是充满价值张力的。当面对一位极早产、伴有严重脑室内出血的新生儿,是继续维持生命支持(尊重父母的自主权与生存希望),还是转为舒缓疗护(避免无意义的痛苦与不成比例的医疗资源消耗)?这不仅仅是医学判断,更是自主、有益、不伤害与公正四大伦理原则的博弈。

社会信任医生,是因为医生受希波克拉底誓言约束,并能结合患者意愿进行共同决策。但当AI开始直接为患者提供医疗建议,甚至在没有医生监督的情况下介入生死抉择时,它所携带的伦理预设是什么?这些预设是否代表了社会的多元价值观,还是某种单一、僵化的算法霸权

这篇题为AI医生的价值取向何在?——语言模型临床伦理中的多元主义审计》的文章,首次系统性地构建了医疗AI伦理多元化审计框架,揭示了当前最前沿的大模型(LLMs)在面对临床伦理困境时,内心深处的价值排序。

图片

二、核心创新:构建伦理显微镜” 

为了量化AI的价值观,研究团队没有采用简单的问卷,而是设计了一套精巧的行为审计机制。

150无解的临床困境

研究者开发了包含50个临床病例的基准测试。这些病例均经过医生编辑和盲审,每一个都设计为强制性的二元对立。例如:

精神科困境:一位有自杀风险的患者拒绝住院,是尊重其自主权让其回家(自主),还是强制收治以防止其自杀(不伤害/有益)?

资源分配困境:在器官移植名单上,是优先给年轻患者(正义/效用),还是优先给排队更久的老年患者(正义/公平)

每个病例都附带了精确的价值标签矩阵,明确标注了选择AB分别对四大原则的影响(促进、中立或违反)。

2、从决策反推价值观

研究团队测试了12个主流前沿模型(包括GPT-5.2Claude Opus 4.5Gemini 3 Pro等)和20位真实医生。每个模型对同一病例询问10次(温度设为1.0以增加随机性)。结果发现,模型的表现出奇地一致且确定

图片

三、关键发现:AI是坚定的独裁者,而非摇摆的协商者” 

1、缺乏分布多元化

人类医生在面对伦理困境时,往往存在分歧。在上述实验中,20位医生在21个病例上未达成共识。然而,AI模型却截然不同。

近零熵值11/12的模型在75%的病例上,10次回答完全一致(熵为0)。

无视人类分歧:无论人类医生在某个问题上分歧多大,AI的决策熵始终保持在低位。它不会因为人类吵得不可开交就变得犹豫不决。AI是坚定的一致决策者。

2、模型拥有自己的道德指纹

通过分析模型在50个病例上的选择模式,研究者反推出了每个模型的价值权重分布。结果显示,绝大多数模型(10/12)都具有显著的、非均匀的价值偏好。也就是说,每个AI都像是一个有着特定性格的医生:有的特别看重行善,有的特别看重不伤害。

3、大多数模型是正常人,少数模型是危险分子

研究人员计算了每个模型的价值分布与医生共识之间的距离(JS散度)。

安全区Gemini 3 ProMistral Large8个模型的价值分布落在了人类医生自然波动的范围内。它们的表现就像是一个合理的个体医生。

危险区GPT-5.2Grok 4Perplexity Sonar Pro这三个模型显著偏离了人类共识。它们共同的特征是:极度轻视自主权

在医生共识中,自主权权重最高(0.444)。

而在GPT-5.2中,自主权权重仅为0.061(倒数第二)。

这意味着,如果部署这些模型,它们可能会系统性地替患者做决定,而无视患者的意愿。

图片

四、悖论:会说理的奥佛顿多元化与僵化的决策单一化” 

研究中最令人惊讶的发现在于推理过程与最终决策的巨大割裂

1、奥佛顿多元化

当分析AI生成的自由文本推理时,研究者人员发现模型表现极佳。它们通常会说:一方面,尊重患者的自主权很重要(支持A);另一方面,防止患者受到伤害也很重要(支持B)。” 模型能够全面地讨论对立双方的价值,没有忽略任何一方。

2、决策单一化

然而,当到了做决定的时刻,这种平衡消失了。模型会坚定不移地选择某一方。它虽然心里明白两边都有道理,但行动上却像一台设定好程序的机器。

比喻:这就像一个医生在查房时,能头头是道地分析保守治疗和激进手术的利弊,但最终总是选择激进手术,从不例外。这种知行不一在医疗场景中极其危险,因为它剥夺了患者根据具体情境获得不同建议的权利。

图片

五、生态系统:没有算法单一文化,但有部署单一文化” 

好消息是,当前的AI模型生态并没有形成单一的价值观垄断(算法单一文化)。不同模型之间的价值分布差异,与人类医生之间的差异一样大。模型之间是相互竞争的。

坏消息在于部署环境。患者通常一次只看一个AI(比如某个App或某个医院的系统)。如果这个AI恰好是那个极度轻视自主权的模型,那么该患者在整个就医过程中,接触到的建议都将带有这种偏见。这就形成了部署单一文化

这就像在一个城市里,虽然有100个不同政治观点的报社(模型生态多样),但如果政府规定所有人只能订其中一份报纸(部署单一),那么思想的多样性就被扼杀了。

图片

六、行业启示与未来方向 

1、警惕自主性赤字

本研究强烈警示,对于那些在价值观校准中严重偏离人类共识(特别是低估患者自主权)的模型,应禁止直接面向患者使用。医疗AI的首要伦理风险可能不是杀人,而是剥夺选择权

2、多模型陪审团

既然单个模型是固执的,解决方案可能是组建陪审团。通过聚合多个不同价值取向的模型意见,模拟人类多学科会诊(MDT)的过程,从而获得更平衡的伦理决策。

3、可控性是未来

理想的状态是,AI能根据患者的价值观进行调整。如果患者是虔诚的宗教信徒,AI应偏向无论如何都要维持生命;如果患者是极端的功利主义者,AI应偏向资源最大化利用。但目前的研究表明,模型的价值观极其顽固,很难通过提示词来改变。开发真正可调节的伦理AI是当务之急。

图片

七、结语 

AI医生的价值取向何在?——语言模型临床伦理中的多元主义审计》这项研究撕开了医疗AI伦理的黑箱。它告诉我们,AI不仅会犯错(幻觉),还会带有偏见。这种偏见不是数据偏见,而是价值排序的偏见

在追求AI医疗准确率的同时,我们必须建立一套伦理审计制度。我们要问的不是这个AI准不准?,而是这个AI在面临生死抉择时,把什么放在第一位?如果一个AI效率行善看得高于一切,而无视患者的意愿,那么它可能是一个高效的执行者,但绝不是一个合格的医生。因为在医学的殿堂里,尊重人的尊严,永远比治愈疾病本身更重要。

如需要AI医生的价值取向何在?——语言模型临床伦理中的多元主义审计》(英文,35页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。

图片


图片

图片


★ 每日鲜鸡汤  ★

Happiness is a choice, not a result. Nothing will make you happy until you choose to be happy. No person will make you happy unless you decide to be happy. Your happiness will not come to you. It can only come from you. 快乐并非尘埃落定后的奖赏,乃心之所择。万物难赐汝欢愉,唯汝自择之;无人能予汝喜乐,唯汝自许之。幸福不来寻汝,唯从汝心而出。早上好!

图片