美国国家经济研究局工作论文系列 人工智能、医疗保健价值链的演变以及医生的未来大卫DranoveCraig Garthwaite 工作文件30607http://www.nber.org/papers/w30607 国家经济研究局(NATIONALBUREAUOFECONOMICRESEARCH) 麻萨诸塞州大道1050号马萨诸塞州,剑桥021382022年10月 我们感谢2022年NBER人工智能夏季会议的参与者提出的有益意见和建议。本文表达的观点是作者的观点,不一定反映国家经济研究局的观点。 分发NBER工作文件供讨论和评论之用。它们没有经过同行评审,也没有接受NBER官方出版物随附的 NBER董事会的审查。 ©2022年由大卫·德拉诺夫和克雷格·加思韦特创作。保留所有权利。未经明确许可,可以引用不超过两段的短段文字,但须注明来源,包括©通知。 人工智能、医疗保健价值链的演变以及医生的未来大卫·德拉诺夫和克雷格·加思韦特NBER工 作文件第30607号2022年10月冻胶。I11、I19O32O38 摘要 人工智能(AI)正在改变所有经济部门的生产,有可能补充和替代传统的劳动力投入。医疗保健也不例外。最近的数十项学术研究表明,人工智能可以通过提高诊断准确性和治疗建议来为医疗保健价值链做出贡献。在这些方面,人工智能可能会补充或替代医生。我们认为,人工智能代表了数十年来加强医疗决策的努力的高潮。使用考虑医疗保健市场长期制度特征的历史视角,我们确定了在医疗保健中实施人工智能的众多障碍,并确定哪些专业最有可能被人工智能取代。 大卫Dranove部门策略 西北大学凯洛格管理学院 2211年校园开车埃文斯顿,60208 克雷格Garthwaite 西北大学凯洛格管理学院 2211年校园开车 埃文斯顿,60208年,国家经济研究局 人工智能、医疗保健价值链的演变以及医生的未来 I.我ntroduction 人们常说,最昂贵的医疗“技术”是医生的笔.1虽然这显然是一个杜撰的说法,但它植根于医生对医疗保健经济的基本中心地位。在他的开创性著作中,Fuchs(1974)将医生描述为“团队的队长”,即指导医疗技术应用的经济行为者,因此是医疗支出的主要决定因素。自从Fuchs提出这一论点以来的五十年里,没有太大的变化——医生仍然主导着医疗决策——除了团队变得更大、更昂贵。 作为“团队队长”,医生诊断疾病,推荐和执行治疗。正如Arrow(1963)所描述的那样,患者相信他们的医生会对他们的治疗做出正确的选择,医生继续在信任方面获得高分,尤其是与其他职业相比(盖洛普,2022年)。然而,医生容易犯错,经常误诊病例并提出错误的治疗建议。最近的研究表明,这可能涉及对病情严重的人的治疗不足和对基本健康的人的过度治疗.2结果是成本增加和可预防的死亡、伤害和疾病发生率增加的不良组合。 鉴于医生固有的易犯错误性,在过去的几十年里,医学界、付款人和监管机构已经尝试了激励措施,并向医生提供有关最佳实践的信息,试图影响和改善医疗决策。大量研究文献表明,这些努力充其量只是好坏参半的结果3。 数据收集和分析方法的进步使“人工智能”(AI)的发展成为可能,为改善医疗决策提供了前所未有的新机会。在各种病例中,人工智能已经显示出降低假阳性和假阴性诊断率的潜力。人工智能还可以提供更合适的治疗建议,通常根据高度特定的症状和患者特征进行定制,而这些症状和患者特征对于每个人类医疗服务提供者来说都难以准确诊断。最后,人工智能有可能克服系统中各种参与者的一些固有偏见,尽管这可能是用数据分析师和指导其工作的人的偏见取代医生的偏见的问题4。 为了更好地理解人工智能在医疗保健中的潜在影响,我们依靠Autor,Levy和Murnane(ALM,2003 )建立的经济直觉,该直觉研究了更大自动化对不同技能类型的工人之间的工资和任务分配的影响 。虽然ALM主要考虑机器人做相对常规工作的影响,但技术 1https://www.hcinnovationgroup.com/home/blog/13018116/whats-the-most-expensive-technology-the-doctors-pen 2穆莱纳坦和奥伯迈耶。2021.“诊断医生错误:低价值医疗保健的机器学习方法,” 经济学季刊,137(2):679-727。 3例如,参见Wickizer和Lessler(2002)和Eijkenaar,F.等人(2013)分别回顾了关于利用率审查和绩效薪酬的文献。 4Z.Obermeyer等人,“剖析用于管理人口健康的算法中的种族偏见”,《科学》,2019年10月。 人工智能的进步意味着自动化可以越来越多地完成一些被认为是人类工人专属领域的非常规任务。他们甚至可能比人类更好地完成其中一些非常规任务。 但同样明显的是,医生和其他医务人员常规执行的其他任务仍然远远超出了人工智能最乐观支持者的能力范围。正如Autor(2021)所建议的那样,因此,在医学中更多地使用人工智能的影响将取决于常规和非常规任务取代或替代仍必须由医疗服务提供者执行的任务的程度。正如我们在下面讨论的那样 ,这种影响可能会因专业、技能和患者的医疗状况而异——可能对医学界产生广泛的影响。 从广义上讲,医生负责从患者那里收集信息,并使用该信息来诊断病情和制定治疗方案。在某种程度上,收集的信息是纯粹的物理信息(例如血液样本,图像或组织样本)并且诊断可以自动化,可以想象,医生可能会失去他们在“队长”角色中的中心地位,并被医疗服务提供者服务所取代,更多地是执行第三方AI算法决策的技术人员。这可能导致医生将大部分实践交给成本较低的专职医疗专业人员,例如在零售诊所工作的执业护士。在这种情况下,价值可能会被人工智能系统的所有者和实施者或诊所或患者捕获。 在某种程度上,信息仍然必须通过人类医疗服务提供者和患者之间的人与人互动来收集,更准确地使用该信息进行诊断和制定治疗计划的能力是对提供者努力的补充。能够更好地从患者那里收集数据或利用来自人工智能的额外信息的提供者可能会获得大部分创造的价值。然而,该提供商可能不是目前完成这些任务的同一类型的医生——专职医务人员可能同样(或更多)能够将人工智能信息纳入医疗决策。因此,人工智能的影响将由目前构成医生在系统中的角色的一组任务决定——我们在下面演示这些任务在不同专业之间有意义地变化。 在经济文献中,人工智能的创造和采用通常被明确或隐含地建模为由于更广泛的技术进步而出现的外生事件。然而,在医疗保健领域,人工智能的成功存在许多障碍,这些障碍是该行业特有的,可能会影响自动化的最终存在和性质。至少,在收集包含患者信息的大型数据集方面存在制度和法律障碍。也许更重要的是,人工智能的成功可能取决于它所威胁到成功的人——医生——的支持。因此,我们将在下面讨论ALM对AI对医生影响的预测如何塑造医学界出现和采用的AI类型。 此外,我们还考虑了政府和竞争环境在决定出现哪些类型的技术方面的作用。如果没有某种标准制定机构,目前尚不清楚如何采用技术。如果这些技术的准确性出现微小差异,并且责任的法律环境不明确,则尤其如此。 本文按以下方式进行。我们首先描述了医疗保健市场的重要特征,这些特征对于理解人工智能的经济影响至关重要。这些包括医疗决策过程和第三方干预的历史。接下来,我们将研究劳动经济学文献对医疗保健价值链中经济盈余分配的影响,并证明不同任务在理解这一预测中的重要作用。我们推测人工智能将如何塑造医生和相关人员的未来。然后,我们从人工智能公司的角度出发——他们是否会抓住他们创造的价值,他们是否会被迫适应医生的潜在反弹?最后,我们将讨论其他经济研究领域,这将有助于了解人工智能在这个市场的潜在影响。 II.的V价值C海恩一个nd米从医疗D再说米蛇行 我们首先描述了医疗保健中高度程式化的价值链,突出了医生的核心作用。虽然整个价值链相当复杂,包括医疗创新和健康保险,但我们专注于从发病到提供治疗的关键步骤: 患者去看医疗服务提供者,通常是医生,抱怨症状或进行常规检查。 提供者和患者讨论患者的健康状况,提供者根据从患者收集的信息执行额外的诊断测试和程序 提供者诊断任何现有的医疗问题 提供者建议一个疗程,其中可能包括观察等待、药物治疗、额外的诊断测试和/或外科手术 如果患者同意,则进行额外的检查和治疗。 在一篇开创性的论文中,Arrow(1964)描述了医生如何以及为什么在这个医疗保健价值链中发挥核心作用 。作为患者的学习代理人,医生帮助患者确定他们需要哪些医疗服务以及谁应该提供这些服务。患者相信他们的医生有能力和富有同情心。医生通过专业培训和多年的经验赢得了这种信任。医学院期间的灌输以及专业的同伴压力进一步鼓励医生充当完美或近乎完美的代理人(Dranove,1988)。正如阿罗所说:“最佳实践的社会责任是医生销售的商品的一部分。 医生在价值链中发挥着核心作用,他们从他们创造的价值中占据了相当大的一部分。医生是美国薪酬最高的人之一。例如,在2017年,医生的平均年收入接近350,000美元,所有医生中有一半在美国所有收入者中排名前2%(Gottlieb等人,2020年)。这些平均值掩盖了有意义的异质性,初级保健医生的平均收入约为25万美元,外科医生的平均收入接近50万美元。联合医疗服务提供者虽然工资仍远高于平均水平,但并未接近这些水平。 价值链中的其他参与者,如医院、药品和设备制造商,甚至保险公司,也为价值创造做出了贡献,并将价值中具有经济意义的部分作为工资。 和利润。患者捕获剩余价值-价值链创造的健康效益与其以自付费用和保险费形式支付之间的差额。 几乎在阿罗描述医患关系的同时,研究人员就开始确定医生远非完美代理人的方式。我们将在下一节中讨论这项研究。对偏见和错误的担忧导致提供商和第三方付款人使用研究证据和实践经验来改善医疗决策。在下一节中,我们将用一个基本的概念框架来描述这些干预措施的历史,即人工智能是这些长期努力的最新和可能最强大的例子。 III.ThirdP附庸风雅的我ntervention我nt他V价值C海恩 甚至在Arrow(1964)描述值得信赖的医生代理人和Fuchs(1974)将医生命名为“团队队长”之前,研究人员就对医疗决策感到担忧。其中一项研究侧重于按服务收费报销的有害影响,这为医生过度治疗患者提供了激励5。 关于医生代理的第二条研究线发现,医生之间和跨地区的医疗实践存在广泛差异,因此看似相同的患者经常接受不同的治疗(Wennberg和Gittelson,1973;卡特勒等人,2019年)。在某种程度上,这可能反映了患者偏好或医生技能的差异,并且可能并不表明效率低下(Chandra和Staiger,2007;芬克尔斯坦等人,2016年 )。然而,有一个广泛的共识,即至少有一部分实践差异反映了糟糕的医疗决策,无论是由于培训不足、经验有限还是个人偏见(Cutler等人,2019年)。虽然大多数关于诱导和实践变化的文献都集中在它们对卫生支出的影响上,但医学研究所2000年的一份重要报告提供了令人震惊的证据,证明质量问题也反映了医疗决策不力(Donaldson等人,2000年)。在美国,不合格的质量可能导致每年超过100,000例不必要的死亡 如果医生做出错误的决定,那么可能需要进行一些监督.7医疗服务提供者审查彼此的决定的历史由来已久 。例如,医院质量保证委员会审查医疗记录以评估其医务人员的决定。第三方干预医疗决策的第一个例子可以追溯到1950年代,当时包括工会和一些健康维护组织在内的几个组织制定了第二手术意见计划。顾名思义,未经独立外科医生批准,付款人不会授权报销手术费用。有组织的医学抵制,第二意见计划没有迅速传播。 5例如,参见ShainandRoemer(1959),Roemer(1961),Evans(1974),Fuchs(1978)和Luft(1978)。 6其中包括引入每次住院的固定付款