欧洲劳动力市场对人工智能的认识 工作纸|第05/2024号|2024年3月7日 劳拉·纳斯基和尼娜·鲁尔 我们将两组生成人工智能(GeAI)职业暴露分数-一种基于任务,一种基于能力-应用于欧洲劳动力调查。在使用不同的方法时,我们的发现揭示了两种方法的一致的人口结构:女性,受过高等教育和年轻工人的工作在欧洲更容易受到GeAI技术的影响。我们还回顾了有关GeAI最近对生产力影响的文献。在相同的职业中,经验不足或。 技术较低的工人始终从GenAI支持中获得最大的生产率提升。 我们认为,基于任务的分析比基于能力的分析更有成效,既可以指导组织及其工作场所采用 GenAI,也可以评估对工人的就业和工作质量影响。 最后,我们提供了政策建议,可以帮助工人(即劳动力供应)适应技术破坏,例如提供培训和社会安全网。但是,我们还建议采取政策干预措施,通过促进工作重新设计和组织敏捷性,将未来的劳动力需求转向更好的工作。 监测GenAI的就业效应和研究“参差不齐的技术前沿”对于进一步建立我们对这种转型技术的就业影响的理解是必要的。 LauraNurski(laura.nurski@bruegel.org)是BruegelNinaRuer(nina.ruer@bruegel.org)的非居民研究员,是Bruegel的研究助理 推荐引用: Nurski,L.和N.Ruer(2024)“欧洲劳动力市场对生成人工智能的接触”,2024年5月5日, Bruegel 1.Introduction 直到最近,基于规则或机器学习(ML)形式的人工智能(AI)才在欧洲的组织中缓慢传播,到2021年达到约8%的采用率(Gotti等人,2023)。对基于ML的AI的开发进展缓慢,部分原因是组织需要数字流程、数据和基础设施的基础,以支持在内部数据上训练ML模型。当OpeAI在2022年底发布ChatGPT聊天机器人时,一种全新的“即插即用”AI出现在公众面前:“预训练”模型 ,用户可以直接与之交互,不使用或仅使用几个训练示例。这些生成的预训练变压器(GPT)向公众展示了AI的力量。用户现在可以在几秒钟内生成高质量的文本,图像,视频和音频,这将需要人类专业人员几天或几周的时间来制作。 虽然技术潜力似乎很大,但将生成AI(GeAI)集成到fiRMS和组织中才刚刚开始。作为一种“通用技术”,如电力或计算机,组织需要确定何时,何地以及如何在其组织(生产)过程中使用GeAI。对于哪些任务,流程,组织和环境是合适的?如何重新设计流程以充分利用GeAI?这对工作和工人意味着什么? 在本文中,我们采取双重方法来评估GeAI对欧洲劳动力市场的影响。首先,我们使用适用于欧洲劳动力调查的职业暴露分数来衡量潜在影响。这些分数在理论意义上计算了“对GeAI的暴露”或“使用GeAI技术的自动化能力”,即“对生成AI的职业暴露程度如何?”虽然这并没有告诉我们任何关于GeAI实际采用的信息,但它确实给了我们可能实现的影响的上限。其次,我们通过回顾有关GeAI在实验环境和现实工作场所中对生产率影响的文献来评估迄今为止的实际影响,并从中得出一些结论。接下来,我们比较了评估GeAI对就业影响的两种方法,基于任务的方法和基于能力的方法,我们指出了这篇文献中缺少的观点。最后提出政策建议。 2.GenAI对欧洲劳动力市场的潜在影响 2.1.职业(Gen)AI影响评分概述 自从Frey和Osbore(2017)首次发布“计算机化概率”评分以来,又有几位作者提出了类似的暴露评分,旨在衡量自动化技术对职业的潜在(或理论)影响。这些作者中的每一个在计算他们的分数时都会做出一些不同的选择,这取决于: i)分析水平:整个职业、职业中的任务或追求该职业所需的能力;ii)职业信息的来源:工作描述数据库,工人调查或职位空缺 ;iii)技术创新的来源:专利文本,技术绩效基准或专家,人群或算法的判断。最后,iv)也可以通过几种方式将技术进步和职业特征的来源联系起来,在专利文本的情况下使用自然语言处理(NLP),或者在其他情况下使用专家,人群或算法的判断。 最著名的自动化影响评分示例包括:Webb(2020)使用NLP将专利文本映射到职业信息网络(O*NET)数据库中的职业任务描述1计算每个职业的技术暴露。他的方法是技术不可知的,这使他能够将其应用于几种不同的技术,如机器人、软件和人工智能。Ator等人(2022)采取了与Webb(2020)类似的方法,但在自动化技术和增强技术之间进行了明确的区分,同样基于专利文字描述和标题。Bryjolfsso等人(2018)开发了一个指标来评估任务对机器学习的暴露。他们使用众包将标题应用于《日报》。 1职业信息网络(O*NET)是一个全面的数据库和在线资源,提供有关各种职业的详细信息。由美国劳工部开发和维护,它从所需的知识,技能和能力方面描述职业,以及如何在任务,工作活动和其他描述符方面执行工作。 工作活动是O*NET数据库中更高级别的任务分组。Felten等人(2021年)还使用众包将AI基准的进展与职业层面的工作相关能力联系起来,也来自O*NET数据库,以创建AI职业暴露(AIOE)评分。Tolan等人(2021年)是唯一使用调查的人-EWCS2和PIAAC3评估AI的职业影响。他们使用专家判断,一方面将AI基准与认知能力联系起来,另一方面将认知能力与基于调查的职业任务强度联系起来。他们的方法是唯一允许职业内部变化的方法,因为调查对象可能在同一职业中具有不同的经验。最后,Lassébie和Qitii(2022)还使用专家判断来评估职业中技能和能力的自动化能力。 在本文中,我们专注于自动化和AI技术的特定子集,即生成AI或生成预训练变压器(GPT),这意味着可以产生文本,图像,音频和视频的基础模型。据我们所知,到目前为止,只有三篇论文明确关注生成AI。ThefirstoeisarefiemetbyFelteetal(2023a)oftheirearlierAIoccpatioalexposre(AIOE)metioedabove.为了将他们的一般AIOE恢复到生成AI的背景下,他们只使用他们最初的10个AI基准中的2个:一个用于语言建模(或建模,预测或模仿人类语言的能力),另一个用于图像生成(或创建复杂图像)。这产生了两个额外的分数,仅次于一般的AIOE分数:语言建模职业暴露(LMOE)分数和图像生成职业暴露(IMOE)分数。第二篇专注于生成AI的论文是由Elodo等人(2023)撰写的,他们以与上面的Bryjolfsso等人(2018)非常相似的方式计算了“GPT职业暴露”,但重点不是机器学习,而是GPT技术。有趣的是,除了使用人类评级(众包)将规则应用于工作活动之外,他们还使用GPT-4对任务和日常工作活动的GPT暴露进行评级。这意味着他们都询问人们以及GPT-4是否可以使用GPT技术在一半的时间内完成任务。最后,国际劳工组织(ILO)的Gmyre等人(2023)采取了与Elodo等人(2023)类似的方法,但他们使用国际适用的国际标准职业分类(ISCO)分类法作为基础,将其规则应用于,而不是美国的O*NET数据库。鉴于Elodo等人(2023年)的分数在撰写本文时尚未公开,我们的论文将重点比较Felte等人(2023a)和Gmyre等人(2023年)国际劳工组织暴露分数的一般AI,LM和IG分数。在下一节中,我们将更详细地介绍这些分数的构建,并将其用于分析生成AI对欧洲劳动力市场的影响。 2.2.将生成式AI暴露分数应用于EU-LFS 为了研究生成人工智能对欧洲劳动力市场的影响,我们使用了Felten等人(2023a)和Gmyrek等人(2023)计算的暴露分数 。 首先使用Felte等人(2021)中描述的方法来确定最容易受到i)AI进步的职业,更具体地说是ii)语言建模和iii)图像生成。这种方法将十个AI应用程序(例如图像生成,语言建模,抽象策略游戏,实时视频游戏)与52种人类工作相关的能力(例如口头理解,口头表达,归纳推理等)联系起来。然后使用O*NET数据库将52个能力与800多个职业相关联。O*NET数据库为每个职业中的每个能力提供了权重,描述了该职业的重要性和所需的水平,作者使用该权重来计算职业中各个能力的加权平均暴露分数。在本文中,我们的注意力集中在对生成AI的暴露上。因此,我们深入研究了为AI的两个特定应用量身定制的暴露分数:语言建模职业暴露 (LMOE)和图像生成职业暴露(IGOE)。这些评分在Felte等人(2023a)中描述。 Gmyrek等(2023)是我们生成AI暴露分数的第二个来源,它建立在Eloundou等(2023)最近证明的方法上。Gmyrek等 (2023)从国际标准职业分类(ISCO-08)开始,其中包含与每个职业相关的任务列表。 2Eurofound的欧洲工作条件调查。 3经合组织成人能力国际评估计划中的成人技能调查 然后作者要求GPT-4给每个任务的潜在自动化评分。与O*NET数据库相反,ISCO分类不包含每个任务的权重,因此作者在将自动化评分汇总到职业水平时应用相等的权重。 下面的表1比较了两种方法-Felten等人(2023a)的基于能力的方法和Gmyrek等人(2023)的基于任务的方法-一种职业,即小学教师,即ISCO职业2341和SOC职业25-2021。 表1:基于能力和基于任务的小学教师职业AI暴露计算方法的比较 基于能力Felten等人(2023a) 基于任务Gmyrek等人(2023) 25-2021年-小学教师,特殊版本除外。 2341-小学教师 O*NET能力 重要性 LM暴露 IG暴露 ISCO任务 Automa-可接受性 口头表达 91 0.91 0.37 准备每日和长期课程计划符合课程准则; 0.60 口语理解 75 0.91 0.41 单独和分组指导儿童,使用各种教学方法和材料(例如计算机,书籍,游戏),适应儿童的不同的需求; 0.30 书面理解 75 0.83 0.47 保持纪律和良好的工作习惯教室; 0.15 书面表达 75 0.85 0.47 与孩子们一起计划和开展活动如体育活动、音乐会和短途旅行; 0.25 问题敏感度 75 0.59 0.55 参加staf会议和其他会议,与其他教师就教育问题进行磋商; 0.15 来源:Gmyrek等人(2023),Felten等人(2023a)的AIOE_DataAppendix.xlsx可在Github(https://github.com/AIOE-Data/AIOE )和O*NETOnline上获得。每种方法仅显示相关能力和任务的选择。 为了研究欧洲劳动力市场及其工人对生成人工智能的暴露程度,我们将Felten等人(2023a)和Gmyrek等人(2023)的职业暴露分数合并到欧洲劳动力调查(EU-LFS)中。我们首先汇总了2022年EU-LFS浪潮中国家一级的就业数据,随后使用ISCO分类系统将其与暴露分数合并。 劳动力市场数据。EU-LFS是对欧洲劳动力市场进行大规模研究的最广泛和最全面的资源之一。它由整个欧洲的国家统计机构进行,它们监督调查管理,样本选择,问卷准备,直接家庭访谈,并将结果转发给欧盟统计局。调查的目的是将工作年龄人口(15岁及以上)分 为三个不同和详尽的群体:就业个人(包括自营职业者)、失业个人(共同构成“劳动力”)和劳动力之外的人。我们的主要样本由15岁以上的人组成,他们受雇于27个欧洲国家之一。鉴于保加利亚,斯洛文尼亚和马耳他没有三位数的职业水平变量,我们的分析忽略了这些国家,使我们能够仅专注于其余24个国家。我们使用提供的调查权重来确保加权样本准确地代表目标人群。 职业得分。从Felte等人(2023a)获得的分数最初被指定为美国规范标准职业分类(SOC)系统。然而,我们的就业微观数据 ,使用国际标准职业分类(ISCO),这需要对齐这些分类