ChatGPT如何影响我们的工作? ——AI大模型对我国劳动力市场潜在影响研究 北大国发院–智联招聘课题组成员 北大国发院:张丹丹、于航、李力行、胡佳胤、刘诗尧、莫怡青、李泓孛智联招聘:郭盛、李强、王一新、高雅琳、李小丽、李玉昭 2022年底,以ChatGPT为代表的大语言模型人工智能技术横空出世,对高收入和高教育劳动者带来冲击,引发了“机器替代人工”话题的热议。如何看待生成式AI对人类工作的影响,未来工作的内容和性质、教育的方式和手段会发生什么变化?本报告基于2018 年1月到2023年4月期间,智联招聘脱敏的岗位需求、求职者简历投递数据,以及求职者问卷调查而撰写。课题组通过对招聘岗位工作任务的文本分析,首次构建了各种职业的人工智能影响指数。 目前,我国劳动力市场对人工智能新技术适应性较弱,新技术对高影响指数劳动力存在更大替代风险,白领职业如销售业务、财务/审计/税务、软件/互联网开发/系统集成、行政 /后勤/文秘和客服等已开始受冲击。报告提出,应积极拥抱新技术,释放人的活力和创造力,同时在国家层面提升对人工智能新技术的投入,以提升国家竞争力。 【核心发现】 人工智能对于工作的影响:毁灭还是创造? 白领工作和知识型工作更容易被大语言模型替代 过去五年人工智能技术替代人工的初步趋势已显现 人工智能影响指数高的职业,过去五年发布职位数量减少 大部分职业在对工作任务的要求方面尚未出现对新技术的调整 职场人对人工智能的应对:驾驭还是疏离? 求职者的期望职业逐渐转向受人工智能影响程度较低的职业 近7成职场人尝试过大型语言模型类AI工具,5成认为AI将替代自己工作 长期来看,65.8%的职场人将参加AI技术培训,提升自身驾驭AI的能力 【报告正文】一、背景介绍 1.以ChatGPT为代表的生成式人工智能迅速发展 上世纪50年代,艾伦·图灵提出人工智能这一概念,计算机科学家们便开始研究如何赋予机器思考和对话的能力。2017年,AshishVaswani团队设计的变换器模型彻底改变了语言数据的处理方式。2018年,谷歌研发的BERT和OpenAI使用的GPT便是变换器模型的两个变种。 OpenAI不断改进GPT模型,分别于2019年、2020年和2023年发布了我们熟知的GPT-2、GPT-3和GPT-4。从分析型AI到生成型AI,从机器语言到自然语言,人工智能与人之间的差异进一步缩小,尤其是在沟通和智慧的领域。 生成式AI-ChatGPT发布时所基于的GPT-3框架是一种生成式AI算法,其接受训练数据并生成新内容,包括文字、图像、音频、视频和代码等。 大语言模型-大语言模型的一个显著特征是其庞大的参数大小,可以达到上千亿的水平。例如,GPT-1有11亿个参数,到GPT-2有15亿参数,而GPT-3有惊人的1750亿个参数,GPT-4更是具有1.8万亿巨量参数。ChatGPT问世之后,各大科技的AI大语言模型走入人们视野,例如谷歌的LaMDA,百度的文心一言,阿里巴巴的通义千问,Meta的LLaMA,以及英伟达的NeMoService等。从这个意义上来说,ChatGPT是人工智能尤其是生成式AI发展历史上的一座里程碑。 2.本报告的技术路线说明 课题组采用以下两条技术路线,构建中国各职业的大语言模型人工智能影响指数。 一是采用已有的指数,利用职业描述的相似性,在中国细分的职业层面进行直接的匹配。采用这一技术路线,主要是通过“中国职业名-美国职业名-美国职业对应的任务-美国职业对应的任务受到新技术的影响”路径,将中国的职业名与国外学者生成的指数进行匹配,课题组基于已有指数分别构建了“人工智能影响指数”(AIexposureIndex)以及“大语言模型影响指数”(LLMexposureIndex)。 二是直接根据各个职位对工作职责、技能要求的文字描述进行匹配。具体而言,课题组结合生成式人工智能技术,为2087个标准化的“详细工作任务(DWA)”1被大语言模型人工智能所影响的程度进行评分。其次,课题组通过数据匿名的方式,利用机器学习算法,将去除隐私信息后、脱敏的招聘岗位文本拆分并与2087个详细工作内容(DWA)建立对照。一个招聘岗位通常会对应若干个DWA,并在对照的过程为每一个DWA赋予权重。通过加权平均,每一个招聘岗位会获得一个大语言模型人工智影响程度评分。最后,课题组根据每一个职业下的众多招聘岗位,计算出该职业对应的大语言模型人工智能影响程度评分。本报告中将这一指数简称为“基于工作任务的大语言模型影响指数”(WorkActivity-basedLLMExposureIndex)。 通过将以上两条技术路线应用于智联招聘脱敏的招聘岗位数据,课题组分析了2018年 1月至2023年4月之间的招聘信息,构建了上述三个指数,刻画了随着人工智能技术的发展,中国职业岗位需求及其内涵的变化趋势。 二、人工智能对于工作的影响:毁灭还是创造? 当2022年11月OpenAI发布ChatGPT之后,短短半年多来,大语言模型已经达到了成熟运用自然语言与人类沟通的地步。ChatGPT对写作、修改润色、信息归纳、内容创意和编程能力的替代作用是惊人的。现在我们可以让ChatGPT根据指令生成流畅的稿件和实用的网站程序,让Midjourney生成精妙繁复的图像。这也意味着从业者所积累的相应技能的贬值速度大大提高了,而对应的工作也就更容易被替代。 1来自美国https://www.onetonline.org/网站。 1.白领工作和知识型工作更容易被大语言模型替代 根据智联招聘发布的各种职业的岗位需求对工作任务的描述,哪些职业更可能被以ChatGPT为代表的大语言模型人工智能技术进步所影响?按照课题组构建的“基于工作任务的大语言模型影响指数”(WorkActivity-basedLLMExposureIndex),图1展示了影响指数最高和最低的各20个职业。 影响指数最高的20个职业包括财务/审计/税务、翻译、银行、销售业务等,其“基于工作任务的大语言模型影响指数”(WorkActivity-basedLLMExposureIndex)分别为0.89、0.85、0.82、0.81,法律/法务/合规职业也位于影响指数前20榜单。这些职业多为白领工作,其共同特点在于工作任务包含较多的文本处理、资料收集整理等内容,而这些知识型的工作任务正是大语言模型人工智能的长项。 销售业务职业在其中名列前茅,值得特别说明。通常认为,销售需要众多“软技能”,并且需要直接与人打交道,因此不太受到人工智能等技术进步的影响。然而,考察实际发布的销售业务岗位的任务和技能需求可以发现,大多数销售业务岗位所提出的工作和技能要求的文字描述还是常规性质的任务,例如收集客户信息、电话联络客户、提供信息咨询等,因此在人工智能影响程度的计算中排名靠前。 影响指数最低的20个职业包括社区/居民/家政服务、技工/操作工、烹饪/料理/食品研发、交通运输服务、物流/仓储、医院/医疗/护理等,其“基于工作任务的大语言模型影响指数”(WorkActivity-basedLLMExposureIndex)分别为0.11、0.16、0.17、0.26、0.27、0.37。这些职业的共同特点在于,工作任务包含较多的体力劳动,并且需要在直接与人打交道的过程中提供服务。值得注意的是,尽管这些职业受到大语言人工智能的影响较小,但是其受到机器人等其他数字技术的影响较大。评估职业的可替代性和未来的发展前景,还需要结合不同技术的发展综合评判。 图1:基于工作任务的大语言模型影响指数最高和最低的20个职业 数据来源:智联招聘 2.过去五年人工智能技术替代人工的初步趋势已显现 课题组首先利用技术路线一,按照不同职业进行分类,对智联招聘在2018年1月到 2023年4月期间新发布的岗位需求信息进行分析,对这些新发布岗位的“人工智能影响指数”(AIexposureIndex)以及“大语言模型影响指数”(LLMexposureIndex)进行了计算,然后逐月进行了加权平均,计算出每个月新增岗位的影响指数。 如图2所示,过去五年中国新增职位的“人工智能影响指数”(AIexposureIndex)和“大语言模型影响指数”(LLMexposureIndex)均呈下降趋势,前者从2018年1月的0.7 下降至2023年4月的0.68,后者从2018年1月的0.85下降至2023年4月的0.252。 影响指数持续下降,并随时间呈加速下降态势,主要的下降发生在2021和2022年。这说明新增岗位逐渐集中于那些不容易被人工智能技术所替代的岗位。换句话说,那些比较容易 2报告中提及的3个指数,由于各指数构建过程采用不同技术路线,单个指数意义下不同职业指数值的相对序列,反映了不同职业对该种技术暴露程度的高低。但各指数之间的绝对值没有对比意义,且不可比。 被人工智能所替代的岗位正在逐渐消失。 图2:新发布岗位受到人工智能影响的变化趋势:2018.1-2023.4 数据来源:智联招聘 课题组随后利用技术路线二,对新发布岗位的“基于工作任务的大语言模型影响指数”(WorkActivity-basedLLMExposureIndex)进行了计算,并按月进行了加总统计。如图3所示,该指数也随时间下降,从2018年的0.6左右下降到2023年的0.4左右。两条技术路线的指数都呈现下降的趋势,说明了人工智能替代就业的趋势是稳健的。 大语言模型人工智能技术大规模流行不过是这半年多以来的事,为何会在此前几年就显现出对劳动力需求的影响?一个可能的原因在于,大语言模型人工智能技术与其他人工智能存在高度相关性,且最近的技术进步致使该相关性增强。因此,近年来劳动力需求变化一直处在人工智能技术的影响之下,而在大语言模型人工智能技术迅猛发展之后,其反应就愈加强烈。 图3:新发布岗位受到基于工作任务的大语言模型影响的变化趋势:2018.1-2023.4 数据来源:智联招聘 3.人工智能影响指数高的职业,过去五年发布职位数量减少 上一小节呈现了劳动力市场上新增的各种岗位整体上受到人工智能影响的趋势。本小节将在职业层面进一步说明这种趋势。 图4展示了职业层面的新发布岗位数量占比的变化率与“人工智能影响指数”(AIexposureIndex)以及“大语言模型影响指数”(LLMexposureIndex)两个指数之间的关系。图中每个圆圈代表一种职业,圆圈的大小代表了该职业招聘岗位数量的占比多少。拟合线显示出负向斜率,说明从不同职业类型的比较来看,受到人工智能影响越严重的职业,在过去五年新增岗位的增速越低,这从职业层面验证了上一小节得到的结论。 图4:各职业新发布岗位数量变化与受到人工智能影响的关系 数据来源:智联招聘 注:纵轴为2018-2023年间各职业新发布岗位数量占总岗位数量的比重的变化率(%),横轴度量了该职业的“人工智能影响指数”(AIexposureIndex)以及“大语言模型影响指数”(LLMexposureIndex) 图5展示了职业层面的新发布岗位数量占比的变化率与“基于工作任务的大语言模型 10 影响指数”(WorkActivity-basedLLMExposureIndex)之间的关系,负相关关系明显,说明过去五年中,不同职业新增岗位的增长率随大语言模型影响指数的增加而越少。其中,有两个职业处在分布图的极端位置,加强了这一负向关系,它们分别为大语言模型影响指数极低的“物流/仓储”和影响指数极高的“销售业务”。过去五年“物流/仓储”新发布岗位的需求人数占比扩大了约2成,而“销售业务”新发布岗位的需求人数占比减少了约2成,这说明大语言模型人工智能技术对物流工作有较强的互补作用,而对销售类工作具有明显的替代作用。 另外,财务/审计/税务、软件/互联网开发/系统集成等白领职业也显示出了岗位数量减少的趋势,这与第一小节呈现出的结论是一致的。 图5:各职业新发布岗位数