1 研究背景 迅猛发展的⼈⼯智能成为今年两会备受关注的热议话题之⼀。3⽉5⽇,国务院总理李强在政府⼯作报告中提出,要⼤⼒推进现代化产业体系建设,加快发展新质⽣产⼒,同时,要深化⼤数据、⼈⼯智能等研发应⽤,开展“⼈⼯智能+”⾏动,打造具有国际竞争⼒的数字产业集群。 在这个过程中,⽣成式⼈⼯智能将成为产业创新的关键抓⼿之⼀,与实体经济的融合也将成为新质⽣产⼒发展的引擎。 作为新兴领域,⽣成式⼈⼯智能尚处于起步发展期,InfoQ研究中⼼发起了本次《中国⽣成式AI开发者洞察2024》的研发和撰写计划,希望以⽣成式AI开发者的⻆度为⾏业⼴⼤从业者、希望进⼊该⾏业的个⼈或机构,以及关注⽣成式AI领域的⼤众⼈群提供清晰的⾏业洞察,并解答以下问题: 当下⽣成式AI开发者是哪些⼈?从业需要具备什么技能?使⽤哪些⼯具?关注哪些领域的哪些应⽤? ⽣成式AI开发者具有哪些需求?⽣态⼯作者能够为⽣成式AI开发者提供什么样的帮助? 企业如何升级⽣成式AI建设?建设路线都有哪些? 1 研究⽅法说明 桌⾯研究 通过对⾏业公开信息进⾏桌⾯研究,资料包括但不限于专业机构研究报告、政府机构披露的数据和政策内容、⽣成式AI相关⽹站及专家公开演讲内容等; 专家访谈 2 InfoQ研究中⼼针对本次研究定向邀请了多位资深⽣成式AI开发者、应⽤领域企业的业务负责⼈、科技领域⾏业研究员等各⽅⾯专家; ⽤户调研 3 InfoQ研究中⼼针对本次研究需求在InfoQ技术社区、公众号、TGO等技术社区开展了相关⽤户调研,共回收920份有效样本,样本覆盖31个省级⾏政单位、受访⽣成式AI开发者来⾃近百座中国城市。 研究定义 ⽣成式AI开发者 ⼤众开发者 •在各个⾏业从事⽣成式AI技术研发⼯作,或利⽤AI⼯具进⾏⼯作,且具备专业技术能⼒的⼈员。这其中包含传统意义上的AI领域程序员⼈群,也包括借助AI来完成⼯作的数据分析、运营、市场、测试等⼈员,但后者需要具备专业开发能⼒。⽽不具备专业开发能⼒的数据分析、运营、市场、测试等⼈员,即使借助AI进⾏ ⽇常⼯作,也不属于本报告中的⽣成式AI开发者。⽣成式AI开发 者既包括在企业机构中任职的在职⼈员,也包括未在企业机构中⼊职的个⼈从业者和学⽣群体。 •各个⾏业正在或有意愿通过AI辅助⼯作的⼈员,或有意愿进⼊ ⽣成式AI领域⼯作的⼈员,或以娱乐为⽬的尝试通过AI进⾏内容⽣成的技术爱好者等各类关注⽣成式AI领域的⼈群,且不具备或具备很少量专业技术研发能⼒。⼤众开发者既包括在企业机构中任职的在职⼈员,也包括未在企业机构中⼊职的个⼈和学⽣群体,既包括以⼯作为⽬的也包括以兴趣或尝鲜为⽬的的关注⽣成式AI领域的⼈群。 核⼼结论 ⼀、⼈⼯智能产业规模快速增⻓,吸引了⼤量⼈才为其创新续航 2023年全球⼈⼯智能市场收⼊同⽐增⻓20.7%,中国成为⼈⼯智能发展最快的市场之⼀。在⽣成式⼈⼯智能⽅⾯,未来10年,⽣成式AI有望创造1.3万亿美元收⼊,占科技领域总⽀出的10%-12%,复合年增⻓率预计达到约42%; 国内来看,⽣成式⼈⼯智能逐渐进⼊政策红利期,政策覆盖了从基础设施布局到核⼼领域应⽤的多个层⾯,为企业引才聚智提供政策保障。但由于⾏业发展较新,⽣成式AI领域存在专业⼈才⽋缺问题,就业市场对⾼学历毕业⽣的需求量出现⼤幅增⻓,同时也成为对应届⽣最具有吸引⼒的⾏业之⼀。 ⼆、⽣成式AI开发者特征 •⽣成式AI开发者画像解读 作为新兴⾏业从业者,⽣成式AI开发者普遍相关⼯作年限较短,但属于⾼薪⼈群,⽬前⼈均年收⼊为36.7万,50万以上年薪占⽐⾼达25.3%,北京⽣成式AI开发者规模最⼤,但上海⼈均薪资更⾼; 算法⼯程师、产品经理是⽬前市场最为紧缺的⼈才类型,⼤模型研发和业务复合型能⼒是市场核⼼竞争⼒。 •⽣成式AI开发者⼯作特征 近6成⽣成式AI开发者研发⽅向超过2个,应⽤⼯具、⼤语⾔模型、数据科学/数据挖掘/数据分析、语⾔/语义理解类应⽤和图像识别类应⽤是最主要的五个 ⽣成式AI开发者研发⽅向; 核⼼结论 GPT、⽂⼼、通义⼤模型是⽣成式AI开发者使⽤率最⾼的⼤模型,⽣成式AI开发者或企业对⼤模型的要求不仅是实现通⽤功能,还需要能够在特定领域、特定场景具备应⽤价值,真正解决业务痛点; 在⼯具使⽤⽅⾯,代码⽣成⼯具和ChatBot使⽤率最⾼,智能化办公⼯具使⽤时间最⻓。⽣成式AI开发者⼈均使⽤AI辅助编程⼯具已花费328.8元,使 ⽤GitHubCopilot⼈群⽐例最⾼,但对Cursor的付费⽔平最⾼。⼯具链、落地实践和技术课程⽅⾯的⽀持最受⽣成式AI开发者⻘睐。 三、⽣成式AI研发团队洞察 •企业⽣成式AI开发团队 ⽣成式AI开发者所在⾏业较为集中,由于应⽤尚处于起步期,较少⽣成式AI开发者就职于应⽤领域企业,中⼩企业占据半壁江⼭,20⼈以下⼩规模团队成为“标配”; “懂场景”、“懂模型”、“懂开发”是团队⼈才三要素,年轻、有顶尖名校背景、具备世界知名科技企业或机构核⼼业务⼯作经验的技术⼈才成为团队中坚⼒量。在领导者选择⽅⾯,由于⾏业对资⾦投⼊⼒度和技术能⼒要求⾼,领导者需要具备相关领域深厚的技术实⼒以及科技巨头企业领导层经验。 •企业⽣成式AI研发基础设施 多数企业使⽤云服务或部分⾃建算⼒设施。采买或调⽤商业⼤模型和基于开源构建专属⼤模型是主流⽅式,⼤型应⽤侧企业更偏好基于开源构建⾃⼰的专属⼤模型。近三成企业⽋缺⽣成式AI⼯具使⽤导向,基础设施存在较多问题,主要体现在GPU资源紧张、数据存在合规⻛险、缺乏业务场景、⼈才少企业重视不⾜等⽅⾯。 核⼼结论 •企业⽣成式AI研发实践 ⽣成式AI的⾏业应⽤正在全⾯铺开,重塑⼯作⽅式并提升效率是最主要的AI实践⽬的。因此,⽣成式AI开发者最为注重办公场景的应⽤。但⽬前来看,企业赋能⽔平仍有较⼤空间,⽣成式AI开发者企业普遍处于基础探索期,主要赋能情况为单节点业务合作。但由于部分企业⽣成式AI开发者指数较⾼,整体升级速度会较快,企业正在努⼒迈向复杂应⽤期。 四、⽣成式AI开发者发展预测 在晋升⽅⾯,⽣成式AI开发者中的初⼊者未来具有4条进阶路线成为⾏业资深⼈⼠;在技能⽅⾯,⽣成式AI开发者未来希望通过获取权威认证提升就业竞争⼒; 在产品⽅⾯,⽣成式AI开发者购买相关产品的付费意愿强烈,并且产品收⼊规模已呈现持续扩⼤趋势,市场潜⼒巨⼤; 在就职⽅⾯,⽣成式AI开发者未来将逐渐从供应侧企业向应⽤侧企业迁移; 全⺠开发时代即将到来,⽣成式AI开发者画像将继续拓展,复合型⼈才成为⼤众开发者进阶⽬标。 8 CONTENT ⽬录 01⽣成式AI开发者研究背景 02⽣成式AI开发者特征 03⽣成式AI研发团队洞察 04⽣成式AI开发者发展预测 ⽣成式AI开发者研究背景 10 ⼈⼯智能产业规模快速增⻓,为⼈才市场带来新机遇 信通院指出,2023年全球⼈⼯智能市场收⼊预计达5132亿美元,同⽐增⻓20.7%。截⾄2023年三季度,全球⼈⼯智能企业达到29,542家,中国企业数量仅低于美国,占全球总数的15%; 彭博⾏业研究数据显示,随着企业改变经营⽅式并对产品和服务进⾏强化,未来10年,⽣成式AI有望在硬件、软件、服务、⼴告、游戏等众多领域创造1.3万亿美元收⼊,占科技领域总⽀出的10%-12%,复合年增⻓率预计达到约42%。 全球AI企业数量国家分布 ⽣成式AI全球收⼊及花费占⽐趋势 生成式AI全球收入(单位:10亿美元)生成式AI占科技领域支出 1304 日本,2% 新加坡,2% 法国,2% 以色列,3% 德国,3% 加拿大,4% 其他,25% 美国,33% 1079 897 728 548 11% 12% 中国,15% 399 304 9% 10% 137 217 6% 7% 14 23 40 67 3% 4% 5% 印度,5%英国,6% 2020年2021年2022年2023年2024年2025年2026年2027年2028年2029年2030年2031年2032年 数据来源:中国信息通信研究院、IDC、彭博⾏业研究预测(基于IDC、eMarketer、Statista数据) https://www.infoq.cn 政策指引⽣成式⼈⼯智能应⽤创新,⿎励企业汇聚⼈才 ⽣成式⼈⼯智能逐渐进⼊政策红利期,从完善基础设施布局到核⼼领域应⽤,政策密集出台,多部⻔协同发⼒,以组合拳促发展。 时间 政策 发布主要部⻔ 内容 2023年2⽉2023年4⽉2023年4⽉ 2023年7⽉ 2023年9⽉ 2023年12⽉2023年12⽉ 《数字中国建设整体布局规划》 国务院 系统优化算⼒基础设施布局,促进东⻄部算⼒⾼效互补和协同联动,引导通⽤数据中⼼、超算中 ⼼、智能计算中⼼、边缘数据中⼼等合理梯次布局; 统筹布局⼀批数字领域学科专业点,培养创新型、应⽤型、复合型⼈才。 《⽣成式⼈⼯智能服务管理办法(征求意⻅稿)》 国家互联⽹信息办公室 ⾸次明确了⽣成式⼈⼯智能“提供者”内容⽣产、数据保护、隐私安全等⽅⾯的法定责任及法律依据,确⽴了⼈⼯智能产品的安全评估规定及管理办法。 《关于推进IPv6技术演进和应⽤创新发展的实施意⻅》 工业和信息化部等 推动IPv6与5G、⼈⼯智能、云计算等技术的融合创新,⽀持企业加快应⽤感知⽹络、新型IPv6测量等“IPv6+”创新技术在各类⽹络环境和业务场景中的应⽤; 培养IPv6创新⼈才,丰富⼈才挖掘和选拔渠道,强化复合型领军⼈才培养。 《⽣成式⼈⼯智能服务管理暂⾏办法》 国家互联⽹信息办公室等 促进⽣成式⼈⼯智能健康发展和规范应⽤,采取有效措施⿎励⽣成式⼈⼯智能创新发展,对⽣成式⼈⼯智能服务实⾏包容审慎和分类分级监管。 《关于实施专精特新中⼩企业就业创业扬帆计划的通知》 ⼯业和信息化部等 按照国家有关规定,动态调整职称专业设置,根据当地产业发展和专精特新中⼩企业需要,增设 ⼈⼯智能、⼤数据、⼯业互联⽹等新专业。 《关于加快推进视听电⼦产业⾼质量发展的指导意⻅》 ⼯业和信息化部等 ⽀持⻣⼲企业做⼤做强,⽀持⼈⼯智能企业研发视听应⽤⼤模型。 《“数据要素x”三年⾏动计划(2024-2026年)》 国家数据局 以科学数据⽀持⼤模型开发,建设⾼质量语料库和基础科学数据集,⽀持开展通过⼈⼯智能⼤模型和垂直领域⼈⼯智能⼤模型训练。 11 12 ⾏业的蓬勃发展吸引了⼤量⼈才为其创新续航 ⽣成式AI的蓬勃发展产⽣了⼤量⼈才需求,在2023届应届⽣投递⼈数增⻓最多的TOP10赛道中,⽣成式AI和AI⼤模型分别排名第⼆和第三,其中⽣成式AI增⻓率⼤幅超越其他赛道。AI⼤模型、⽣成式AI、芯⽚对硕博应届⽣的需求增⻓可观,其中AI⼤模型对博⼠⽣的招聘需求更是增⻓了430.0%。 2023届硕⼠应届⽣需求同⽐增⻓最多的新赛道TOP10 2023届博⼠应届⽣需求同⽐增⻓最多的新赛道TOP10 新能源汽车 新材料新能源AI大模型 AIGC 芯片绿色低碳大数据生物技术 智能制造 151.1% 127.8% 102.9% 98.6% 93.9% 58.6% 56.2% 55.0% 26.1% 19.3% AI大模型 智能制造新能源 对话机器人 芯片人工智能绿色低碳航空航天新材料 生物技术 430.0% 290.3% 235.2% 220.0% 209.1% 112.5% 94.1% 92.1% 77.3% 47.8% 303.1% 2023届应届⽣投递⼈数同⽐增⻓最多的新赛道TOP10 297.3% 235.3% 221.6% 157.5%150.2% 147.2% 137.6% 131% 13% 2.7 7. 智能制造 AIGC AI大模型 新材料 新能源 生物技术 航空航天 对话机器人 芯片 绿色低碳 成为对应届⽣最具有吸引⼒的⾏业之⼀吸引⼤量⾼学历⼈才进⼊⾏业 数据来源:猎聘⼤数据https://www.infoq.cn ⽣成式AI开发者特征 ⽣成式AI开发者