四川省 BigDataTalentDevelopmentofSichuanProvince 大数据人才发展蓝皮书 (样书) 成都市高新区天府一街535号两江国际A座邮编:610095 www.scdsjzx.cn Copyright四川省大数据中心保留一切权利 免责声明:虽然四川省大数据中心试图在本资料中提供准确的信息,但不保证本资料的内容不含有技术性误差或印刷性错误, 为此四川省大数据中心对本资料中信息的准确性不承担任何责任。四川省大数据中心保留在没有任何通知或提示的情况下对本资料的内容进行修改的权利。 四川省大数据中心 SichuanProvincialBigDataCenter 主编 顾红松 副主编 赵启斌 编写组 刘锋涛黄海果张千明 周涛 程奕秦强子刘羽佳 陈雷魏欣蕊张洋 吴凤 李信保佩汝 骆娜张琳艳程勋 赵宇光韩世蛟钱帝宇 编写单位 四川省大数据中心 成都大数据产业技术研究院有限公司成都数聚城堡科技有限公司 四川省大数据发展研究会 遂宁市政务服务和大数据管理局遂宁数字经济研究院 序言 发展大数据的关键是数据,比数据更关键的是人才。大数据产业是一个“T型产业”,既包括基础性、通用性的技术,例如数据库、分布式系统架构、高性能计算,也包括垂直行业的应用技术,比如医疗健康大数据、教育大数据、工业大数据、金融大数据、数字政府建设等等。很多看起来具有通用性的大数据技术,例如数据采集、数据治理和数据挖掘,事实上也是因行业不同而不同的,比如擅长医疗数据治理的同志可能完全不知道怎么处理工业生产数据,擅长分析医疗影像数据的同志可能对于工业生产中电流和振动的时间序列数据并不熟悉。在相当长一段时间里,脱离行业谈数据挖掘和人工智能的普适算法是幼稚的。 大数据产业的特点导致了大数据人才具有和其他类别人才极为不同的特性。第一,大数据人才层次跨度极大。大数据产业发展既对从事数据标注和数据运维等基础性工作人才有持续的巨大需求,又需要能够建设数据中台、搭建区块链底层系统、编写人工智能算法、开发前端探测设备、设计智能硬件和芯片的高级专家。第二,大数据人才学科背景多样。大数据人才既包括拥有算法设计、程序编写、数据分析等专业技能的核心人才,又包括拥有某些行业背景且具备一定大数据专业技术技能的复合型人才。前者大部分来自于计算机或相近学科方向,后者则学科背景极为多样。第三,大数据人才职岗分布广泛。大数据人才除从事技术类岗位外,很多还从事管理岗位,以及售前与解决方案岗位等。在四川省大数据与人工智能专业职称的六个专业方向中,专门设有“数字化管理”方向。这样的人才特征,不同于传统分析中专业细分更高的人才,例如育婴员、老年护理人员、汽车维修人员等等。了解大数据人才供需现状,发现大数据人才发展的机会和瓶颈,提出有利于人才发展的建议,制定相应的人才发展政策,都是有相当困难的挑战。本蓝皮书正是希望用大数据的方法绘制大数据人才发展的全景图,通过大数据人才发展指数,揭示和对比各地大数据人才发展的需求和优势,从而能够帮助地方政府定量化地评价当前人才发展现状和有针对性地制定高效的人才政策。 对于大数据人才的引进和培养,我有一些具体的建议。一是要根据不同层次的人才设计有针对性的人才引培计划。根据大数据人才的第一个特征—大数据人才层次跨度极大,必须建立覆盖基础人才、中端人才、高端人才和领军人才的梯度人才引培计划。不同层次的人才有不同类型的需求,譬如高端人才和领军人才主要关注医疗保障、子女就学、个人所得税等问题;基础人才和中端人才会关注落户条件、购房资格、租住补贴、职前职中培训等问题。人才引培计划一定要抓住人才的核心诉求,还要协调各方资源争取满足这些需求,比如落地德阳、眉山和资阳的领军人才要的可能是成都的医疗和教育资源,地方政府要怎么谈,拿什么去换,都是需要解决的问题。二是要在人才引培计划中加大管理人才的比例。目前从国家到地方的人才计划,都倾向于支持科学技术类人才,但是大数据技术和产业结合非常紧密,一项先进技术能否发挥产业价值很大程度上取决于企业的管理团队。因此, 除技术类人才外,还应设立大数据管理类人才专项,将一批预期将对地方大数据产业发展做出重要贡献的金融、法务、人力资源管理、运营管理等高端人才纳入到人才引培计划中。成都市的大数据领军人才计划每年大约有50%-70%入选的领军人才是管理类人才,这值得各地政府借鉴。三是给予产业创新主体在人才引培计划中更大的自主权。政府可以给达到一定条件(例如IPO企业,年利税达到一定水平的企业,年新增发明专利数达到一定水平的企业等)的大数据企业特别的名额,允许其自行评定人才计划入选者,政府在符合基本条件的情况下以企业评定结果为准。这样对企业而言,既是荣誉也是实惠,可以充分调动发挥大数据企业作为创新主体的能动性。四是持续支持相关的学科建设和学历教育。要鼓励地方高校积极申报“数据科学与大数据技术”学位点。加大资金投入,支持围绕大数据、云计算、人工智能、区块链、5G通信、集成电路等直接和间接相关先进技术的学科建设和学历教育。通过新建、共建和改建等方式,建设一批围绕大数据产业发展需求的职业技术学校。四川省在大数据技术相关的职业技术教育方面是全国领先的,接下来还需要巩固这方面的优势。五是要加大力度支持大数据行业的职业培训。首先要建设一批大数据方向的教育培训基地,让企业和院校联合运营,针对大数据产业发展亟需的岗位,开展系统化的职业教育和职前培训。其次要针对相关公务员和企业家中高管,开展大数据产业发展理念和方法的高端培训。 感谢四川省大数据中心、成都大数据产业技术研究院有限公司、成都数聚城堡科技有限公司、四川省大数据发展研究会、遂宁市政务服务和大数据管理局、遂宁数字经济研究院组织人员设计和编写这本蓝皮书。希望这本蓝皮书能够让各位读者进一步坚定“以人才赋能产业”的信念,并通过蓝皮书的数据和信息找到适合本地政府或者本单位大数据人才引培的策略,这就是对蓝皮书组织和编写单位最好的感谢了。 以为序! 周涛 2022年11月21日 目录 01概述篇 04培育篇 一、专业设置46 二、高校数量48 三、综合实力50 一、蓝皮书撰写背景二、研究方法简介三、大数据人才定义 02指数篇 一、指标体系二、结果分析 (一)总体情况 (二)指标分析 03环境篇 一、政府侧 (一)产业扶持 (二)人才扶持 二、社会侧 (一)搜索词频 (二)社区热度 (三)竞赛活动 02四、培养模式51 03五、科研中心54 03 05发展篇 一、产业发展60 06(一)四川省大数据企业规模60 09(二)四川省大数据企业数量61 09(三)四川省大数据产业园区62 10(四)四川省大数据行业应用65 二、人才需求67 (一)四川省大数据人才招聘情况67 14(二)四川省大数据人才薪资分布68 14(三)四川省大数据人才学历分布70 27(四)大数据专业毕业生就业情况71 3406展望篇 34 38一、现状和趋势74 41二、发展建议75 概述篇 01概述篇 一、蓝皮书撰写背景 当今世界,大数据、云计算、人工智能、区块链等现代信息技术迅猛发展,数字化生产力正在引领世界经济发展。世界各发达经济体普遍将大数据产业作为经济社会发展的重点。 2014年我国首次将大数据写入政府工作报告;2017年推动实施国家大数据战略,发布大数据产业“十三五”发展规划;“十四五”期间,数据的地位被提升到与资本、土地、人力、技术并列的第五类生产要素,如何培育数据要素市场,释放数据要素价值成为国家层面关注的重要命题。从2017年到2021年,我国数据产量从2.3ZB增加到6.6ZB,位居世界第二,全国省级公共数据开放平台有效数据集增加至25万个,大数据产业规模从4700亿元增加到1.3万亿元。 蓝皮书撰写背景研究方法简介 大数据人才定义 中国共产党第二十次全国代表大会就加快建设数字中国作出了重要部署。习近平总书记强调,要站在统筹中华民族伟大复兴战略全局和世界百年未有之大变局的高度,充分发挥海量数据和丰富应用场景优势,促进数字技术和实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,不断做强做优做大我国数字经济。要加快数字化发展,打造数字经济新优势,协同推进数字产业化和产业数字化转型,加快数字社会建设步伐,提高数字政府建设水平,营造良好数字生态,建设数字中国。 四川紧跟国家战略,大力推动数字经济、数字政府建设。2025年四川省数字经济总量预期将超3万亿元,占GDP比重预期将达到43%。2025年四川省数字政府建设整体水平预期将迈入全国先进行列,全面建成协同高效、治理精准、决策科学、人民满意的数字政府,开启数据驱动政务服务和政务运行新模式。 经济发展和国家建设的第一资源是人才,大数据相关领域人才是建设数字中国、发展数字经济的核心资源。为掌握四川省大数据人才基本情况,探究省内大数据人才发展趋势,并就进一步推动四川省大数据人才发展提出切实建议,四川省大数据中心组织编写《四川省大数据人才发展蓝皮书》。 二、研究方法简介 01文献调研 本报告采用的研究方法之一为文献调研法。以“大数据”“大数据人才”“数字化”“数智化”“数字经济”“数字政府”等为关键词,对论文、行业报告、政策文件等相关文献资料进行深入研究,掌握大数据产业及人才发展基本情况,为报告撰写提供科学参考。 02田野调查 通过针对相关政府机构、企事业单位、高校科研院所和代表性企业家、学者的直接调查,获得原始的数据。例如,将拟调查的信息项进行整理,以书面形式向各市(州)主管部门(如各地大数据局)和各地有代表性的大数据企业(如成都市人民政府评选的大数据领军企业)提出信息征求,以获得四川省大数据产业及人才概况的第一手资料。 03统计分析 针对难以获取直接调查数据的情况,通过Python等编程语言,从公开的API接口 (OpenAPI)获取数据并通过自然语言处理和数据挖掘方法,提取人才相关的数据,如人才数量、人才薪资、人才学历、职称评审等。通过回归模型、因果图模型或其他方法,探索这些维度特征与人才发展的相关性及因果关系等。 三、大数据人才定义 大数据人才作为大数据产业发展的重要支撑,其界定与大数据产业概念密切相关,但目前对“大数据人才”并未有清晰明朗的统一定义,不同领域对其定义各有差异。 从学术角度看,以李秀丽[李秀丽,我国大数据人才培养现状及思考[J].《凯里学院学报》,2019,037(006):74-77.]等人为代表的学者从大数据人才所必备的能力角度出发,认为具备计算机编程能力、处理实际数据的分析能力以及利用大数据解决实际问题能力的人才即可称为大数据人才。 从行业角度看,赛迪研究院[赛迪咨询:《2019中国大数据产业发展白皮书》]从技能角度将大数据人才分为核心人才和复合型人才。核心人才主要包括拥有算法设计、程序编写、数据分析等专业技能的人才,复合型人才则是指既拥有某些行业背景又具备一定大数据专业技术技能的人才。 从政府角度看,人力资源社会保障部、工业和信息化部于2021年3月联合颁布的《大数据工程技术人员国家职业技术技能标准(2021年版)》中将大数据人才定义为“大数据工程技术人员”,是指从事大数据采集、清洗、分析、治理、挖掘等技术研究,并加以利用、管理、维护和服务的工程技术人员。主要职责为研究和开发大数据采集、清洗、存储及管理、分析及挖掘、展现及应用等有关技术,研究、应用大数据平台体系架构、技术和标准,设计、开发、集成、测试大数据软硬件系统,进行大数据采集、清洗、建模与分析,管理、维护并保障大数据系统稳定运行,监控、管理和保障大数据安全,提供大数据的技术咨询和技术服务等。具体分类如图1-1所示。 0-2年 一般人才 数据库开发工程师大数据可视化工程师大数据测试工程师大数据集成工程师 报表开发工程师 大数据分析师 大数据挖掘工程师大数据爬虫工程师大数据ETL工程师大数据开发