AI&DATASCIENCECOMPETITION WhitePaperof AI&DataScienceCompetition2022 人工智能与数据科学竞赛白皮书2022 洞察竞赛趋势,激发数据力量 WhitePaper ofAI&DataScienceCompetition2022 《人工智能与数据科学竞赛白皮书2022》 王沂帆刘邵星张琳艳周涛 DATA 洞察竞赛趋势,激发数据力量 FollowtheTendencyofCompetition UnleashthePowerwithinData S C IENCE 郭悦游丽金 -编委会成员- (以姓氏笔划为序) 付莉刘心田 张洋张敏文 杜宇健李锐梅 赵宇光钱岭 徐浩程梁加琦 潘军魏晓锋 WhitePaperofAI&DataScienceCompetition2022 CO目录NTE人工智能与数N据科学竞赛白皮书T2022S 01基本价值及相关政策 一、人工智能与数据科学竞赛概述08 二、人工智能与数据科学竞赛基本价值09 1.公共数据要素价值挖掘与应用探索09 2.赋能企业人才储备,完善云生态建设09 3.跨学科融合交流与高校人才培养10 02发展情况与趋势洞察 一、各类赛事差异化发展12 1.政府赛事聚焦公共事业与行业应用,数字孪生12 赋能智慧城市建设 2.企业赛事探索竞赛与社区深度融合,构建活跃14 用户生态 3.科研类赛事独立性减弱,尝试绑定政企赛事15 二、赛题趋势16 1.计算机视觉(CV)赛题是2022年最大热门16 2.工业类赛事聚焦应用落地17 人工智能与数据科学竞赛白皮书2022 WhitePaperofAI&DataScienceCompetition2022 03多种赛事主体 一、主办方19 1.政府20 2.企业22 3.科研机构24 二、赛事平台25 1.第三方独立平台25 2.企业自建平台27 三、参赛者28 1.参赛者身份特征28 2.参赛者诉求29 04赛事基本架构 一、方案设计35 1.赛事方案35 2.传播方案37 3.技术方案38 二、技术部署39 1.平台部署39 2.定制化开发41 三、赛事运营42 1.赛事招募42 2.选手运营42 人工智能与数据科学竞赛白皮书2022 WhitePaperofAI&DataScienceCompetition2022 3.专家运营42 4.活动运营43 5.社区运营43 四、赛事成果呈现44 1.线下赛事44 2.成果手册45 3.新闻通稿45 4.会议/论坛45 5.项目孵化46 05前景展望 一、平衡数字中国建设区域差异,赋能数字政府生态发展48 二、数字中国展开布局,数据要素相关竞赛或纳入考核指标50 三、成果落地案例涌现,价值转化路径逐渐清晰50 四、解决人才招聘痛点,利用考核操作过程的评分系统精准评估技能51 五、科研教学为微型赛事提供落地场景52 六、AIGC带来AI革命,NLP赛题将成为新一阶段热点53 七、仿真赛题贴进实际问题,强化学习实现最优解或成为热门赛题类型53 八、线上赛事青睐云端环境,线下赛事追求竞技感54 06年度赛事案例展示 一、政府赛事案例56 二、企业赛事案例59 三、科研机构赛事案例62 参考文献65 人工智能与数据科学竞赛白皮书2022 WhitePaperofAI&DataScienceCompetition2022 01 人工智能与数据科学竞赛 基本价值及相关政策 Value&RelevantPolicyofAI&DataScienceCompetition AI&DATASCIENCECOMPETITION 人工智能与数据科学竞赛白皮书2022 一、人工智能与数据科学竞赛概述 人工智能与数据科学竞赛是一种以竞赛为形式的数据应用模式,在短时间内聚集大量数字人才,通过合理的赛事设计促进人工智能应用开发和数据要素的价值挖掘。 人工智能与数据科学均以数据为基础,数据科学侧重依靠数据获得见解与理解力,人工智能侧重依靠数据产生应用,二者相互依赖、共同推动科技发展。在二十多年的竞赛实践中,人工智能赛事与数据科学赛事逐渐融合,同一赛事中兼具数据分析赛题与机器学习赛题成为常态,因此,我们将人工智能与数据科学同时作为竞赛研究的主题。 数据分析 业务方向 技术方向 人工智能 机器学习 深度学习 (方法) 简单问题简单分析 现实问题 复杂问题复杂分析 图1-1数据分析、人工智能与机器学习示意图 人工智能与数据科学竞赛作为一种创新业态,对内汇聚产学研用多方资源,对外影响、助力整个产业生态。在数据科学生态系统中,政府、企业、技术人才、竞赛机构形成了一个良性循环的子系统,创新系统内数据要素、人才要素流通机制,赋能数据科学产业发展。在近十年的探索中,人工智能与数据科学竞赛在国内形成了成熟可复用的模式,孕育了一批高度专业化的赛事运营机构。随着竞赛模式迭代,其主体适用性不断增强,政府、企业、科研机构、高校以及各类社会组织开始用人工智能与数据科学竞赛解决自身痛点难点问题,办赛规模持续扩大,并进入大众及主流媒体视野。 人民网在《数据科学竞赛:数据开放、精准招聘新抓手》中提到,“政府和企业持续高质量地开放数据要素、竞赛平台充分利用先进技术以确保数据要素安全是数据科学竞赛良性发展的重要保障。未来,数据科学竞赛将成为政府数据要素流通生态中活跃的一环,也将成为企业遴选人才与算法、资本发掘项目的利器。” 二、人工智能与数据科学竞赛基本价值 1.公共数据要素价值挖掘与应用探索 政府拥有海量人口、城市、税收、工业等社会关键数据,担负着激发社会公共数据要素潜在价值、引导社会经济良性发展、提升人民生活水平的重要责任。创新公共数据要素流通方式,激活数据要素潜能,探索公共数据要素应用方式是政府部门数字化建设工作的重要内容。 案例聚焦 山东省第三届数据应用创新创业大赛 主办方—山东省大数据局 山东省第三届数据应用创新创业大赛促进山东数据创新应用工作在场景、人才、算法、产品各个方面积累、沉淀了大量资源,可助推山东省围绕“协同创新,强省惠民”主题,打造更多优秀数据应用场景。值得一提的是,根据疫情防控需要,大赛增设“数据助力疫情精准防控”赛道,及时推动获奖作品在山东省推广应用,在疫情防控中积极发挥作用,引起了很好的社会反响。 2.赋能企业人才储备,完善云生态建设 随着大数据与数字化在社会经济中的作用日益提升,企业寻求数字化转型已经成为必然趋势。对于以数字化与大数据为立足之本的科技企业而言,对数据算法人才的争夺成为企业生存发展的根本。 企业举办人工智能与数据科学竞赛能够实现大量算法人才快速汇聚,并通过竞赛结果进行人才甄别与筛选,进而挖掘优秀人才,优化企业技术人才梯队,完善企业数据人才储备。 同时,各大科技企业在云生态建设领域投入巨大,致力于构建集算力、产品、服务与一体的全方位云生态。举办人工智能与数据科学竞赛首先能够展示企业的云计算基础以及产品功能,产生品牌效应,推动云产品营销。另一方面能够持续扩大用户规模,推动社区建设,鼓励用户持续输出内容与技术,不断完善云生态建设,提升市场竞争力。 案例聚焦 科大讯飞2022iFLYTEKA.I.开发者大赛 主办方—科大讯飞 科大讯飞2022iFLYTEKA.I.开发者大赛联合优质企业、知名高校、融投资机构等53家合作伙伴,围绕十大新兴产业开启108个赛道,分别设置了72道AI算法赛以及36道AI应用赛。A.I.开发者大赛与DataCastle数据城堡携手前进,积淀至今已举办第五届,致力于用人工智能解决各类生产生活问题,推动前沿科研成果转化、促进产业发展、发掘行业优秀人才,助力AI生态建设。 3.跨学科融合交流与高校人才培养 利用数据科学技术进行量化研究、大样本研究是目前学术界的主流研究方法之一,人工智能与数据科学竞赛能够有效促进数据科学人才与其他学科的融合交流。 案例聚焦 高校作为人才储量最大的单位,具备先天办赛优势。相对于政府、企业而言,高校办赛成本低,依靠天然人才池,可以获得较高办赛性价比。对于高校而言,数据科学成为未来的主流研究领域是大势所趋,而数据科学不能只停留在课堂上,必须通过实战进行学习训练,人工智能与数据科学竞赛为高校提供了一个良好的实训机会,让高校数据科学学科建设更加系统化,更加完整,同时可以提升学生数据科学应用能力,促进高校人才培养。 国家基因库2022年“猛犸杯”国际组学数据创新大赛 主办方—深圳国家基因库 深圳国家基因库、鹏城实验室、深圳华大生命科学研究院发起2022“猛犸杯”国际组学数据创新大赛,旨在为生命科学领域现有科研问题及挑战提供解决方案,引领生命科学大数据产业创新发展;同时为生命科学、医学、计算机科学等多领域的专业人才搭建跨领域、跨学科的技术交流平台,激励生命科学大数据人才的创新意识和综合技能,推进BT与IT融合(生物与信息融合)发展。 人工智能与数据科学竞赛白皮书2022 WhitePaperofAI&DataScienceCompetition2022 02 人工智能与数据科学竞赛 发展情况与趋势洞察 DevelopmentTendencyofAI&DataScienceCompetition AI&DATASCIENCECOMPETITION 一、各类赛事差异化发展 1.政府赛事聚焦公共事业与行业应用,数字孪生赋能智慧城市建设 1.1持续性赛事比例平稳增长,赛事品牌逐渐成型 经过统计2022年由政府部门主办64场赛事信息后,我们发现政府背景的人工智能与 数据科学竞赛呈现稳中求进的总体态势。 在2022年举办的64场政府赛事中,持续性赛事(非首届)数量为34场,占全年政府赛事总场次的53.1%,2020-2022年三年间持续性政府赛事比例增长平滑,说明政府赛事总体呈现稳定态势,持续办赛意愿较强。 29.4% 42.5% 53.1% 持续性政府赛事在全年政府赛事中的占比 2020年2021年2022年 图2-1政府主办的持续性赛事增长情况 主办方—数字中国建设峰会组委会 数字中国创新大赛由数字中国建设峰会组委会主办,关注数字中国和数字福建建设,汇聚大众创业万众创新的新方向、新观点和新思路,共同推动数字技术创新应用和数字产业发展。数字中国创新大赛采取多赛道并行的竞赛形式,围绕行业数字化与信息技术创新应用等设置多个并行赛道,连续多届采用“DCIC数字中国创新大赛”名称,已形成知名赛事品牌。 2022人工智能与数据科学竞赛白皮书12 此外,持续性赛事通常沿用同一赛事名称,如第一、二、三届山东省数据应用创新创业大赛,第一、二、三届数字四川创新大赛等,通过多年持续办赛,逐渐在人工智能与数据科学竞赛领域内扩大赛事影响力,形成以地域和名称为核心的赛事品牌。 案例聚焦 DCIC数字中国创新大赛 案例聚焦 主办方—四川省大数据中心 数字四川创新大赛由四川省大数据中心主办,迄今已连续举办三届,在参赛者群体中通常被简称为“四川大赛”,形成了与四川省深度绑定的赛事品牌。 数字四川创新大赛 1.2综合型赛事仍是主流 根据赛题范围,政府办赛可以分为两类:综合赛事与专项赛事。 综合赛事中赛题范围大,通常涵盖经济、民生、政务、管理等多个种类,如2022数字中国创新大赛分为数字党建赛道、数字城市设计赛道、数字医疗赛道、数字低碳赛道、区块链赛道、网络安全赛道等,是典型的综合型政府赛事。 专项赛事赛题范围小,通常集中于某个具体领域,如金融类赛事、政务类赛事、技术应用类赛事等,如广东省公安厅主办的智慧新警务大数据建模大赛,赛题集中在治安管理 +大数据的范畴内。 近年来数据科学赛事市场中专项赛事比例逐渐增加,但在政府办赛中,综合赛事仍是主流。在2022年的64场政府赛事中,综合型赛事共37场,占比57.9%。同时,在专项赛事中存在政府挂名,企业或高校主办的情况。综合来看,由政府机构主办的赛事以综合型赛事为主。 1.3数