您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [毕马威]:毕马威-人工智能全域变革图景展望:跃迁点来临(2023) - 发现报告

毕马威-人工智能全域变革图景展望:跃迁点来临(2023)

信息技术 2023-12-04 - 毕马威 张钊
报告封面

2023年12月 人工智能技术的飞速发展给人类社会的生产层、技术层的企业。人工智能基础层包含数生活方式带来重大变革影响。人工智能应用据、算力、算法三驾马车,代表性企业有英场景日渐丰富,AI技术在金融、医疗、制造、伟达、百度、地平线机器人等。人工智能技交通、教育、安防等多个领域实现技术落地。术层主要包含计算机视觉与模式识别、自然人工智能的广泛应用及商业化,加快推动了语言处理、类脑算法、语音技术、人机交互企业数字化转型、产业链结构重塑优化以及五类,代表性企业有OpenAI、旷视科技、智生产效率的提升。谱华章等。人工智能应用层包含所有AI技术 与传统应用结合形成的产业种类(图1)。 人工智能产业链划分为基础层、技术层、应用层,本篇报告定义人工智能核心层为基础层和技术层,人工智能核心企业为处于基础 图1:人工智能产业图谱 本报告从人工智能产业的全球情况和中国情况出发,分析人工智能产业发展现状,并结合市场观察提出了人工智能产业的十大趋势,深度剖析了各个趋势的发展情况与核心驱动力(图2)。 一全球人工智能企业格局 全球人工智能企业3.6万家,中美企业数量名列前茅 全球人工智能企业数量由爆发式增长转入稳(图3),尤其是2017年新增注册企业数量达步增长区间。截至2023年6月底,全球人工智到顶峰(3,714家)。2019年开始,人工智能能企业共计3.6万家。人工智能企业数量逐年新增注册企业数量有所下降,2022年当年新增长,2016年-2019年全球人工智能企业爆发增注册企业数量与2013年基本持平。 式增长,每年新增注册企业数量超3,000家 图3:2013年-2022年全球当年新增AI注册企业数量 美国人工智能企业数量位居全球首位,中国紧随其后,英国位居全球第三。美国人工智能企业数量约1.3万家 , 在全球占比达到33.6%,中国占比为16.0%,英国为6.6%,以上三个国家的人工智能企业数量合计占到全球的56.2%(图4)。亚洲的印度、日本、韩国,北美的加拿大,欧洲的德国、法国等国家也具有较好的基础,位居第二梯队。 图4:全球人工智能企业主要分布国家 中关村产业研究院数据库 中美在全球人工智能独角兽中平分秋色 截至2023年6月底,全球人工智能领域独角兽家,占全球总数的37%。以色列、英国、加总数达291家,分布在20个国家。如图5所示,拿大分别位列全球第三、第四、第五位。 来自美国的独角兽企业有131家,占全球总数的 45% ; 来自中国的独角兽企业有 108 图5:全球人工智能独角兽企业按国家分布情况 据中关村产业研究院数据统计,数据统计截至2023年6月30日 二全球人工智能产业生态 人工智能领域全球风投热度持续提升 人工智能领域企业融资占全球风险投资比重不过,全球人工智能企业风险投资案例数和逐年提升。受宏观政策变化等因素影响,全融资金额占全球风险投资比重逐年提升 ,球人工智能企业风险投资放缓,2022年投资2023年上半年全球人工智能企业获得风险投案例2,956起 , 披露投资金额458亿美元 ;资占全球风险投资总额比重达18.9%,创近2023年上半年风险投资案例下降,披露投资金年新高。 额246亿美元,较上年同期下降14.6%(图6)。 图6:2018年-2023年上半年全球人工智能企业融资及占比情况 人工智能全域变革图景展望:跃迁点来临(2023)人工智能全域变革图景展望:跃迁点来临(2023)人工智能全域变革图景展望:跃迁点来临(2023) 美国仍是人工智能领域风险投资重要聚集地。从国家分布来看,美国人工智能企业吸引风险投资最多,风险投资金额占全球比重近六成,其次是中国,占比达12%(图7)。 图7:2022年全球主要国家人工智能企业融资规模占比 具体来看,在2022年全球AI领域投融资最多能驾驶公司地平线机器人和芯片及半导体公的前十大案例中(表1),50%的案例发生在司粤芯半导体。此外,也有来自印度、新加美国,涉及游戏、航天航空、安防、云原生坡和荷兰的企业进入榜单。 和可再生能源等; 中国上榜企业分别是智 表1:2022 年全球AI领域融资金额Top10 图8:全球拥有Top100人工智能核心层相关专业的学校数量分布 中美城市人工智能创新实力领先 图10:《全球人工智能最具创新力城市》Top100按国家分布情况 人工智能企业地域分布较为集中 人工智能企业主要集聚于北京、广东、上海、北京、上海、广东独角兽数量位居前三。中浙江等地。从地域来看,我国人工智能企业国人工智能独角兽企业数108家,其中,北主要集中在北京市、上海市、广东省、浙江京市有41家,位居全国首位。上海市和广东省,形成京津冀、长三角、粤港澳三足鼎立省位列二、三,分别拥有人工智能独角兽企的格局(图12),其中北京市人工智能企业业24家和23家(图13)。 数量1,600余家。 图12:中国主要省市人工智能企业分布情况 二中国人工智能产业生态 中国人工智能股权投资阶段后移特征明显,细分领域走势分化 图14:近十年中国人工智能领域股权投资情况 从细分领域来看,算力、数据平台、自然语言处理、计算机视觉与图像四个细分领域风险投资增速明显加快;机器学习、深度学习等领域风险投资趋缓(图16)。 图16:“三驾马车”各细分领域投资事件和投资额情况 人工智能技术已广泛渗透到社会各个领域,生活服务、智慧医疗、智能制造、智能汽车、物流仓储投资事件较多,占人工智能全部投资事件的75.7%(图17)。 图17:AI应用领域投资事件和投资额情况 人工智能全域变革图景展望:跃迁点来临(2023)人工智能全域变革图景展望:跃迁点来临(2023)人工智能全域变革图景展望:跃迁点来临(2023) 人工智能地域集聚趋势明显,北京有领先优股权投资案例数量和金额均在全国遥遥领先,势。从地域分布来看,人工智能领域风险投其中投资金额是上海市的4倍有余,是广东省资主要集中在北京市、上海市、广东省、浙的近7倍(图18)。 江省和江苏省等五省市。具体来看,北京市 图18:近十年人工智能领域股权投资地域分布Top10 中国技术层学科实力全球相对优势明显 中国人工智能领域高校及科研院所数量位居全球第二,其中,技术层专业(如:计算机视觉、自然语言处理等)实力优势明显。选取基础层、技术层、应用层每层专业课程实力排名前 10 的中国高校院所 , 观察中国Top10在国际院校排名情况,可以看出,我国技术层前十的高校集聚在全球排名前30,但在基础层和应用层排名前十的高校,仅入选全球百强(图19)。 图19:中国人工智能领域科研院所在世界Top100分布情况 中国顶尖AI人才数量稳步增长,但产业技术人才缺口仍巨大 2023年,中国入选Aminer“全球2000位最具以北京为例,北京AI产业位居全国第一,但影响力的人工智能学者榜单”的人数达277人产业人才仍有较大缺口。根据中关村产业研(图20),相较美国仍有较大差距,存在顶究院测算,到2025年,预计北京AI人才需求尖人才少、复合型人才缺失、人才供给不均量约为54万人,缺口将达37万人(其中核心衡等问题。产业技术人才16 万,复合型AI技能人才21 图20:2019-2023年中国顶级AI人才数量及占全球比重 我国急缺计算理论、人机交互、安全与隐私、计算理论领域我国无人入选;在安全与隐私、计算机系统等方向的顶尖学者。从人才所属计算机系统领域,仅有1人次入选;在机器人、领域来看,入选的顶尖人才主要集中在多媒知识工程子领域,只有2人次入选(图21)。 体 、 芯片 、物联网等领域, 在人机交互 、 图21:2023年最具全球影响力的中国人工智能学者按细分领域分布 中国人工智能区域创新集聚效应初显 北京、上海人工智能创新实力位居全国前列。浙江省泛人工智能企业主要集中在环杭州湾 人工智能全域变革图景展望:跃迁点来临(2023) 大模型爆发以来,人工智能技术发展日新月异,创新成果纷纷涌现,基于对国内外主流科技公司最新布局、科研论文最新热点等的梳理,结合产学研各界专家研讨意见,本章从技术变革、应用创新、安全治理、生态协同四大维度总结出人工智能产业发展十大趋势,希望为有志于投身人工智能领域的企业和个人提供有益参考。 一技术变革 ChatGPT引发的大模型创新热浪仍在涌动,有可能演变成一场比工业革命、信息革命更为深刻的人工智能革命。这一时代背景下,无论是推动大模型从单模态发展到多模态,还是倡导高质量数据和计算新范式,实际都在强调人工智能技术变革的本质——算法、数据、算力三大基础要素的精巧配合和相互促进。 多模态预训练大模型将是人工智能产业的标配 图22:大模型技术迭代历程 案例1:国产大模型从三模态走向全模态 自2019年起,中科院自动化研究所以“图-音-文”多模态技术为核心,确立了多模态大模型布局,从其两代大模型迭代中,可以窥见国产大模型的多模态发展趋势。 2021年,中国科学院自动化研究所与武汉东湖高新区共同打千亿参数规模的三模态大模型“紫东太初”,该大模型打通了语音、图像、文字三种模态数据,可以自动学习跨模态数据之间的关系,通过自监督学习和知识嵌入来解决小数据泛化和理解问题,形成了完整且智能的表示、推理和生成能力。 2023年,中国科学院自动化研究所和武汉人工智能研究院推出新一代大模型:全模态大模型“紫东.太初2.0”版本,在文本、图像、语音三模态的基础上,融入 3D 点云、视频、信号等更多模态数据,能支持多轮问答、文本创作、图像生成、3D 理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力。 高质量数据愈发稀缺将倒逼数据智能飞跃 围绕AI大模型的商业化竞争不断加剧,作为模型训练“原料”的数据(尤其是高质量数据 ) , 正迎来短缺危机 。 根据一项来自Epoch Al Research团队的研究,高质量的语言数据存量将在2026年耗尽,低质量的语言数据和图像数据的存量则分别在2030年至2050年、2030年至2060年枯竭。这意味着,如果没有新增数据源或是数据利用效率未能显著提升,那么2030年以后,AI大模型的发展速度将明显放缓。 数据智能指的是从数据中提炼、发掘、获取有揭示性和可操作性的信息,从而为人们在基于数据制定决策或执行任务时提供有效的智能支持。数据智能融合了数据处理、数据挖掘、机器学习、人机交互、可视化等多种底层技术,可划分为数据平台技术、数据整理技术、数据分析技术、数据交互技术、数据可视化技术等部分。 大模型的训练需要大量的高质量数据,但是目前在数据质量方面还存在一定的问题,包括数据噪声、数据缺失、数据不平衡等问题,均会影响大模型的训练效果和准确性。预计大模型领域不断迸发的高质量数据需求,将倒逼数据在大规模、多模态、高质量三大维度上的全面提升,数据智能相关技术有望迎来跨越式发展。 Pablo Villalobos et al, Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning,Oct 26, 2022, https://arxiv.org/pdf/2211.04325.pdf 以数据平台技术为例,湖仓一体技术(Data术将极大提高数据处理效率,降低数据使用Lakehouse)充分整合了数据湖和数据仓库难度。机器学习、图计算等数据分析技术将的优势,支持端到端的流式计算,有利于全有效拓展数据分析的维度和深度,有利于满面挖掘数据价值,实现即时数据洞察,为环足日益复杂的数据分析需求。自然语言处理湖服务(包括多维分析、预测分析、数据科等数据交互技术与向量数据库相结合,能够学、机器学习、大数据处理、决策支持等)使计算机系统充分理解人类语言,在人机问创造了良好的先决条件。云原生容器化技术答、知识检索等场景中,创造自然高效的用有利于构建弹性可靠、松耦合、易管理、可户体验。 观测的