BroughttoyoubyInformaTech 出版日期: 2023年1月 中国人工智能框架市场调研报告 目录 内容概要研究背景行业趋势关键发现行动倡议附录 本次中国人工智能框架市场调研报告由Omdia独立完成,以开发者问卷调查和专家深度访谈的方式进行市场调研。本次调研从人工智能框架使用者的角度出发,研究主流人工智能框架(TensorFlow、PyTorch、MindSpore、PaddlePaddle、MXNet、Oneflow、Jittor等)的特点和能力,揭示主流人工智能框架厂商为中国人工智能开发者提供的技术支持和社区服务,探讨开发者与这些主流框架的交互方式和选择偏好,以及开发者对开源软件、人工智能框架、横向应用、底层硬件、开发者社区和产业生态等方面的看法。 内容概要 人工智能框架处于人工智能行业的核心地位 Omdia的调研显示,人工智能开发者对人工智能框架的依赖程度非常高,人工智能框架在人工智能行业处于核心地位。几乎所有人工智能项目,包括商业和学术项目,都是建立在一个或多个开源框架之上,例如TensorFlow、PyTorch、MindSpore、PaddlePaddle等。 开发者选择人工智能框架的两大因素是易用性和性能 开发者选择人工智能框架最重要的因素是易用性,有40%的开发者将易用性作为选择框架的首选因素。第二重要因素是性能,有35%的开发者将性能作为选择框架的首选因素。人工智能开发者认为国际框架TensorFlow、PyTorch、JAX的易用性比较好,而在中国本土的框架中,昇思MindSpore和飞桨PaddlePaddle在易用性和性能这两个重要指标上被开发者高度认可。 人工智能开发者越来越关注“负责任的人工智能” 与开源软件遇到的问题类似,开发者在使用开源人工智能框架时,所担忧的依然是安全隐私等合规性问题。值得一提的是,在所有主流人工智能框架中,开发者认为TensorFlow与MindSpore对“负责任的人工智能”提供的支持最好,分别是第一与第二名。 主流人工智能框架在能力和特性方面各有侧重 在众多的人工智能框架中,有的用于端到端全生命周期开发和部署,比如TensorFlow、PyTorch、MindSpore和PaddlePaddle。有的针对特定用途,比如JAX,开发者可以将JAX用于科学计算等特定用途,而并不用作全生命周期开发部署平台。Omdia通过调研发现,中国人工智能开发者认为TensorFlow、PyTorch、MindSpore、PaddlePaddle等框架具备全方位能力,既能够提供特定的能力(如开发大模型,进行科学计算),又能实现全生命周期的开发(即端到端开发,从训练到部署)。其中,Pytorch提供了便捷灵活的动态图执行模式和调试能力、TensorFlow在生产模型部署上具备领先优势,PaddlePaddle提供了PaddleOCR为代表的北向算法套件,MindSpore原生支持大模型、科学计算并能实现端边云跨平台部署。 人工智能框架在中国开发者中的知名度排名 与全球其他地区类似,由于历史和使用习惯的原因,TensorFlow和PyTorch在中国的知名度也领先于其他人工智能框架,分别排在前两位。而中国本土的MindSpore,PaddlePaddle,OneFlow,MegEngine,Jittor等人工智能框架在中国人工智能行业处于领先地位,其中昇思MindSpore、飞桨PaddlePaddle在中国人工智能开发者中知名度最高。 研究背景 人工智能发展的机遇与挑战 人工智能正在成为新一轮科技革命和产业变革的重要驱动力量,正与千行百业深度融合,成为经济结构转型升级的新支点。根据Omdia发布的全球人工智能市场研究报告,2021年全球人工智能软件市场规模达到370亿美金,预计到2027年,全球人工智能软件市场规模将增长到1423亿美金。中国也将成为全球第二大人工智能软件市场。在中国,人工智能技术已经在安防监控、智能家居及教育培训等领域落地生根。随着人工智能技术的快速发展,人工智能的应用部署正在迅速扩大,人工智能产业将带给开发者和相关企业更多的市场机会。 由于人工智能行业的巨大市场机会和发展潜力,中国各级政府高度重视,积极支持人工智能产业的发展。从2017年国务院发布《新一代人工智能发展规划》到现在,国家陆续出台了多项政策,鼓励人工智能行业的发展与创新,人工智能已经上升为中国国家战略。促进政策还包括《关于支持建设新一代人工智能示范应用场景的通知》、《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》、《新型数据中心发展三年行动计划 (2021-2023年)》、《新一代人工智能治理原则》、《新一代人工智能伦理规范》等。2021年3月,国家“十四五”规划正式发布,指出要培育壮大人工智能等新兴产业,“推动通用化和行业性人工智能开放平台建设”。这些产业政策为促进我国人工智能产业发展提供了增长动力和长期保障。 虽然人工智能行业市场巨大,机会众多,但发展仍然面临一些挑战。首先,人工智能所面对的下游行业纷繁复杂,应用场景多种多样,需求千差万别。而目前大多数的人工智能项目算法模型缺乏泛化能力,需要定制化的开发。定制化的开发模式造成项目开发成本高,落地困难,无法规模化和商业化。另外,即使项目开始落地,由于生产过程中现场数据质量参差不齐,工作人员能力高低不一,项目运维过程中应用环境稍有改变,数据标注和模型训练工作就需要重新做。因此,很多项目不能达到预期效果,实际产出有限,让用户体验不到人工智能的实际价值。 人工智能框架对人工智能行业发展的价值与意义 人工智能框架是算法模型设计、训练和验证的一套标准接口、特性库和工具包。人工智能框架通过对深度学习算法进行模块化的封装,面向开发者提供简单的开发界面和高效的执行平台,通过标准化的流程训练,调优,部署,测试和监控模型。 人工智能框架是算法模型开发的必备工具和基础设施,承担着人工智能操作系统的重要角色。可以帮助开发者降低开发难度,提升开发效率;可以帮助项目快速落地,平衡项目的投入成本、安全性、合规性、性能和上市时间等因素;在项目落地之后,还可以帮助项目实现规模化应用。 Omdia通过本次研究发现,几乎所有人工智能企业和开发者都在使用一个或多个人工智能框架来构建人工智能项目。从全球来看,TensorFlow与PyTorch仍然占据很大的市场份额,相当大比例的受访者表示他们主要采用TensorFlow或者PyTorch完成人工智能项目。而在中国,也涌现出了多个本土人工智能框架,比如百度开源的飞桨PaddlePaddle、华为开源的昇思MindSpore等。 研究方法论 Omdia从2022年5月开始到12月,历时7个月,以开发者问卷调查和专家深度访谈的方式进行市场调研。走访了中国的人工智能框架使用者、人工智能开发者,CTO,架构师等,覆盖了互联网、金融、电信、制造业、政府、医疗行业等多个行业,调研了中国人工智能框架的市场现状,开发者使用场景、使用习惯、关键选择因素等,以及开发者对主流人工智能框架的评价。 调研项目受访者角色和背景分析 本次调研共收集到531个有效问卷。有效的被调查对象,必须直接参与人工智能技术、人工智能框架或人工智能应用开发,或以非技术角色参与人工智能项目管理;有效的被调查对象中,超过67%的调查样本来自于企业,11%的调查样本是在研究所、实验室或大学中从事人工智能科研工作,21%是在校学生,正在高校学习人工智能的课程。而被排除在外的受访者没有致力于人工智能项目,没有完成调查,或者不符合我们的其他筛选标准。 图一:受访者所在企业或机构分布 图二:受访者行业分布 如上图所示,本次问卷调查覆盖了七个行业。在各个行业施加了配额,以确保每个行业有足够数量的有效问卷进行分析。有效的受访者在各行业占比如下:互联网(包括电商、社交媒体、娱乐等)(30%),工业(15%),金融服务(11%),通信(11%),政府(9%),医疗(5%),教育/科研(国家实验室、中科院实验室、省级实验室、高校学生等)(19%)。 被调查的人工智能开发者的工作职能分布比较平均: •占比最大的受访者来自于数据科学(数据科学家、数据架构师、算法工程师、机器学习工程师等),占25% •应用开发(应用软件开发工程师,业务数据分析师等),占23% •IT运维(DevOps工程师、运维开发工程师等),占20% •学术或科研(科研人员或高校学生),占20% •其他(业务或管理等非技术类工作),占12% 图三:受访者的工作职责分布 北京(17%),上海(16%),广州(10%)三大城市加起来占所有受访者的43%。第二梯队的六个城市,杭州、深圳、武汉、西安、成都、南京加起来占了30%;在其他城市的开发者相对较少,比较分散。 图四:受访者所在的城市分布 行业趋势· 行业趋势之一:“AIforScience”正成为人工智能框架的重点发力方向 人工智能与科学的深度融合正在推动科研范式的创新,给科研领域带来了新的发展机遇。反过来,“AIforScience”的发展也对人工智能框架提出了更高的要求,“AIforScience”正成为人工智能框架的重点发力方向。 科研领域的问题分析维度高,尺度跨度大。随着复杂科学问题变量个数或分析维数的增加,计算复杂度成指数增加,传统的科研计算方法工作量大,分析时间长,科研工作人员经常感到力不从心。而“AIforScience”借助人工智能的巨大技术优势,可以将数学计算和科学模型的方法结合起来,高效处理海量数据,使传统的科研过程变得自动化、规模化、并行化和平台化,从而解决原来传统科学研究范式无法解决的问题,帮助科学家突破科研瓶颈。 2021年,DeepMind团队的AlphaFold2的问世,标志着人工智能已经成为科学研究最重要的生产力之一。之前,复杂蛋白质结构的测定需要耗费大量的时间和成本,AlphaFold2极大提高了蛋白质结构解析效率。而在中国,科研和人工智能团队也在积极推动“AIforScience”的应用。昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组等机构就联合推出了基于昇思MindSpore的MEGA-Protein蛋白质结构预测训练推理一体化工具。 Omdia分析师认为,“AIforScience”在气候和环境科学(天气预测等),生物制药和生命科学(新药研发、蛋白质结构预测等),流体力学(汽车或飞机的气动设计等),电磁学(电磁仿真等)等应用领域可能会首先取得突破。 在本次问卷调研中,大多数开发者反馈,国外主流的人工智能框架TensorFlow对“AIforScience”支持比较好,认为中国本土的框架昇思MindSpore对“AIforScience”的支持能力超过了PyTorch并有赶超TensorFlow的趋势。开发者的反馈充分肯定了昇思MindSpore在科学计算“AIforScience”领域内做出的努力和贡献。 图五:开发者认为最适合做AIforScience项目的人工智能框架 行业趋势之二:预训练大模型成为人工智能领导者的竞争焦点 2020年,OpenAI推出自然语言处理大模型GPT-3,参数量达到1750亿,既能写文章做翻译,又能生成代码,还能进行人机对话。GPT-3的问世是一个标志性事件,直接引爆了全球范围内人工智能预训练大模型的热潮。包括华为、OpenAI、Google、微软、英伟达、百度、Meta、阿里巴巴等巨头在内的全球领先企业纷纷参与其中,追逐这个人工智能技术皇冠上的明珠,预训练大模型已经成为整个人工智能领导者的竞争焦点。最近,OpenAI基于GPT-3发布了增强的NLP大模型ChatGPT,再次在全球范围内引发了人工智能热潮。 预训练大模型是人工智能产业发展的必然选择,基于海量行业数据和知识,通过强大算力集群,预先训练基础模型,并结合应用场景的数