您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[爱分析]:2023数据科学与机器学习平台市场厂商评估报告 - 发现报告
当前位置:首页/其他报告/报告详情/

2023数据科学与机器学习平台市场厂商评估报告

2023-10-12爱分析机构上传
2023数据科学与机器学习平台市场厂商评估报告

1|2023昶ⴔ區·侨䰘猰㷖♸劼㐼㷖⛴䎂〵䋑㖞⾊㉁霉⠮䫣デ⸂絶兰翫 报告编委 报告指导人黄勇 爱分析 合伙人&首席分析师 报告执笔人孟晨静 爱分析 分析师 目录 1.研究范围定义4 2.市场洞察6 2.12023年数据科学与机器学习平台市场规模达到55亿元6 2.2大模型将升级平台使用体验,成为厂商差异化竞争关键7 2.3数据科学与机器学习平台厂商应满足企业信创需求9 3.市场分析与厂商评估12 3.1数据科学与机器学习平台12 力维智联20 4.入选厂商列表25 关于厂商全景报告26 关于爱分析27 研究与咨询服务28 法律声明29 3|2023昶ⴔ區·侨䰘猰㷖♸劼㐼㷖⛴䎂〵䋑㖞⾊㉁霉⠮䫣デ⸂絶兰翫 研究范围定义 1.研究范围定义 研究范围 经济新常态下,如何对海量数据进行分析挖掘以支撑敏捷决策、适应市场的快速变化,正成为企业数字化转型的关键。机器学习算法能识别数据模型,基于规律完成学习、推理和决策,正广泛的应用在金融、消费品与零售、制造业、能源业、政府与公共服务等行业的各种业务场景中,如精准营销、智能风控、产品研发、设备监管、智能排产、流程优化等。企业传统的机器学习虽然能有效支撑业务决策,但由于严重依赖数据科学家,其技术门槛高、建模周期长的特点正成为企业实现数据驱动的阻碍。 数据科学与机器学习平台是指覆盖数据采集、数据探索、数据处理、特征工程、模型构建、模型训练、模型部署与发布、模型管理与运营等建模全流程的平台,提供一站式建模服务,能显著提升建模效率、降低建模门槛。数据科学与机器学习平台能支持并赋能企业各业务场景实现智能决策,帮助企业打造数据驱动型组织。 本报告对数据科学与机器学习平台市场进行重点研究,面向金融、消费品与零售、制造与能源、政府与公共服务等行业企业,以及人工智能软件与服务提供商的数据部门、业务部门负责人,通过对业务场景的需求定义和代表厂商的能力评估,为企业数据科学与机器学习平台的建设规划、厂商选型提供参考。 厂商入选标准 本次入选报告的厂商需同时符合以下条件: 厂商的产品服务满足市场分析的厂商能力要求; 近一年厂商具备一定数量以上的付费客户(参考第3章市场分析部分); 近一年厂商在特定市场的收入达到指标要求(参考第3章市场分析部分)。 5|2023昶ⴔ區·侨䰘猰㷖♸劼㐼㷖⛴䎂〵䋑㖞⾊㉁霉⠮䫣デ⸂絶兰翫 市场洞察 2.市场洞察 2.12023年数据科学与机器学习平台市场规模达到55亿元 图12022-2026年数据科学与机器学习平台市场规模 据爱分析推测,2022年数据科学与机器学习平台市场规模为41亿元,2023年将达到55亿元,同比增长35%。未来爱分析测算2026年数据科学与机器学习平台市场规模将达到154亿元,2022-2026四年CAGR为40%。 未来几年,数据科学与机器学习平台市场的快速增长主要受AI大模型驱动。ChatGPT的爆火推升了企业对生成式大模型的认知,也提高了企业对AI解决方案的预算投入,数据科学与机器学习模型作为AI解决方案的基础设施建设,将与AI解决方案一起保持高速增长。 目前,数据科学与机器学习平台市场在金融、电信、互联网等行业渗透率最高;大中型企业正加速平台落地。 分行业来看,受数据体量和质量水平影响,数据科学与机器学习平台在金融、电信、互联网等行业渗透程度较高。大型企业均已通过采购或自建的方式搭建起数据科学与机器学习平台,中型企业也在加速部署落地。其次是政府机构,数据科学与机器学习平台在省级部门单位的渗透率逐渐提升。此外,数据科学与机器学习平台在零售、新能源、工业、医疗等行业的渗透率较低,其中大型企业尚处于引入、筹备阶段。 从企业规模来看,大中型企业的业务线条复杂、潜在AI应用场景数量可观,且自身技术人员储备充足,从长远来看,使自身具备AI建模能力是更持久、性价比也更高的方式,因此待数据条件成熟后大中型企业更倾向引入数据科学与机器学习平台;小型企业业务简单,技术人员有限,更倾向直接从算法商店直接购买成熟的AI算法部署实施,实现AI应用的快速验证,后续AI应用场景增多或是采购的算法不支持个性化业务场景时,才会考虑采购数据科学与机器学习平台。 2.2大模型将升级平台使用体验,成为厂商差异化竞争关键 AI大模型热潮激发大模型与千行百业的结合,大模型与数据科学与机器学习平台的融合已明确成为数据科学与机器学习平台的进化新方向。数据科学与机器学习平台厂商在功能上区别不明显,平台使用体验成为差异化关键,大模型与数据科学与机器学习平台的融合能有效改善平台使用体验,将成为厂商获取未来竞争优势的发力点。据爱分析调研,厂商对大模型与机器学习平台的融合实践路径主要基于以下三种形式展开: 图2大模型与数据科学与机器学习平台融合形式 通过预训练大模型进行智能标注,如应用CV大模型对图片、语义进行智能标注,高效生成训练数据。 用大模型对业务创新思路进行快速初步验证。大模型的通用性使得它能快速给出结果,用户可先通过大模型验证业务思路后,再使用数据科学与机器学习平台开发训练小模型以保证模型效果和稳定性。 通过大模型实现建模全流程智能化。既有的低代码建模仍需要人工拖拉拽进行配置,过程中也需要对算子细节进行设置,人工操作不可避免,而自动化建模方式下,缺少数据科学家的专业性,只能适用于分类、回归等简单的场景。大模型建模的理想愿景是实现用户通过自然语言与大模型互动,大模型可自动化完成数据准备、模型训练、模型部署全流程。在这个过程中,大模型会为用户提供数据科学家级别的专业引导。这一方式的落地难度系数极高,需完成包括不限于完成从自然语言(NLP)到数据处理(SQL)的转化、数据的图形化、建立模型训练知识库等过程。 图3人通过自然语言与大模型互动智能完成建模全流程 目前,前两种形式已经落地实现,第三种形式还处于研发阶段。 2.3数据科学与机器学习平台厂商应满足企业信创需求 信创国产化已经成为国家发展的重要战略之一。随着信创产业的发展,以金融、政府为代表的领域正沿着从基础设施到支撑平台再到企业应用的思路进行国产化替换,目前,大中型企业及机构在基础设施端的国产替换完成度较高,包括芯片、服务器、操作系统、数据库、中间件等。 数据科学与机器学习平台支撑数据资产价值变现的关键环节,且与以上基础软硬件关系紧密,需要适应企业国产化环境。这要求技术厂商尽快完成平台软件与国产化软硬件环境的兼容、适配及认证,保证平台能在国产CPU、AI加速芯片以及操作系统上稳定运行。 图4数据科学与机器学习平台的国产化适配要求 11|2023昶ⴔ區·侨䰘猰㷖♸劼㐼㷖⛴䎂〵䋑㖞⾊㉁霉⠮䫣デ⸂絶兰翫 市场分析与厂商评估 3.市场分析与厂商评估 爱分析对本次数据科学与机器学习平台项目的市场分析如下。同时,针对参与此次报告的部分代表厂商,爱分析撰写了厂商能力评估。 数据科学与机器学习平台 定义: 数据科学与机器学习平台是指覆盖数据采集、数据探索、数据处理、特征工程、模型构建、模型训练、模型部署与发布、模型管理与运营等建模全流程的平台,提供一站式建模服务,能显著提升建模效率、降低建模门槛。大模型开发平台也属于数据科学与机器学习平台的范畴。 终端用户: 金融、消费品与零售、制造与能源、政府与公共服务等行业企业,以及人工智能软件与服务提供商的数据科学家、风控建模人员、营销建模人员、业务分析人员、模型应用人员 甲方核心需求: 企业对机器学习的应用越来越广泛。一方面,数据量的激增、算法的突破以及CPU、GPU、DPU等多种算力技术的发展,为以机器学习为基础的数据挖掘、计算机视觉、自然语言处理、生物特征识别等技术在企业的应用奠定了技术基础;另一方面,市场环境的快速变化对企业决策敏捷性要求增强,不仅推动企业将机器学习模型应用到营销、广告、风控、生产等更多业务场景,也对模型精度、模型开发敏捷性以及模型应用广度提出更高要求。然而,机器学习技术门槛高、建模周期长,难以满足企业通过基于机器学习模型提升经营效率的需求。 数据科学与机器学习平台具备工具丰富集成、建模效率提升以及模型资产复用等特点,能充分满足企业对智能应用的需求,正成为企业智能化基础设施的必要构成。 不同企业对数据科学与机器学习平台的需求不同,其差异取决于企业自身机器学习建模能力和对算法的需求。 1、对于金融、消费品与零售、制造与能源、政府与公共服务等行业企业 除大型金融机构外,传统企业普遍不具备机器学习建模能力。大型金融机构数据科学团队人才完善,对机器学习算法的探索和应用更前沿,如将机器学习模型应用在精准营销、智能风控、产品研发、客户体验管理等多个场景中。但更多的传统企业面临IT人才缺失、尚未开始智能化应用或处于局部试验的初期阶段。传统企业对数据科学与机器学习平台的需求主要体现在以下五个方面: 图5传统企业对数据科学与机器学习平台的需求 1)降低机器学习建模门槛,使非专业建模人员也能掌握机器学习建模技术,赋能业务。传统机器 学习建模技术门槛高,需要组建专门的数据科学团队,包括数据工程师、数据科学家、开发工程师等,人力成本高昂。传统企业希望能降低机器学习建模门槛,如平台能实现数据自动处理、自动特征工程、图形化建模或自动建模等功能,使非专业的业务人员也能快速开展建模工作,广泛赋能业务,实现普惠AI。 2)提供定制化算法、模型部署和运营服务,快速创造业务价值。传统行业多具备行业特性,行业垂 直场景下的模型开发耗时耗力,而且传统企业对AI智能应用的探索尚处于初期,更倾向“小步快跑”,因此购买定制化算法能节约人力、实现快速产出以及验证AI智能应用效果。企业需要厂商提供定制化算法服务、模型在硬件平台和操作系统平台的部署服务以及模型运营服务。 3)缩短建模周期,提高业务敏捷响应度。以金融行业为例,金融企业的产品、服务、风控模型均需 随着客户行为改变而持续迭代更新。但传统的机器学习建模周期长达数月,无法敏捷响应业务需求。企业需要数据科学与机器学习平台内置丰富的行业算法、模型模板、案例等,供建模人员直接调用,加速模型训练;或是提供一键部署功能,实现模型在生产环境的快速部署。 4)提供咨询服务,提升模型质量。对于具备一定机器学习建模能力的金融机构,需要厂商提供建模咨询支持,协助企业完成数据准备、模型训练、模型部署等环节,提升模型质量。 5)支持国产化适配。以金融、政府、电信为代表的行业,其底层软硬件基础设施已经基本实现国产化,厂商需支持平台对国产软硬件的兼容、适配。 2、对于人工智能软件与服务提供商 对于中小企业或是刚开始试点智能应用的企业,相较于数据科学与机器学习平台需要的组织、人才、流程上的变革与支持,采购适用于特定场景的AI智能应用是性价比更高、更迅捷的解决方案。人工智能软件与服务商如算法服务商、ISV即面向此类需求,提供模型和智能应用服务。以算法服务商为例, 尽管具备专业的数据科学团队,但中小型企业的算法需求多样且个性化,如虽然都是AI视觉算法,智慧城市、智慧工业下的应用场景如安全帽识别、产品瑕疵识别的模型却截然不同,需要基于业务数据集、业务思路分别进行训练。这使得算法服务商常常面临严格的算法交付周期和算法精度要求。具体而言,人工智能软件与服务提供商对数据科学与机器学习平台的核心需求主要体现在以下四个方面: 图6人工智能软件与服务提供商对数据科学与机器学习平台的需求 1)提高机器学习建模效率。软件开发公司、算法提供商面临严格的交付周期,但在传统AI应用开发方式下,数据接入、数据处理、模型训练等一系列建模流程都需要人工操作,建模周期长。其中数据接入环节因开源算法工具对不同类型的数据兼容性较差,需人工将原始数据转化为开源算法所支持的数据类型;数据标注环节往往通过人工完成,并且部分领域的标注过程严重依赖专业知识,整体数据准备将耗费数周时间;模型部署中对模型的集成、监控和更新需要大量的调研和实施工作,单个模型部署到上线需要3-5个月。企业需要完善的数据科学工具和建模功能,支持实现数据采集、数据准备、