团队介绍 头豹是国内领先的行企研究原创内容平台和创新的数字化研究服务提供商。头豹在中国已布局3大研究院,拥有近百名资深分析师,头豹科创网(www.leadleo.com)拥有20万+注册用户,6,000+行业赛道覆盖及相关研究报告产出。 头豹打造了一系列产品及解决方案,包括数据库服务、行企研报服务、微估值及微尽调自动化产品、财务顾问服务、PR及IR服务,研究课程,以及分析师培训等。诚挚欢迎各界精英与头豹交流合作,请即通过邮件或来电咨询。 报告作者 袁栩聪 首席分析师 oliver.yuan@Leadleo.com 莫舒棋 行业分析师 kay.mo@Leadleo.com 头豹研究院 咨询/合作 网址:www.leadleo.com 电话:15999806788(袁先生)电话:18916233114(李先生)深圳市华润置地大厦E座4105室 市场研读| 2023/12 中国:人工智能系列 摘要 2022年中国大数据市场规模为1.5661万亿元,2019-2022年年复合增长率为41.1%,市场呈现较快增长趋势,预计2027年中国大数据市场规模将增至4.842万亿元,2022-2027年年复合增长率达25.33%。 大数据指的是所涉及的数据量规模庞大到无法通过目前主流软件工具,在可以容忍的时间内对其进行抓取、管理、处理的数据集合。其数据规模和传输速度要求都很高,一般单个数据集在10TB左右,其结构不适合原本的数据库系统。大数据同过去的海量数据有所区别,其基本特征可以用5个V来总结:Volume、Variety、Value和Velocity即数据规模大、种类繁多、价值密度低、处理速度快、数据真实性高。目前,中国大数据正处于高质量发展期,注重深化应用,加强数据要素的核心地位,产业链和生态系统逐渐趋于成熟,大数据在多个领域不断赋能实体经济,为数字化转型提供有力支持。 首先,技术创新,特别是人工智能和机器学习的不断发展,将提升大数据处理和分析的效率,推动行业不断演进。其次,企业数字化转型的需求将成为市场增长的主要推动力,促使各行业加大对大数据技术的投资。政府的政策支持也将在资金、法规等方面推动行业健康发展。行业对数据安全和合规性的关切将推动大数据技术在这些方面的不断创新。此外,大数据行业的全球化竞争和全球数字化趋势将为企业提供更广泛的发展空间。 截至2022年底,中国的数据产量达到8.1ZB,同比增长22.7%,占据全球数据总产量的10.5%,稳居世界第二。截至同期,中国的数据存力总规模已突破1,000EB,数据存储量为724.5EB,同比增长21.1%,占全球数据总存储量的14.4%。 未来中国大数据行业发展趋势将呈现多个方面的变化,将聚焦于数据资产化、深度共享、技术升级、行业转型等多方面发展 值得注意的是,全国一体化政务数据共享枢纽已发布1.5万类各类数据资源,累计支撑共享调用超过5,000亿次。大数据产业对存储、计算、网络、终端信息采集等方面的需求支持了计算机通信和其他电子设备制造业的发展,从而间接促进了数字产品制造业和数字产品服务业的繁荣。中国的大数据行业构建了一个多层次的技术体系,从基础技术到数据分析应用技术层层叠加,形成一个完善的技术生态系统,推动着产业的蓬勃发展。 首先,未来的发展趋势具体体现包括数据的角色逐渐由“数字资源”演变为“数据资产”,其次,公共数据的利用由“共享开放”逐渐过渡为“深度共享+授权运营”,在数字政府方面,数字履职能力的提升推动了政府数字化转型。在企业领域,算力基础设施由“一体化”向“协同化、智能化、绿色化”等方向演进,数据交易进入精细化管理新阶段,人工智能与数据技术结合,推动全要素生产率提升。工业、电信、金融等行业在数字化转型中,通过装备数字化、网络泛在化、软件云化、数据资产化等手段实现了转型引领等。 研究目的 了解中国大数据的发展演变、关键技术,分析中国大数据的产业链、应用领域、行业市场规模以及未来发展趋势。 研究目标 了解中国大数据的定义、分类、演变分析中国大数据的关键技术和应用预测中国大数据市场规模 探析中国大数据行业产业链情况预判中国大数据行业发展态势 本报告的关键问题 市场空间:中国大数据行业市场规模情况如何?未来增长情况如何? 产业链情况:中国大数据各类型厂商所在的产业链构成是怎样的?未来格局会如何演化? 核心技术:中国大数据技术架构是怎样的? 核心技术有哪些? 数据确权:数据确权是指对数据主体的个人信息进行准确而全面的记录和确认,确保数据的完整性和准确性,以便合法、安全地使用和管理这些数据。在数据确权的过程中,通常需要对数据主体的身份、属性等信息进行验证,并为其建立相应的权利和权限,以保障其在数据处理和利用过程中的权益。数据确权的目的是维护个体隐私,合规保护数据主体的权益,确保数据的正当、透明和合法使用。在随着数据隐私和保护法规的不断加强下,数据确权变得愈发重要,成为数据治理和合规的核心环节。 隐私计算:是一种计算方法,旨在在进行计算过程中有效保护参与方的隐私。这种计算方式允许在不暴露原始数据的情况下对数据进行处理和分析。在隐私计算中,涉及到的个体数据通常是加密或以其他形式进行处理,以确保在计算过程中保持数据的隐私性。 数据要素:通常指的是构成数据的基本组成部分或元素,是指在数据中能够独立识别、记录或处理的最小单元。数据要素可以包括各种类型的信息,具体取决于所讨论的数据领域和上下文。 数字化转型:是指组织、企业或社会采用数字技术来重新设计或优化其业务、流程、文化和客户体验的过程。这种转型旨在充分利用数字技术的威力,提高效率、创造价值、增强创新,并适应不断变化的市场和技术环境。 机器学习:是一种人工智能(Artificial Intelligence,AI)的分支领域,它致力于通过构建和训练计算机程序,使其具有从数据中学习的能力,从而能够在面对新数据时做出预测或做出决策。机器学习侧重于开发算法和模型,让计算机系统能够通过学习经验数据而不是通过明确编程来完成特定任务。 元数据管理:是指对数据的元数据进行有效的组织、存储、维护和利用的过程。元数据是描述数据的数据,其提供了关于数据的信息,包括其来源、结构、格式、含义、关系以及数据的创建和修改时间等方面的描述。 关系型数据库:是一种基于关系模型的数据库系统,采用了表格化的方式来组织和存储数据。在关系型数据库中,数据被组织为表格(表),每个表包含若干行和列,行表示记录,列表示字段。关系型数据库的设计基于关系代数和关系演算的理论基础。 时序数据库:是一种专门用于存储和查询时间序列数据的数据库系统。时间序列数据是按照时间顺序排列的数据集合,例如传感器数据、日志数据、金融市场数据等。时序数据库针对这类数据的特殊性能进行了优化,以支持高效的时间相关查询和分析操作。 对象存储:是一种用于存储和检索大规模数据的数据存储体系结构。它不同于传统的文件系统或块存储,而是通过将数据存储为对象的形式,每个对象包含数据、元数据和唯一的标识符。 大数据指的是所涉及的数据量规模庞大到无法通过目前主流软件工具,在可以容忍的时间内对其进行抓取、管理、处理的数据集合。其数据规模和传输速度要求都很高,一般单个数据集在10TB左右,其结构不适合原本的数据库系统。大数据同过去的海量数据有所区别,其基本特征可以用5个V来总结:Volume、Variety、Value和Velocity即数据规模大、种类繁多、价值密度低、处理速度快、数据真实性高。 2022年中国大数据市场规模为1.5661万亿元,2019-2022年年复合增长率为41.1%,市场呈现较快增长趋势,预计2027年中国大数据市场规模将增至4.842万亿元,2022-2027年年复合增长率达25.33%。人工智能和机器学习的不断发展,将提升大数据处理和分析的效率,推动行业不断演进。其次,企业数字化转型的需求将成为市场增长的主要推动力,促使各行业加大对大数据技术的投资。政府的政策支持也将在资金、法规等方面推动行业健康发展,都将持续推动大数据市场的增长。 中国大数据行业综述——定义 大数据行业可分为基础设施支撑层、数据服务层和融合应用层,呈现五大显著行业特点,而大数据是指数据规模极大、种类繁多、价值密度低、处理速度快、数据真实性高的数据集合 大数据体系架构框架 政府大数据 工业大数据 金融大数据 医疗大数据 数据资源 安全保障 融合应用 农业及水利大数据城市安全大数据 交通大数据 电力大数据 就业大数据 价值评估 安全管理 应急管理大数据 社保大数据 信用大数据 数据分析与治理 数据服务 数据预处理和加工 数据确权 安全服务 数据可视化 数据采集 数据定价 安全边界 方法和工具:数据采集、数据分析(流处理、交互查询、批处 基础支撑 理、机器学习、人工智能、隐私计算) 数据交易 安全计算 云计算资源管理平台 网络、存储和计算等硬件设施 大数据行业可划分为基础设施支撑层、数据服务层和融合应用层,这一体系呈现出五大显著行业特点 大数据:或称为巨量资料,指的是所涉及的数据量规模庞大到无法通过目前主流软件工具,在可以容忍的时间内对其进行抓取、管理、处理的数据集合。其数据规模和传输速度要求都很高,一般单个数据集在10TB左右,其结构不适合原本的数据库系统。 大数据同过去的海量数据有所区别,其基本特征可以用5个V来总结:Volume、Variety、Value、Velocity和Veracity即数据规模大、种类繁多、价值密度低、处理速度快、数据真实性高。 大数据5V特征 完整版登录www.leadleo.com 搜索《2023年中国大数据行业概览》 数量(Volume) 速度(Velocity) 种类(Variety) 价值(Value) 真实性(Veracity) TB级 记录/日志事务 表&文件 批量处理实时多进程数据流 结构化非结构化多因素概率性 统计学事件性相关性假设性 可信性真伪性 来源&信誉有效性可审计性 中国大数据行业综述——发展历程 中国大数据正处于高质量发展期,注重深化应用,加强数据要素的核心地位,产业链和生态系统逐渐趋于成熟,大数据在多个领域不断赋能实体经济,为数字化转型提供有力支持 中国大数据的发展历程,2012年以前至今 大数据技术提升阶段 数据经济深化阶段 O D 萌芽期 高质量发展期(2021年至今) R I (2012年-2013年) 快速发展期 (2016年-2020年) 发展期 大数据一词在中国开始被提出,Hadoop技术被引入中国,在互联网、电信、金融行业有了零星落地 认识层面,数据要素是数字经济深化发展的核心引擎。大数据产业基础不断夯实,产业链保持高效稳定、产业生态日益繁荣,开始探索形成数据要素价值体系。 (2014年-2015年) 大数据技术产品不断丰富和成熟,大数据应用从消费互联网向制造业、农业、能源、零售等产业互联网渗透,不断赋能实体行业。 中国云厂商开始布局大数据工具链,围绕Hadoop、MPP数据库、敏捷BI诞生了一批初创企业。 第三阶段:深化阶段“十四五”规划全面布局大数据发展,提出五大目标、六大任务和六项行动,产业将步入集成创新、快速发展、深度应用、结构优化新阶段 第二阶段:落地阶段大数据“十三五”规划发布实施,提出五大发展目标、七大重点任务和八项重点工程,经过五年发展,大数据产业快速向前迈进 第一阶段:酝酿阶段2014年大数据首次写入政府工作报告 2015年国务院发布大数据行动纲要,明确“数据是国家基础性战略资源” 中国大数据行业经历了多个发展阶段 中国大数据行业从最初的萌芽期(2012年-2013年)标志着大数据概念在中国的引入,随之Hadoop技术的应用。随着时间推移,进入发展期(2014年-2015年),中国云厂商开始布局大数据工具链,初创企