C目o录ntents 1什么是数据的未来1 2未来属于数据交换4 3迄今为止,唯独数据只增不减6 4海量数据带动云计算增长8 5数据从“上云”走向“云上”10 6数据时代走向3.012 7拥抱数据云,构建统一基础设施14 8定义:一站式企业级数据云16 结语:数据未来将无死角地降临20 01 01. 什么是数据的未来 2012年,SteveLohr在《纽约时报》上撰文描写“Data-ism”(数据主义):“大数据这个词现在时常被人们随意使用,然而其语义十分模糊。简单地说,这个包罗万象的词条一般有三层含义:首先,它指代一揽子的技术;其次,它有可能引发一场度量数据规模的革命;最后,它为人们未来将会、甚或是应该如何制定政策提供了一个新视角、一种新理念。” 差不多同时间,2010年,维克托·迈尔·舍恩伯格(ViktorMayer-Schönberger)在《经济学人》上发布了长达14页对大数据应用的前瞻性研究,并在两年后出版了《大数据时代:生活、工作与思维的大变革》一书。在书中,他指出大数据的核心就是预测:“大数据将为人类的生活创造前所未有的可量化的维度。”他进一步指出大数据时代最大的转变是“要相关关系,不要因果关系”。这颠覆了人类过去的视角,进一步从数据延伸出了全新的人类与世界交流的方式。 时间进入21世纪20年代,SteveLohr的描述已然成为现实。世界各国纷纷转变视角,把数据发展作为一项战略规划。对于数据的占有和使用,影响着国家竞争力的走向,以及企业在市场竞争中的地位。2020年,中共中央、国务院《关于构建更加完善的要素市场化配置体制机制的意见》第一次把数据提到生产要素的高度上来,并进一步明确要加强数据资源整合和安全保护。一年之间,从基础设施到数据市场,数据要素的可能性热议中国。(图1) 中共中央、国务院《关于构 建更加完善的要素市场化配 置体制机制的意见》 首提数据要素 推进政府数据开放共享;提升社会数据资源价值; 加强数据资源整合和安全保护。 “新基建”3大方面7大领域 国家首次官宣明确 信息基础设施 以工业互联网为代表的通信网络基 础设施;以人工智能、云计算为代 表的新技术基础设施;以数据中心 为代表的算力基础设施。 总理发布 政府工作报告 首提培育数据 市场 推进要素市场化配置改革; 促进人才流动,培育技术和数据 市场,激活各类要素潜能。 港交所掌门人李小加数据相 关提案引起广泛关注 加速数据要素 市场培育 聚焦以下5大问题:数据确权;数据 的安全和隐私保护;助力数据共享, 以产生更大价值;统一数据市场的 监管标准;培育数据交易生态体系 工信部发布《关于工业大数 据发展的指导意见》 图1:2020年“数据要素”相关发布 工业大数据 重点任务涉及数据汇聚、数据共享、数据应用、数据治理、数据安全、产业发展、组织保障7个方面 “数据要素化”是人类第一次对数据的未来拥有了相似的集体想象。这种想象可能来自于对当下的迷茫和不满。 2019年底,中国社会科学院发布的《社会蓝皮书》指出,中国城市发展从“增量”时代走向了“存量”时代,从社会经济到企业经营,过去的经验似乎不再有效。“你可能什么都没做错,你只是太老了。”马化腾的这句话真切地说明了时代变迁给企业、给个人带来的不安和恐惧。 02 为了消解变化背后的不确定性,企业越来越依赖于对机器智慧的想象,既要解决当下企业面临的问题,也要为更长远的发展提供空间。如果说计算机帮助企业收集信息,从经验试错走向了分析择优,那么,面对越来越复杂的计算机系统和企业组织,今天企业就必须要去思考和解决如何让数据自动化流动起来,消解复杂系统本身的不确定性,优化整体资源配置效率。 “让正确的数据,在正确的时间,以正确的方式传递给正确的人和机器”,安筱鹏在《重构:数字化转型的逻辑》里认为,数据自动流动是企业竞争的关键,而算法则是将不确定性转化为确定性的最佳路径。 所以,从企业数字化转型的终局来看,企业技术能力的中心将由“系统建设”走向“数据交换”。用机器代替人去完成更高效率、更低成本的存储和计算,用算法代替经验公式去更准确高效地复用经验和知识,这就是未来数字化转型的定义。(图2) 经验 知识 算法 体力 脑力 硬件 软件 算力 数据 数据交换 算法代替经验公式 系统建设 机器代替人 图2:从“系统建设”走向“数据交换” 未来属于数据交换 过去主流的数据交换方式,来自于云厂商通过其上的平台(如淘宝)、通道(如微信)和工具(如手机),统一收集、处理、使用数据,数据只允许在平台内交换,构成了一个个封闭的中心型数据交换体系,每个节点和中心之间一对一地开展数据交换,即“以平台为中心”的交换方式。 1数据处于非确权状态,需要 依赖平台进行交换; 2数据技术发展刚刚起步,企业 缺少交换的基础设施; 3企业对数据的重要性认知不足, 更多地把数据作为工具,而没 有视为资源。 这种交换方式成为主流的原因包括: 对于互联网平台以外的大部分企业而言,当前数据交换的主要矛盾不是数据“可用”和“易用”的问题,而是数据“有”和“没有”的问题: 从技术角度来看,企业通常面临数据生产(没有数据)和数据采集(有数据但没采集)能力的缺失; 从业务角度来看,面临的是缺乏数据想象力,以及数据应用需求的单一化(可视化报表)的问题;从组织角度来看,面临的则是数据战略和专业人才的缺失问题。 但这种现状正在发生改变。 04 首先,大型企业集团同样希望在集团内部实现“以平台为中心”的数据交换,尽管面临数据能力不足、数据量少、数据需求少的现状,平台化仍然是大势所趋; 其次,随着云计算市场的发展,越来越多的企业希望摆脱云依赖,走向多云,不依附于某一家云厂商;最后,数据确权和反垄断也给互联网平台的数据使用带来了更大的挑战,存量竞争让平台数据价值降低。 DirectShare ShareB1_3 AccountB1 ShareB1_2 ShareB1_1 OrganizationB ShareB2_1 AccountB2 ShareB2_2 不仅如此,大型企业集团希望数据也能实现与产业上下游的互联互通,以及和第三方公司的数据交换,最终,实现数据要素的市场化交易。即统一构建云上数仓,统一构建云上账号体系,最终实现DirectShare—InternalExchange—ExternalExchange—DataMarketplace(数据共享—内部交换—外部交换—数据生态市场)的数据交换体系。(图3) DataMarketplace FromDataSimbaAccountFromThird-PartyDataProvider/Collector OrganizationA InternalDataExchange Listing/DatabaseA1_1 Listing/DatabaseA2_1Listing/DatabaseA3_2 AccountA1 ShareA1_1ShareA2_1 ShareA3_1 ShareA3_2 AccountA2 AccountA3 ExternalDataExchange Listing/DatabaseB1_2 Listing/DatabaseB2_2Listing/DatabaseA3_1 图3:数据交换体系 数据交换,意味着新的工作方式、新的商业增长模型、新的商业模式、新的商业角色…机会就孕育在风暴之前。 迄今为止,唯独数据只增不减 1980年,雷·库兹韦尔(RayKurzweil)想要找到一种方法,用于测量和追踪技术发展的速度。他用1000美元能购买到的计算能力随时间的变化情况来绘制这条曲线。(图4) 根据计算结果,库兹韦尔惊讶地发现,技术并不是线性发展,而是呈指数级上升的加速度发展。 图4:Exponentialgrowthofcomputing.20thto21stcenturies图源:RayKurzweilandKurzweilTechnologies,Inc. 库兹韦尔把这一规律命名为“加速回报定律”,把技术发展延伸至未来的某个巨变时刻称为“奇点”,人类社会在奇点来临之后将呈现完全不一样的状态。 不管是芯片领域的摩尔定律,亦或是生物科技领域,一系列的技术进步曲线看起来都呈现出了指数级增长的特征。2015年之后,全球范围内,数据同样开启了指数级增长曲线。 有两个数据可以佐证: 1.2015年,这一年人类产生的数据,近似等于2015年之前所有数据的总和; 2.2015年之后,人类产生数据总和以每年30%-40%的速度在增长。根据IDC的预测,2025年,人类数据总和将突破175ZB。(图5) 可以说,2015年就是数据奇点开启的元年。 175ZB 2010201120122013201420152016201720182019202020212022202320242025 ZB 180 160 140 120 100 80 60 40 20 0 图5:全球数据圈的每年规模 图源:数据时代2025,IDC全球数据圈 海量数据带动云计算增长 互联网行业巨头最早感知到数据指数级增长带来的云计算机会。 早在2006年,亚马逊就成立了AWS(AmazonWebServices,亚马逊云服务),开始尝试提供S3存储服务、SQS消息队列、EC2虚拟机,从而证明“云是可行业务”。 2008年,微软、谷歌两大巨头躬身入局,微软发布了WindowsAzure技术社区预览版,开始提供服务托管和线上化服务;谷歌发布了GoogleAppEngine预览版,用于开发者基于专有Web框架开发App并部署,这可以被视为PaaS的起源。 在国内,2008年,阿里巴巴开始筹办和起步“云计算”;2009年,阿里云成立。(表1) 进入2020年,企业的云计算使用走到了新的拐点。 1.2020年,我国公有云市场规模首次超过私有云。同期,全球云计算市场保持稳定增长,但增速逐渐放缓。公有云市场规模达689亿元,增长57.6%,私有云市场规模达645亿元,增长22.8%。 2.企业对云的投入增加。2020年IDG的云计算调研报告指出,云计算相关支出占比达到企业总IT预算的32%,且比例还在增加。 3.云原生趋势。2020年在云中运行的应用程序中,有54%是从本地基础结构迁移到云上的现有应用程序,而46%是“专门为云计算而构建”的应用程序。 4.企业采用“多云”趋势。2020年IDG的云计算调研报告显示,当组织利用多个公共云时,49%的受访者提到的主要目标是利用“最好的平台和服务选项”。其次“节省成本/优化成本”占41%,“提高灾难恢复/业务连续性”则占40%。如果仅放大企业目标,“避免供应商锁定”是第二目标,占比达40%。 上云云时,代从无1到.0有 大云数据时,代技术2.升0级 数据云平时台代,效3率.0升级 数据量 截至2010,全球数据量达 2ZB 截至2015,全球数据量达 15ZB,增速达25% 截至2020,全球数据量达64ZB, 增速超50% 产业格局 .规模导向,巨头垄断 .“云计算”成型,但未解耦“云计算”、 “大数据”等核心概念 .“云”从面向个人的网盘服务,转为面向企 业的企业级云服务 .国外云厂商正式加入中国市场竞争 .更多互联网头部企业进入市场,并开始出现 有特色产品服务和自主研发能力的独立云计 算创业企业 .企业趋向采用“多云”/“混合云”策略 .大量第三方独立服务商出现,与云厂商互利共生 技术趋势 .虚拟机层面实现存储与计算分离,逐步 形成适用于云上的应用架构 .IaaS、PaaS、SaaS技术层级分流出现, .PaaS层整体技术方向转变,尽可能解除原有 各领域深化发展,相互对接 平台、语言、框架的限制,保证云端用户的 技术灵活性和可移植性 .IaaS层技术深化,容器化与微服务形成趋势, .PaaS层摒弃大一统