您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华东师范大学]:数智时代中国数据库的路线选择 - 发现报告
当前位置:首页/行业研究/报告详情/

数智时代中国数据库的路线选择

数智时代中国数据库的路线选择

数智时代中国数据库的路径选择 RouteSelectionforChineseDatabasesinAIEra 周傲英华东师范大学 2024年07月16日•北京 自主·创新·引领 目录Contents 01数据是生产要素02数据是新的动力 03数据库基础设施04新数据基础设施 05我们的发展路径 1 数据是生产要素 RouteSelectionforChineseDatabasesinAIEra 数据是第五生产要素(5thFactor) 五大要素劳动 土地 2020年4月9日,中共中央、国务院发布 《关于构建更加完善的要素市场化配置体制机制的意见》 《关于构建更加完善的要素市场化配置体制机构的意见》总体要求 资本 企业家才能 市场决定有序流动 健全制度创新监管 问题导向分类施策 稳中求进循序渐进 数据 技术 资本 劳动力 土地 要素领域 数据 数据是第五生产要素(5thProductionFactor) 历史阶段 生产要素 代表人物/事件 农业时代 工第一次工业革命业 时 代第二次工业革命 数字时代 劳动、土地 劳动、土地、资本 劳动、土地、资本、企业家才能 劳动、土地、资本、企业家才能、数据 威廉·配第,庞巴维克 亚当·斯密,萨伊,约翰·穆勒马歇尔 十九届四中全会,《关于构建更加完善的要素 市场化配置体制机制的意见》 数据要素的特殊性(DataasProductionFactor) 01数据的非独占性 02数据的非排他性 03 稀缺性是经济学的前提条件 数据要素的特殊性困扰各个数据交易所的难题 数据的权属问题成为困扰数据立法的难题 数据的属性问题成为困扰研究者的难题 •公共、企业、个人 •公共(免费)vs.商用 •公共(共有)vs.私有 2 数据是新的动力 RouteSelectionforChineseDatabasesinAIEra 数据是新的动力(DataisNewPower) 数据是和马力、汽力、电力一样的动力(DataPower) “马力”(HorsePower) “蒸汽能”(SteamPower) “电能”(ElectricPower) “数据能”(DataPower) 人类的农业革命中国,孔子 第一次工业革命英国,机械系 第二次工业革命美国,电机系 人类的数字革命中国,数据学院 新的动力带来新质生产力(NewPowerandNewProductivity) 动力更替与经济演变(Powervs.Economy) 新能源(NewPower)的出现促进经济的变革 农业经济 工业经济 数字经济 数据能(DataPower)将把人类来带入数字文明时代 动力更替与产业革命(Powervs.IndustrialRevolution) 第一次工业革命:蒸汽能(SteamPower) •蒸汽机,机械的发明和使用 •卢德运动、资本论、马克思主义 •英国成为日不落帝国 第二次工业革命:电能(ElectricPower) •发电机、电动机的发明和使用 •美国取代英国成为GlobalPower 新质生产力的基本特征是生产效率和生产能力数量级的提升和放大 数字化/数智化转型(DigitalTransformation) 转型的英文翻译是ParadigmShift •换套路、变轨换道 •需要大众企业家精神 数字化转型就是创新,是自我革命,是改变思维 鸡蛋从外面打破是食物,从内部打破是生命——李嘉诚 数字化改革,不是给我上,是跟我上 ——袁家军,重庆市委书记 数据之于数字化,正如交流电之于电气化 3 数据库基础设施 RouteSelectionforChineseDatabasesinAIEra 数据库是什么(WhatisDatabase?) 数据库是信息社会的基础设施(Infrastructure) •解决诸如记账、结算、订票、转账等需要精确管理和巧妙处理的业务,经过针对共性问题的提炼和开发而形成 •从美国信息系统千年虫(Y2K)、2020年社保和2020年医保问题可以看出,早期的数据库是由金融应用驱动的创新成果 数据库是计算机科学的一个重要分支 数据库的成就:关系模型+事务处理+查询优化 数据库是硬核科技:应用+技术+理论 硬核科技的发展必须遵循“应用驱动创新+学术引领产业”的基本发展路径 数据库六十年的发展(60YearsofDatabase) 数据库是信息社会的基础设施 •数据库=[数据] •支持关键核心(Mission-critical)业务 •涉及到人、财、物等需要精确管理的应用 从数据库到数据仓库 (OLTPDatabaseOLAPDataWarehouse) •决策支持系统(DSS)、商务智能(BI) 从数据库发展到数据挖掘 (DatabaseDataMining) •把数据转换成有用的信息 和知识,付诸应用 数据库从OLTP发展到数据仓库和数据挖掘是无意识的“变废为宝” 数据库的历史(HistoryofDatabase) SQL数据库的创造者 数据库的教训(LessonsofDatabase) 数据库的发展史是IT技术创新史的缩影数据库发展的教训 •应用驱动创新 •应用创新与技术创新相辅相成,互为促进 •OneSizeFitsAll •OneSizeFitsNone •OneSizeFitsaBunch 数据库的哲学(DatabasePhilosophy):抽象 抽象的原意就是排除和抽出,实质是概括是找出共性、普遍、本质的东西 •关系数据模型是对数据语义(DataSemantics)的抽象 •事务处理模型是对应用逻辑(BusinessLogic)的抽象 •数据库基准评测(Benchmarking)是对产品能力的抽象 抽象成就了数据库理论和产业,三十年以来僵化的抽象阻碍了发展 •关系数据库一家独大,一统天下 •Onesizedoesnotfitall,“大数据”概念应运而生 4 新数据基础设施 RouteSelectionforChineseDatabasesinAIEra 正确的数据观:不只是结绳记事(TheViewofData) 01数据是对事实的记录 02数据人们社会经济活动的副产品 •结绳记事是史前文明的数据形式 •电信运营商的数据是为了月底结算话费 •学校的考勤和考试等数据是为了颁发毕业证、学位证和成绩单 03中国文化对数据的解释是:“以数为据” 数据从人类社会经济活动的副产品变成当前新要素 正确的数据观(TheViewofData) 数据是专指存储在计算机中、计算机可处理的 数据,不是泛指记录事实的数据(机读数据)1 数据是人们对世界认知的结果在计算机世界中2 的表示 数据是万物互联的桥梁和纽带,“人是万物之3 灵” 数据是新能源,不是石油 4(DataisPower,butnotOil) 5 数据是第五要素,不是普通的生产要素(没有稀缺性) 6大数据不是指数据的大小,大数据是说数据很重要;大数据是指数据的采集、汇聚、关联和 使用 微软的超前部署 MicrosoftPowerPlatform 统一的低代码平台,集成Office365、Dynamics365、Azure和独立应用 PowerBI 业务分析 PowerApps 应用开发 PowerAutomate 流程自动化 PowerVirtualAgents 智能虚拟代理 数据连接器AIBuilderCommonDataService MicrosoftPowerPlatform MicrosoftPowerPlatform 助力企业数字化转型的低代码平台 数据大众化: •通过连接器和通用数据服务(CommonDataService)整合业务数据,提升数据洞察能力 面对数字化转型,每一家公司都将成为软件公司 —SatyaNadella 开发大众化: •低代码、低门槛,“全民低代码开发”灌注企业强大创新力 AI大众化: •利用AIBuilder,根据数据和需求量度身定制,使APPs和流程更加智能,创建一些神奇的AI认知服务功能 数据赋能平台(DataPowerPlatform) 数据和交流电一样 •当前的时代就像一百多年前尼古拉•特斯拉刚刚发明了交流电的时候一样,不仅需要研究发电机和电动机,更需要研究电本身,如电的变压原理、电的传输,还要研究电的绝缘、继电保护和电网建设。 让数据好用把数据用好 数据中台的目的 在于帮助企业提高数据能力,包括两层含义: •打通数据,就像建电网; •让数据好用,就是把数据技术装备化、傻瓜化,便于业务人员使用数据,充分发挥数据能的威力。 5 我们的发展路径 RouteSelectionforChineseDatabasesinAIEra 数据库遭遇互联网(DatabaseMeetsInternet) 数据库是解决封闭环境下Mission-critical应用的 互联网因为开放(Open)改变了传统数据库的两大假设前提(Assumptions) 开放的互联网为封闭的数据库带来新机遇 •同时在线使用数据库的并发用户数不可控(现象级应用) •数据库系统中产生数据的用户群体不可控(非特定用户) 未来数据系统(FutureDataSystems) 重新定义分布式数据库、并行数据库、高可用数据库、实时数据库 •LesileLamport的Paxos协议+EricBrewer的CAP定理 •GFS的副本策略(Replication)+冗余机制(Redundancy) •复杂事件处理(ComplexEventProcessing)和数据流系统 互联网催生了很多Mission-Critical+Trust-Critical的应用场景 •互联网的下半场一定是分享经济,是市场经济和人类文明的高级阶段 •分享经济的核心是信任,区块链就是用数据和数学来重塑人类的信任 •区块链是多种技术集成的新型数据库软件——工信部,网信办,2021年6月 云原生数据库和数据中台的根本目的是使数据库技术和数据技术大众化 •DatabaseasaService(DBaaS),Snowflake •DataasaService(DaaS),MicrosoftPowerPlatform 数据技术的发展趋势(Trends) 应用驱动创新开放成就创新 解决问题 (OpenProblem) 开放架构 (OpenArchitecture) 开源文化 (OpenSource) 解放思想 (OpenMinded) 我国互联网企业探索和示范了应用驱动创新之路 •应用促进技术的进步,技术倒逼应用发展,良性循环 我们处在一个大变局的时代,数据库的发展正朝着“数据赋能”目标前进,“替代工程”和只是契机,“转型升级”才是趋势 发展生态型组织,建设创新的可持续发展生态 •我们有丰富的应用场景,解决现实问题是创新正道 •独行快,众行远,集聚力量,开源可以形成磅礴合力 中国数据库的机遇(Opportunities) 重视对IT领域应用驱动创新的认识和研讨 •丰富的应用是我们创新的驱动力,应用是出发点和落脚点 •在解决问题中发现问题的本质,形成技术,建立基础理论 做好顶层设计,生态型组织,打造开源文化 •我们有庞大的技术和研究力量,需要组织和引导 •健康生态的营造首先需要开放,开源是必由之路 •基础软件和系统软件的模块化、栈化,促进万众创新 •基础研究和原始创新需要攻关,需要久久为功 6 结束语 RouteSelectionforChineseDatabasesinAIEra 结束语(ConcludingRemarks) 数据是第五要素,新基建的核心 •数据是新动力(DataPower) •数据库哲学(DatabasePhilosophy) •开源开放(OpenSource/OpenMinded) 我们处在数据库发展最佳时机 •创新的商业模式+丰富的应用场景→应用驱动创新 •数据库发展:从Mission-critical到一体化数据赋能 •数据中台就是数据技术的大众化和平民