以史为鉴-数据库技术的历史与未来 演讲人:盖国强@云和恩墨 自我介绍 盖国强云和恩墨信息技术有限公司联合创始人 o技术论坛ITPUB的主要倡导者之一;出版15本技术书籍;o国内第一个OracleACE及ACE总监(2007~2020.7); o新数据库技术社区墨天轮发起者,ACDU(中国DBA联盟)主席;o华为鲲鹏MVP,腾讯云TVP; 云和恩墨智能的数据技术提供商 o汇聚研发人才,推出zData、zCloud、MogDB等产品;o华为2022年度“openGauss最佳实践伙伴”奖; o汇聚GaussDB认证专家,OracleACE总监,SQL冠军, 以及数十位OCM专家,MySQL、DB2、中间件专家,服务企业用户;o恩墨学院,打造DBA专业人才培养的黄埔军校,已经培养OCM数千人! 以史为鉴:回顾历史越久远,展望未来就越深远 夫以铜为镜,可以正衣冠;以古为镜,可以知兴替;以人为镜,可以明得失。 -《贞观政要》 Thelongeryoucanlookback,thefartheryoucanlookforward. -WinstonLeonardSpencer Churchill 历史回眸:宏大的历史事件驱动技术变革 1968年8月14日,第一条“IMSREADY”信息出现在加利福尼亚州多尼市的IBM2740终端上,IMS从此成为了IBM的重要产品之一。IMS数据库是基于层次模型的,是世界上第一个层次数据库管理系统。 1969年,阿波罗计划登月成功 在飞船制造过程中,200多万个零部件的BOM清单让传统管理方法成为阿波罗计划的重大障碍之一。 技术的重大跃迁,总是需要宏大的历史事件作为驱动。 行业演进:改变数据库世界的伟大程序员 查尔斯·威廉·巴赫曼 CharlesWilliamBachman 1924年11月11日-2017年7月13日 1973年 1964集成数据存储 (IntegratedDataStore,IDS) 埃德加·弗兰克·科德 EdgarFrankCodd 1923年8月23日-2003年4月18日 1981年 1970发表 关系型数据库奠基论文 詹姆斯·尼古拉·格雷 JamesNicholas"Jim"Gray 1944年1月12-2007年1月28日? 1998年 1987NonStopSQL以线性扩展能力著称 迈克尔·斯通布雷克 MichaelStonebraker 1943年10月11日- 2014年 自1973年开始Ingres,PostgreSQL 永不止息:想象力比知识更重要 巴赫曼“从来没有停止试图了解事物的运作,并试图使之更好地运作。”他的贡献代表了想象力与实用性的结合。 巴赫曼对世界永远充满想象力的探索精神,是对爱因斯坦“想象力比知识更重要”名言的最佳注脚。 永不止息:想象力比知识更重要 科德在工作中敏锐地察觉到当时的数据库技术逻辑混乱,缺乏坚实的理论基础,经过深入思考和推演之后,他提出了“数据的关系模型”,以关系代数作为理论基础。 生生不息:道路曲折而前途光明 鲍勃•约斯特(BobYost)回忆说:”我当时在高级系统开发部工作,大约1970年,我和其他几个人一起去看科德的东西,因为我们当时正在与IMS的人合作。我们简直不敢相信,我们认为至少需要十年时间才会有结果“。 埃尔夫·特雷格(IrvTraiger)回忆说,“当时,我们系统部的几个人试着读了读这篇论文,但怎么也读不懂。至少在当时看来,这是一篇写得非常糟糕的论文:阐述了一些工业动机,然后直接进入数学。” 路径选择:初出茅庐,谁的青春不迷茫 吉姆·格雷在IBM最初的研究方向不是数据库,而是面向对象操作系统。 斯通布雷克博士论文是关于马尔可夫链的算法研究,他觉得这不是值得投身的领域。 上司LeonardLiu建议:IBM有太多的程序语言和操作系统了,但在网络和数据库方面有很大的挑战。 接受了建议,吉姆·格雷最终确认数据库或数据通信领域才是最佳选择。 来到加州伯克利后,他面临两个重要事项:找到一个值得投身的新领域;尽快发表论文获得终身教职。 1971年,EugeneWong建议斯通布雷克阅读一下科德的论文。 巅峰回眸:建立历史视角、锤炼远见目光 如果你有眼光,就一定要追求有远见的研究。尽可能花时间去做自己引以自豪的事情,尽量不做无意义的事情。 -JamesNicholas"Jim"Gray 詹姆斯·尼古拉·格雷 1998年图灵奖获得者 大多数看似创新的想法实际上并不是新的,而是以前提出的。有一个强大的历史视角很重要,可以帮助我们避免重复发明轮子并重复历史错误。 -MichaelStonebraker 迈克尔·斯通布雷克 2014年图灵奖获得者 路径选择:东方智慧,拨开迷雾见月明 LeonardLiu的中文名是刘英武,1941年出生于湖南衡山,拥有台湾大学本科学位和普林斯顿大学博士学位。 他的职业生涯始于IBM,曾负责领导SQL的发明和实现,他曾出任IBM集团最高管理委员会秘书长和组织部部长,直接向董事长FrankCary汇报。他最终负责全球数据库和计算机语言业务线,任全球副总裁,是IBM级别最高的华裔高管。 EugeneWong的中文名是王佑曾,1934年出生于中国南京。拥有普林斯顿大学电机博士学位。 在剑桥大学做完博士后加入IBM,1960年至1962年在“托马斯·J·沃森”中心做研究员,1962年加入伯克利大学的教师队伍,后担任电气工程和计算机科学系主任。1988年获得ACM软件系统奖,并被授予2005年“IEEE创始人奖章”。 学会记录:良好的习惯成就精彩人生 我的导师常教导我要把一些事情写下来。所以,无论何时去旅行,我都要写一个旅行报告;无论何时与人谈话得到的想法,我都要做备忘录,并归档。 凭借这种习惯,我写了许多文章,参加了许多国际会议,并出名了。这可能对那些做同样事情的人来说是不公平的,但那就是生活。 我常说自己的文章思想大都来自FrancoPutzolu和IrvTraiger。 记笔记和做报告的习惯,使我在圈内得到好评。 Inthefallof1980,IstartedworkatHP...Iwasafairlyrarecommodityatthetime:arecentgraduatewhoactuallyknewsomethingaboutRDBMSs.DuringmysenioryearatPrinceton,Ihadattendedagraduateseminaronrelationaldatabases.ThiswasatthetimewhenJeffUllmanwasstillaprofessoratPrincetonandwasjuststartingtogetinterestedindatabases.DuringgraduateschoolatMIT,Itookaseminarinwhichwestudiedsomeofthelatestresearchindatabasesystems,suchasJimGray’sNotesonDatabaseOperatingSystems,whichwasbasedontheIBMSystemRresearch. AndrewMendelsohn - 我的经历:一个程序员的基本修养 1999年,青涩少年2000年,文艺青年2001年,论坛版主 2010年,ACOUG成立 2007年,OracleACE 2007年,风格形成 2006年,第一本专著 路线探索:中国数据库的路线选择和竞争力贡献 国内数据库产业的繁荣,必须具备理论创新能力、产品创新能力,在中国高并发、大容量的数据场景下,催生下一次原始创新,从而实现真正的创新引领。基于国内根社区的开源模式,正在显现出巨大的活力和竞争优势。 开源衍生:基于开源软件进行开 发的数据库产品,通过开源许可获得知识产权授权,只要遵循开源协议即可合规使用。基于MySQL和PostgreSQL的国产数据库属于该路线。代表性国产数据库为人大金仓、瀚高、优炫、GoldenDB、AntDB等 商业衍生:通过购买版权许可获 得数据库核心组件的使用和开发权限,第三方知识产权风险一般由授权方背书,获得永久性许可则无需担心知识产权问题,如Informix;基于商业/开源双许可分发的开源项目,需要获得主导厂商的商业授权方可使用,如MySQL等项目。代表数据库为星瑞格、SUNDB等。 自研闭源:闭源自研的数据 库产品版权为自研企业专有,通过自身建立研发体系,具备完整的商业流程和授权策略,可以自行决定产品发展策略和商业计划。达梦、巨杉等是国产闭源自研的代表性产品。 自研开源:开源主导企业拥有绝大部分代码 的自主知识产权,同时对该开源项目的技术发展方向具有主导权;对于来自贡献者的源代码,则通过开源许可证/CLA/DCO(开源贡献者协议/权属声明)由主导社区获得知识产权的所有权、授权许可或者管理权,从而实现项目知识产权的自主可控。代表性产品为openGauss、KWDB、MogDB、TiDB等。 易与不易:AI让数据技术应用更简单 在经过漫长的发展历程中,数据库技术左突右奔,博采众长,不断探索,发展出庞大的生态体系。可以借用《易经》的3个原则、从3个角度来看数据库。 1 变易:随着业务应用的发展和多样化,数据类型不断丰富,数据体量爆炸增长,数据库作为数据存储的主体,不断面临新的挑战——从集中式到分布式,从关系型到非关系型,为满足业务需求而不断发展演进。 2 简易:从软件分工体系来看,数据库基础软件承载了数据层的存储和应用的任务,其核心是通过软件功能的不断增强,简化业务应用开发,让业务人员专注业务,让数据人员专注数据。 “信息唾手可得”是比尔·盖茨在1994年提出的一个观点,即在未来可从任何位置提取任意数据。在不同的地点,与会者都可实时浏览、查询并操作相同的信息。信息交换的时间会大为缩短,同时还能随时响应用户的即时分析查询,以支持业务发展。 3 不易:在业务应用中,永远不变的准则是要以敏捷、经济的方式,提供满足业务需的数据基础设施,支撑业务生产运行,同时保障数据安全,连续提供服务,不断探索数据价值。 未来,AI技术将下接数据落地的智能判定,自动选择适宜的数据库存储方式;上接用户需求,按需访问数据给出分析结论。最终实现,让信息唾手可得。 谢谢观看 THANKSFORWATCHING