目录 2022年度技术盘点 争相上市、抢夺本土市场,未来三五年数据库将迎来大洗牌|解读数据库的20221 解读数字化的2022:不再追求大而全的“军备竞赛”,用聚焦来提高转型“成功率”16 直面成本“刺客”、拒绝繁杂技术花样,压力之下云厂商改变方向|解读云原生的 202231 市场增速超20%,国产操作系统“浴火重生”|解读操作系统的202254 取代搜索,“干掉”艺术家?顶流「AIGC」的疯狂与争议|解读AIGC的202269 解读Go语言的2022:泛型时代开启87 大数据管理工具走向更易用与专精,但中外发展现状存在明显差异|解读大数据的 2022118 奇点已来,推进AllonServerless有哪些困难、如何破局?|解读Serverless的 2022130 微服务虽已老生常谈,但生命力超出不少人想象|解读微服务的2022139 2023,可观测性需求将迎来“爆发之年”?|解读可观测技术的2022152 数据烟囱亟需打破,云原生融合数据库雪中送炭|解读云原生数据库的2022166 从大前端“穿越”到终端,开发者应该必备什么技能?|解读终端的2022176 展望技术人的2023 降本增效的大环境下,该不该砍掉测试工程师?|展望测试工程师的2023198 一个架构师在2023年需要掌握哪些“必杀技”?209 展望后端研发工程师的2023:“后端难学”源于知识体系匮乏,面试时这三点是加分 项225 寒冬未散,手里没点“必杀技”,怎么翻过浪浪山?|展望数据库工程师的2023239 从JS到全生态,云原生时代下的前端成长演进之路|展望前端工程师的2023262 技术人穿越周期的生存之道是转型管理?|展望技术管理者的2023290 卷首语 作者:蔡芳芳 热热闹闹的InfoQ2022年度技术盘点与展望,已经到了尾声。 在这场盘点中,InfoQ编辑部全体编辑同学,细数了操作系统、数据库、AI、大数据、云原生、架构、大前端、编程语言、数字化、可观测等超过十个方向,同时,围绕 “不同岗位的技术人,2023年可能需要聚焦什么方向、什么技能、做好哪些准备”邀请专家进行直播对话,同时收集了数十条社区提问,在线反馈给专家们。 在这场盘点中,我们收获了关于技术圈的2022、2023的许多精彩观点和认知,比如: 2022,标准化、国产化、DevSecOps、云原生网关、Proxyless、统一控制面和多语言,正在给微服务带来的新的市场机遇; 2022,eBPF成为当下最火的技术之一,为操作系统内核提供了新的可能性;从生态繁荣程度上来看,RISC-V生态正处于增长关键期;当前国产移动操作系统还处于准备期,离带动整个产业发展还有一定的距离,但离成熟期也并不遥远; 2022,容器的“黑盒”打开,混部带来效率提升,备受企业欢迎;Serverless基于容器完成标准化,开启应用“元年”;降本增效大主题下,FinOps理念得到快速发展;越来越多传统行业开始应用云原生技术; …… 2022年度技术盘点 争相上市、抢夺本土市场,未来三五年数据库将迎来大洗牌|解读数据库的2022 作者:李冬梅 本文是“2022InfoQ年度技术盘点与展望”系列文章之一,由InfoQ编辑部制作呈现,重点聚焦数据库领域在2022年的重要进展、动态,希望能帮助你准确把握2022年数据库领域的核心发展脉络,在行业内始终保持足够的技术敏锐度。 特此感谢JagsRamnarayan、Pater、MichaelCahill、孙元浩、陶建辉、杨传辉 (花名日照)(按姓名首字母排序)对本文的贡献,他们的真知灼见,是本文能与大家见面的关键。 对于数据库技术领域而言,2022年是一个激动人心的重要年份。过去一年,数据库技术仍围绕着云原生、Serverless、分布式等核心方向快速发展,但是相较于前几年,数据库市场的客户逐渐成熟,对产品的理解更加理性,相应地要求也越来越高。不难看出,数据库领域的发展已经步入深水区。 如果说过去数据库厂商们把更多的注意力聚焦在框架和架构搭建上,那么2022年,则进入了对数据库性能、成本、易用性等细节打磨的阶段,开始了对性能的极致追求。 2022年数据库领域大事件回顾 1月21日,北京国家金融科技认证中心正式发布《2021年分布式数据库标准符合性检测参检机构名单》,腾讯云分布式数据库TDSQL名列其中,成为首款通过检测的互联网公司数据库产品。 2月11日,Elastic8.0版本正式发布,重点改进Elasticsearch的矢量搜索功能,并提供对现代自然语言处理模型的原生支持、进一步简化数据上线过程,以及精简的安全防护体验。在速度、扩展幅度、相关性和简便性方面,Elastic8.0版本迎来了一个全新的时代。 2月17日,由信通院主办的国内首款金融数据库性能测试工具开源发布会在线上召开。会上正式开源了金融数据库性能测试工具DataBench-T。 4月1日,TiDB宣布正式开源分析引擎TiFlash,它是为TiDB提供HTAP能力的重要组成部分。TiFlash的框架代码基于ClickHouse,但和ClickHouse拥有完全不同的擅长场景,TiFlash完全偏重于事务性数据的分析。 4月,星环科技升级多模型大数据基础平台TDH9.0,实现9种存储引擎支持10种数据模型。 4月27日,Redis正式发布7.0版本,添加了近50个新命令和选项来支持这种演变并扩展Redis的现有功能。 5月12日,在谷歌I/O2022开发者大会上,谷歌云平台GCP宣布推出AlloyDBforPostgreSQL,这是一个全托管的、与PostgreSQL兼容的数据库服务。 5月16日,在中国信通院组织的第十四批“可信数据库”产品能力评测中,华为云云数据库GaussDB(foropenGauss)完成信通院首个防篡改数据库产品测评。 6月8日,MongoDBWorld2022大会上,MongoDB宣布推出可查询加密功能和关系型数据库迁移工具(RelationalMigrator),借助这项技术,不具备密码学相关经验的开发者可以在不影响性能的情况下,以简单直观的方式查询经加密的敏感数据。 6月29日,武汉达梦数据库股份有限公司正式递交招股说明书,拟科创板挂牌上市。根据招股说明书,达梦本次公开发行股票数量不超过1900万股,计划募资23.51亿元。 6月29日,一体化实时HTAP数据库StoneDB正式开源。StoneDB是一款支持行列混存+内存计算的HTAP数据库,采用自主研发的存储和计算引擎,可将MySQL 的分析性能提高100倍。 7月23日消息,蚂蚁集团时序数据库CeresDB正式开源,并发布开源版本CeresDB 0.2.0。蚂蚁集团表示:“通过开源,希望帮助用户解决时间序列数据存储的水平扩展与高可用的痛点,乃至针对时序数据的复杂分析计算能力的需求”。 8月10日,OceanBase4.0(小鱼)正式发布,这是业内首个单机分布式一体化数据库,可以实现单机部署并兼顾分布式架构的扩展性与集中式架构的性能优势,RTO从30秒迈入8秒,进入真正的秒级容灾时代。发布会还宣布全球开服OceanBaseCloud。 8月13日,涛思数据发布TDengine3.0版本,该版本带来了几大核心特性,包括云原生架构、流式计算,还增强了数据订阅功能;更重要的是,3.0系列版本开始提供了全平台支持,服务器/客户端均已支持Linux、Windows和MacOS。 10月18日,“国产大数据基础软件第一股”星环科技正式登陆科创板,发售价为每股 47.34元,开盘后报每股72元,大涨52%。 10月18日,Oracle宣布推出MySQLHeatWaveLakehouse云数据湖库。据Oracle称,MySQLHeatWave可以在多个云上提供一种集成服务,用于事务处理、跨数据仓库和数据湖的分析、以及无需ETL的机器学习。 11月,MariaDB团队宣布正筹备在中国成立实体公司,并积极准备拓展中国市场。明年,MariaDB将有一个专门的本地团队为中国市场服务,并将发布新产品,如Xpand(MariaDB的分布式SQL数据库),此外,MariaDB团队还计划将云版本SkySQL引入中国市场。 12月19日,MariaDBPlc.公司表示,已经完成了与特殊目的收购公司AngelPondHoldingsCorporation的合并,合并后的公司更名为MariaDBPlc.。MariaDB的普通股和权证已于12月19日登录纽约证券交易所,此次合并已获得两家公司董事会和股东的批准。 数据库领域年度关键词 数据库并不是一个新领域,它已经发展了40年,作为基础软件之一,它是一个既传统又古老的领域。但近几年数据量爆发、云化趋势加深等因素,正在推动数据库领域进入新的发展阶段。 InfoQ在采访国内外多名资深数据库专家后得出了2022年数据库领域的三大关键词,其中,“融合”一词成为了被提及次数最多的词语。 融合 这里的提及的“融合”不仅仅指的是数据库各种类的融合,更包括软硬件融合、混合负载融合、分布式与单机的融合、多模态的融合等,但实际上融合问题并不好解决。 比如,软硬件融合就是个难题。数据库经历了多年发展,其底层架构和算法针对过去的硬件网络等基础设施经过充分设计,以获得最佳性能,但是随着新型硬件的发展,例如新CPU架构、新存储介质,以及新网络架构的发展与成熟,数据库底层机制也必须有相应的调整,才能充分发挥新硬件的特性。 此外,分布式与单机的融合也有一定技术难度。单机数据库相较于分布式数据库,由 于不需要大量的分布式事务处理,所以单核性能会高于分布式数据。但是数据库面临的市场是一个复杂多样的市场,有一些场景可能一个单机数据库就能支持,用分布式显然有点“大材小用”,但是有一些场景又需要分布式数据库以支撑海量数据和海量交易。那么如何在数据库规模比较小的时候,表现为一个单机数据库,不需要复杂的分布式事务机制,而随着数据规模增长,又能自动生长为一个分布式数据库,而不需要大规模的数据库迁移等,就是一个必须考虑的关键问题。 以TDSQL为代表的多家厂商开始尝试采用对等架构实现存算分离与存算一体的兼顾,使数据库产品能兼顾不同规模的场景,取得不同的平衡;而OceanBase则推出单机分布式一体化架构,打造更加开放、灵活、高效、易用的下一代企业级分布式数据库。实现了在线水平扩展的同时不增加分布式相关overhead,从而能够像集中式数据库一样部署在小规格的服务器上,做到单节点性能达到甚至超越集中式数据库的水平。 AI与数据库的融合也在进一步加深。进入2022年以后,AI和数据库融合趋势愈加明显,AI已经成为企业挖掘数据商业价值的最大推动力。过去,企业数据可用性不高,样本容量也有限,无法在毫秒内分析大量数据;而人工智能和机器学习技术,让企业在数据容量和数据源可用性方面有了质的飞越,才有了真正的大数据访问和实时处理能力。 大统一是诸多自然科学领域的最终梦想,而数据库的大融合也是数据库从业人员的梦想,但是这里面往往涉及到诸多因素的权衡,以及要面临越来越复杂多样的场景,现阶段还很难做到完美的统一。 数据云 数据云也是今年被频频提及的关键词之一,它更多是一个数据基础设施的概念。从技术的角度来讲,数据云是为了提升整个数据分析能力,提升数据分析的实时性;从业务角度来讲,数据云可以帮助数据库厂商在云上拓展更多不同客户。 可以看到,今年很多开源数据库产品都发布了自己的Cloud版本,也就是云服务订阅版本,包括TiDB、OceanBase、SelectDB、TDengine等等国内知名数据库厂商。这无疑是开源数据库产品探索商业化一个比较好的路线。相较于云厂商凭借数据库的深度软硬件协同提供产品竞争力,开源厂商基于多个云平台提供的多云容灾切换方案,也有一定的市场发展空间。 Serverless 这几年,Serverless数据库