您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[墨天轮]:中国数据库行业分析报告:向量启航,引擎加持(2022年10月) - 发现报告
当前位置:首页/其他报告/报告详情/

中国数据库行业分析报告:向量启航,引擎加持(2022年10月)

2022-10-15-墨天轮自***
中国数据库行业分析报告:向量启航,引擎加持(2022年10月)

向量启航,引擎加持 2022年10月 中国数据库行业分析报告 摘要 2022年10月的墨天轮中国数据库流行度排行榜火热出炉,本月共有245个数据库参与排名,相比上月新增七个数据库,本月排行榜前十名变动较大:达梦数据库上市程序恢复,热度大涨,排名反超openGauss,重回第三;华为旗下两大数据库品牌名次均下降;云原生数据库PolarDB、TDSQL再创佳绩,名次均上升一位。本月排行榜从第十一名至第三十名,竞争激烈,归属变动较大。在这一赛道中,本月也崛起了一批数据库新秀,拥有 亮眼的表现。 本月报告中墨天轮发布了最新向量数据库全球产业图谱,国内典型向量数据库代表有Milvus、Vearch、TensorDB、Om-iBASE等。向量数据库是专门为处理向量嵌入独特结构而构建的数据库系统。它们通过比较值并找到彼此最相似的向量来索引向量,以便于搜索和检索。从技术角度来讲,向量数据库主要解决2个问题,一个是高效的检索,另一个是高效的分析。向量数据库其实就像传统数据去处理一些关系型数据、结构化数据一样,承担的是非结构化数据的低成本存储和高性能计算两大核心能力。具体包括用于搜索和检索的向量索引、单级过滤、数据分片、复制、混合存储以及API功能。向量数据库主要的应用领域如人脸识别、推荐系统、图片搜索、视频指纹、语音处理、自然语言处理、文件搜索等。随着AI技术的广泛应用,以及数据规模的不断增长,向量检索也逐渐成了AI技术链路中不可或缺的一环,更是对传统搜索技术的补充,并且具备多模态搜索的能力。 随着数据库软硬件技术的发展,经典的SQL计算引擎逐渐成为数据库系统的性能瓶颈,尤其是对于涉及到大量计算的OLAP场景。如何充分发挥底层硬件的能力,提升数据库系统的性能,成为近年来数据库领域的热门研究方向,而向量化执行就是解决上述问题的一种有效手段。火山模型的诞生为缓存数据库的内存压力,但该设计并未充分利用CPU的执行效率且以往的火山模型一次处理一个元组的方式造成过大的解释执行代价,阻止了对性能影 响极大的编译优化。2005年《MonetDB/X100:Hyper-PipeliningQueryExecution》的论文首次提出“向量化引擎”的概念,后续国产数据库陆续推出向量化执行引擎,加速OLAP场景的查询分析速度。 乐/知/乐/享同/心/共/济www.modb.pro 目录一、数据库排行榜及前沿动态 content 二、向量数据库的概述与解析 三、向量引擎加持传统数据库 四、向量数据库产品相关案例 乐/知/乐/享同/心/共/济 秋风萧瑟,洪波涌起。2022年10月的墨天轮中国数据库流行度排行榜火热出炉,本月共有245个数据库参与排名,相比上月新增七个数据库,本月排行榜前五名变动较大:达梦数据库上市程序恢复,热度大涨,排名反超openGauss,重回第三;PolarDB上升一位居第五。 2022年10月中国数据库排行榜TOP5 PolarDB作为国产云原生数据库中的佼佼者,本月排名赶超GaussDB这一云上竞争对手。其本月得分下降5.08分,以不到一分的微弱优势排名第五。 TiDB本月得分612.45分,较上月得分环比上涨5.4%。这也是其今年6月重夺榜单第一宝座后,连续五个月稳坐榜首。自2020年1月至今,TiDB已累计霸榜33个月。 OceanBase本月得分584.12分,与第一名得分差距从上个月的44.23分缩小至28.33分。其本月分数涨幅最大,较上月得分上涨8.8%,排名第二。 达梦本月得分较上月上涨20.9分,以556.12分摘得探花。其上月排名被反超后,一直奋力向上,本月排名赶超openGauss。达梦自递交入股申请书后,一直备受关注。 openGauss本月得分较上月仅下降2.37分,排名却下降一位居第四。9月30日,openGauss迎来了里程碑事件,openGauss3.1.0版本正式上线,此版本与之前版本特性功能保持兼容。 乐/知/乐/享同/心/共/济 来源:墨天轮排行榜 2022年10月中国数据库排行榜TOP6-TOP10 AnalyticDB 本月得分较上月下降13.64分,连续13个月蝉联墨天轮排行榜第十名。其是阿里云自主研发的一款实时分析数据库,在云上拥有一席之地。新环境下,AnalyticDB也一直在打磨产品。 GaussDB 人大金仓 TDSQL GBase 其是华为云自研数据库的统一品牌,本月得分435.39分,以不到1分的微弱劣势被反超。9月,GaussDB亮相华为全联接2022·曼谷站,其动向不太频繁,热度上有所降低。 其是成立最早的国产数据库厂商,据太极股份的半年财报,人大金仓2022上半年营收1.23亿、净利润 940万。其本月以4.02分的分数劣势,排名第七。 其是腾讯云企业级分布式数据库,本月得分279.70分,以4.53分的优势领先GBase。近日,腾讯云数据库以其过硬的产品,成功中标中国邮政4年订单。 其是南大通用数据技术有限公司推出的自主品牌的数据库产品。九月,GBase南大通用数据库相继中标成都农商行&自贡银行&泉州银行等多个重点项目。 乐/知/乐/享同/心/共/济 来源:墨天轮排行榜 CTSDB 墨天轮排行榜上时序数据库第三名CTSDB,在整体排名中较上月排名上升三位至第28名。CTSDB是腾讯唯一的时序数据库,其支撑了腾讯内部20多个核心业务。 本月排行榜从第十一名至第三十名,竞争激烈,归属变动较大。在这一赛道中,本月也崛起了一批数据库新秀,拥有亮眼的表现。2022年10月中国数据库新秀得分详情表 KunDB 其是2019年星环科技推出了一款分布式关系型数据库,其本月排名较上月虽未发生变化,但是实力不容小觑。近日,星环科技获得证监会批准,正式进入科创板IPO发行阶段,将成为“国产大数据基础软件第一股”。 MogDB 云和恩墨基于openGauss内核进行增强提升,推出的一款安稳易用的企业级关系型数据库MogDB,本月排名上升两位至第17名,逐渐逼近前十赛道。上个月MogDB力争上游,在市场拓展和生态建设上都卓有成效。 DolphinDB 由浙江智臾科技有限公司研发的一款高性能分布式时序数据库,公司主创团队从2012年开始投入研发,本月排名上升两位至第20名,也是排行榜上排名第二的时序数据库。 StarRocks 北京鼎石纵横科技有限公司于2020年推出的一款新一代极速MPP分析型数据库系统,本月排名跃升六位至第21名。9月24日,年度盛典StarRocksSummitAsia2022顺利举行,9月27日,StarRocks2.3.3重磅发布。 TGDB 腾讯云推出的原生分布式并行图数据库TGDB是排行榜上图数据库第一名。其排名上升两位至第27名。它不仅具备图数据库的优点,还兼具原生图数据库的关联关系深链查询能力和分布式图数据库的数据延展性及计算性能。 乐/知/乐/享同/心/共/济 来源:墨天轮排行榜 2022年9月30日,openGauss3.1.0版本正式上线!openGauss3.1.0版本是openGauss2022年发布的Preview版本,版本维护生命周期为半年。此次发布包含两个数据库服务端安装包:企业版和轻量版。 openGauss3.1.0版本与之前版本特性功能保持兼容,在企业级特性、高可用、高性能、高智能、高安全、工具链、可扩展性七大特性上全面增 强。 集成openLookeng,提供分布式OLAP能力 基于openLookeng实现分布式分析能力,openLookeng复用ShardingSphere中间件的分库分表能力,使openLookeng可以获取openGauss数据进行分析运算。加上ShardingSphere搭配openGauss形成的分布式OLTP能力一起组合成分布式的HTAP能力。 �立即体验:https://opengauss.org/zh/download.html 可扩展性 企业级特性高可用高性能 1.行存表压缩能力增强 2.发布订阅能力增强 3.细粒度滚动升级 4.statement_history视图诊断能力增强 1.两地三中心跨Region容灾 2.CM支持对外状态查询和推送能力 3.DCF(DistributedConsensusFramework,分布式共识框架,基于Paxos算法实现数据同步强一致。)支持策略化多数派 基础算子性能提升 ·新选择率模型典型场景选择率估算准确率、性能提升1X ·分区表页面估算优化典型场景性能提升20%。 ·PartitionIterator算子优化典型场景性能提升5%。 ·函数依赖特性支撑多列查询典型场景行数估算准确率提升1X。 高智能高安全工具链 1.DBMind自治运维平台 构建端到端自治运维平台:新增异常检测能力,完善自监控、自诊断、自调优能力。 2、智能优化器 ·实现库内Bayes网络算法并基于此实现智能统计信息以提高多列基数估计准确度。 ·计划自适应选择解决因数据倾斜等跳变难题。 细粒度Any权限增强 Any权限管理,新增支持5种对象共12种: ·ALTERANYTYPE、DROPANYTYPE ·ALTERANYSEQUENCE、DROPANYSEQUENCE、SELECTANYSEQUENCE ·ALTERANYINDEX、DROPANYINDEX ·CREATEANYTRIGGER、ALTERANYTRIGGER、DROPANYTRIGGER ·CREATEANYSYNONYM、DROPANYSYNONYM 1.MySQL全量迁移性能提升 2.MySQL增量迁移支持事务级并行消费,提升增量迁移性能 3.支持基于默克尔树的数据校验 4.支持openGauss到MySQL迁移,满足MySQL反向迁移要求 乐/知/乐/享同/心/共/济来源:openGauss官网 DOAG2022会议上,Oracle的产品经理GeraldVenzl披露了OracleDatabase23c的一系列新特性。OracleDatabase23c的发布计划已经明确公布,在2022年,Beta版已经开始测试。新版本将在2023年发布,23c是一个长期支持版本。 Oracle23c十小新特性 11g RELEASE2 升级到Oracle23c的路径 01不带FROM子句的SELECT查询 02单表支持4096列 03SCHEMA级别的权限 06Javascript存储过程 07SQLDomains 08DDL的IFEXISTS判断 12c 12c RELEASE3 18c 19c 21c 23c 201920202021202220232024202520262027202820292030203120322033 04Boolean数据类型 05基于别名和位置的GROUPBY 09数据库对象增加注释 Extended WaivedExt. 19cLongTerm 21cInnovation 版本发布周期计划 10标准的表值构建 Beta Extended 23cLongTerm 乐/知/乐/享同/心/共/济来源:墨天轮、DOAG2022会议 VLDB2022于9月5日召开,VLDB(VeryLargeDataBase)作为数据库领域的三大顶级国际会议之一,是面向数据库研究人员,内核开发人员,开发商以及用户的年度国际会议论坛,代表数据库系统领域最杰出的研究和工程进展。VLDB2022会议中共有336篇国内外论文入选,其中中国贡献115篇,占比超过1/3。由于单篇论文有多个作者,来源地不同,以下数据含重复计数。 国内外收录论文数分析 国产数据库厂商被收录论文数 快手2 国外收录论文主要来源单位 221 115 字节4 百度1 美团1 华为4 腾讯4 PingCAP1 Zilliz1 OceanBase1 Alibaba 数量 2523 20 15 108 5 0 Meta