1|㹊傞侨➩䋑㖞⾊㉁霉⠮-SelectDB 目录 1.研究范围定义1 2.实时数仓市场分析5 3.厂商评估:SelectDB10 4.入选证书14 关于爱分析15 研究与咨询服务16 法律声明17 3|㹊傞侨➩䋑㖞⾊㉁霉⠮-SelectDB 研究范围定义 1.研究范围定义 数字经济时代,企业数据朝着海量、实时化、多样化的趋势演进,数据库管理系统是企业重点关注的数据基础设施之一。在本报告中,爱分析将数据库市场划分为数据库产品、数据库周边工具、数据库服务和数据库安全四个细分市场。 图:数据库市场趋势 从今年的数据库市场趋势看,产品层面,在信创政策不断深化下,数据库国产化替换进程加速,且向核心业务系统渗透。存量市场主要聚焦于事务型关系数据库、分析型数据库市场,尤其是MySQL、Oracle、PostgreSQL等主流技术路线的替换。另一方面,在数字化转型的趋势下,企业业务变化,带来了新兴的数据应用场景,这导致实时数据与非结构化数据占比上升。因此,实时数据仓库以及一些专用数据库,如图数据库、向量数据库、时序数据库等,将在这些新兴的应用场景中发挥优势。 除产品之外,传统数据库厂商退出中国市场,促使用户对数据库配套工具和厂商服务更加依赖。以前,以Oracle、Teradata为代表的传统数据库厂商,其周边工具与服务生态已相对成熟完善,足以支撑企业在数据库使用和运维管理上的需求。但是随着数据库国产化持续推进,新型数据库的落地必然需 要一定的技术服务兜底,并且对数据库的纳管运维带来了一定挑战。另一方面,随着大语言模型在数据技术领域的渗透,“AIforDB”或将带来对数据库运维等能力的重塑。甲方需求与技术发展趋势,使得数据库工具与数据库服务市场的机遇与挑战并存。 针对今年数据库的市场变化,《2023爱分析·数据库厂商全景报告》将对数据库市场需求与供给的发展趋势进行解读,同时对重点细分市场的代表厂商进行能力评估,以便为企业数据库规划与厂商选型提供参考。 本评估报告聚焦实时数仓市场,爱分析遴选出具备成熟解决方案和落地能力的厂商,供企业在做实时数仓厂商选型时提供参考。同时,在该市场下,爱分析重点选取了实时数仓厂商SelectDB进行能力评估。 4|㹊傞侨➩䋑㖞⾊㉁霉⠮-SelectDB 实时数仓市场分析 2.实时数仓市场分析 市场定义: 实时数据仓库是一种能够对结构化或半结构化数据实时存储和计算的数据仓库。与传统数据仓库不同,实时数据仓库支持海量数据的近实时查询,适用于需要快速分析或决策的场景,如自助分析、在线报表等。 甲方终端用户: 企业CTO、CIO、IT部门负责人、科技部门负责人、大数据部门负责人、应用开发人员、数据库管理 员 甲方核心需求: 大数据时代,数据正在发生质的变化,数据体量呈爆发式增长,数据类型也越来越丰富。同时,业务也在面临数字化转型,大量决策需要实时数据作为支撑,在线报表、自助分析等应用逐渐成为企业数字化经营的刚需。海量数据与业务实时化的趋势,对数据仓库的存取性能提出了更高的要求。 然而,传统数据仓库在大数据时代遇到了扩展性与响应速度的瓶颈,难以满足企业对海量数据实时存取的需求。例如,以Teradata为代表的数据库一体机,仅能够支持有限的数据规模,并且价格昂贵。以Hadoop为代表的大数据技术,虽然具备海量数据的存储能力,但是查询性能表现不足,而且其技术组件通常较为复杂,运维成本高。 针对传统数据仓库在实时场景上的能力欠缺,企业需要: 通过海量数据的实时查询与分析,支持数据挖掘与实时决策等场景。随着企业在经营管理中所产生的数据量呈指数级增长,企业希望数据仓库具备海量多源异构数据的处理能力。而且,随着业 务对数据时效性的要求越来越高,实时决策需要通过分钟级的近实时数据作为依据。尤其在交互式分析中,会涉及到即席查询的能力,用户需要灵活自主地组合查询条件,从多个维度对海量数据进行探索分析。 高可用的数据服务。数据是一切数字化应用的基础,稳定可靠的数据服务是企业的基本诉求。另 外,企业需要系统具备一定的机制来应对服务器故障、操作失误等异常场景,无需人工干预即可自动恢复。 此外,部分企业还希望: 数据安全获得保障。金融、央国企等客户出于法律法规监管,以及对客户隐私、商业信息或国家机密的重视,希望获得数据安全保障。因此具备一定安全机制与功能,防止内部或外部的信息泄露威胁,成为这些领域客户的诉求。 得到专业完善的服务。企业希望获得全面的技术支持和咨询服务,无论是关于运维管理、性能优化、安全管控还是其他方面,企业希望可以获得专业指导和建议,以便更好地解决问题和创造价值。 配备丰富的数据仓库工具。企业希望通过数据仓库相关工具,更加高效便捷地使用、管理数据库,尤其在数据导入与运维方面。在数据导入上,一些复杂的数据转换场景,需要借助ETL/ELT工具实现高效灵活的数据导入。在运维管理上,工具在自动化管理、数据安全和可视化监控等方面可以提供非常大的帮助。 在云上部署数据仓库。出于对性能、易用性、成本或安全性等因素的综合考量,部分企业选择在 公有云、私有云或混合云上部署数据仓库,来满足海量数据处理对数据仓库弹性扩展的需求。 厂商能力要求: 基于上述需求,在实时数仓的选型上,企业会重点考虑产品性能、周边工具以及厂商综合实力。具体而言: 厂商产品支持对多数据源实时读取。厂商产品提供实时数据导入,能够对多数据源,如事务型数据库、数据湖或数据流等,进行实时集成。在更理想的情况下,厂商产品支持数据联邦,在不需要对数据进行移动的前提下,对多源异构的数据进行读取,为上层分析与应用提供实时服务。 厂商产品提供高性能的数据存取,在复杂的查询分析场景下能够快速响应。在大数据量下,厂商产品提供适当的存储方式,支持高性能的数据读取。此外,在自助分析、在线报表等场景下,厂商产品要支持简单的点查询、复杂的多维查询以及即席查询等多种的查询分析。尤其在海量数据、多表关联的复杂计算场景下能够快速响应,满足用户实时分析与决策的需求。 具备对数据进行深入挖掘分析的技术能力。厂商需要具备多种数据分析技术,如大数据挖掘与分析技术用于统计分析、商业智能,知识图谱技术用于数据关联关系分析,机器学习、运筹优化等技术用于预测性分析、智能决策。 针对部分企业的需求,厂商需具备以下能力: 厂商提供产品周边工具。厂商提供的配套工具,支持产品的使用或运维需求。例如,ETL/ELT工具支持高效地与数据湖或其他数据源进行连接传输,运维管理工具提供一定的监控与自动化管理能力。 提供专业可靠的服务。厂商要能够依据客户需求,提供前期咨询规划、项目实施与运维管理等方面的服务支持。并且配备专业的技术团队,在数据库运维管理、性能优化等方面提供可靠的指导与建议。 厂商产品具备数据安全保障机制与功能。厂商需要满足金融行业、央国企对数据安全的要求。 例如,厂商产品需要具备用户身份验证和授权机制,限制敏感信息的访问权限;或者,使用数据加密技术对敏感数据进行加密存储,防止数据泄露;另外,安全审计、漏洞管理等能力,也可以更好地满足企业数据安全管理的需求。 厂商产品具备云原生特性。针对企业在云上部署数据仓库的需求,厂商产品具备云原生特性, 能够发挥弹性、扩展性的优势,并且支持公有云、私有云或混合云部署。 入选标准说明: 1.符合市场定义中的厂商能力要求; 2.2022Q1至2022Q4该市场企业级付费客户数量≥10个,或非付费企业用户≥20个; 厂商全景地图: 9|㹊傞侨➩䋑㖞⾊㉁霉⠮-SelectDB 厂商评估:SelectDB 3.厂商评估:SelectDB 厂商介绍: 北京飞轮数据科技有限公司成立于2022年,是一家企业级实时数据仓库产品供应商。秉承着“开源技术创新”和“实时数仓服务”双轮驱动的战略,飞轮科技在大力投入ApacheDoris开源社区的同时,基于ApacheDoris内核打造了聚焦于企业大数据实时分析需求的企业级产品SelectDB及相关解决方案。 产品服务介绍: 定位于“新一代实时数据仓库”,SelectDB主要为客户提供高性能、简单易用的企业级实时数据仓库产品与服务,满足企业场景中对于实时分析的需求。SelectDB产品内核基于开源实时数据仓库ApacheDoris打造,并融入了一系列面向企业级需求的特性。 截止目前,SelectDB已发布了SelectDBCloud和SelectDBEnterprise两款企业级产品,能够分别满足在公有云上和私有化部署的需求: SelectDBEnterprise定位为私有化部署版本,可在IDC、私有云/专有云VPC等客户环境部署,用于服务对数据安全更加敏感的金融、政务等行业客户。 SelectDBCloud定位为云原生版本,目前已上线阿里云、华为云、腾讯云和AWS。 厂商评估: SelectDB产品基于ApacheDoris开发,继承了其极速易用的优势,能够满足企业对实时报表与多维分析、用户画像与行为分析、数据湖联邦分析、日志存储与分析等典型场景的需求。 在此之上,产品层面,SelectDB增加了企业级特性及配套工具,以支持企业对安全、便捷使用与运维等方面的诉求。服务层面,SelectDB提供来自ApacheDoris项目核心开发团队的技术服务,团队成员拥有丰富的数据仓库运维管理经验,以解决企业的后顾之忧。 从产品能力看,SelectDB具备多数据源实时集成、存储、查询的能力,而且性能表现优秀。在数据集成层面,SelectDB能够快速接入来自关系型数据库、消息队列、流/批处理引擎等数据源的数据。同时,SelectDB还提供了对关系型数据库、数据湖、云对象存储等联邦查询的能力,而无需迁移数据。 在向量化执行引擎、全新CBO查询优化器、Pipeline执行引擎、智能物化视图等一系列查询加速的技术优化下,SelectDB能够以毫秒级的响应时间返回海量数据下的查询结果,在点查询、实时报表、即席查询等不同负载下均能够满足企业对实时分析的需求。 从过往的落地案例看,SelectDB分析性能能够有效提升企业实时数据分析的效率,并且简化技术栈。例如,某制造企业基于SelectDB构建了统一的实时数据仓库,摒弃了之前分别服务于在线实时报表和离线即席查询的两套数据架构,架构复杂性与运维成本大幅降低,所消耗的计算和存储资源降低达70%,查询性能实现了近十倍的提升。 SelectDB基于ApacheDoris构建,产品内核稳定、高可用。ApacheDoris经历了严格的测 试流程以及广大开源用户的大规模使用,在互联网、金融等行业有超过2000+企业用户在生产环境中长期运行。与此同时,SelectDB能够为企业提供12-36个月的长周期版本支持,以确保在系统功能快速迭代的同时稳定运行。 SelectDB具备安全可控、运维与使用便捷等优势,满足企业对于数据仓库落地多方面能力诉求。 SelectDB安全可控。在安全方面,SelectDB在从产品架构上提供多种安全保护特性,包含资源隔离、认证鉴权、网络安全、数据保护、安全审计等;同时提供透明化的平台运营服务,客户可自助查看云资源安全策略、获取数仓访问审计日志、审核平台方线上操作视频记录等;此外,SelectDB也认证了安全合规标准,确保数据安全和合规性,目前已获得等保三级、ISO/IEC27001/27017/27018等六项ISO认证,并通过了可信数据库的测评。 SelectDB兼容MySQL协议并配备周边工具,以此降低使用与运维门槛。围绕数据仓库的开发、运维和管理等过程,SelectDB为产品均配备了一系列的可视化运维与开发工具,赋予用户全生命周期的运维管理能力,降低企业人员的使用门槛。此外,SelectDB支持标准SQL并兼容MySQL协议,用户可以使用MySQL客户端、JDBC标准协议以及各类BI产品来连接SelectDB。 SelectDB具备云原生的优