您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:数据库国产建设方案实践 - 发现报告
当前位置:首页/其他报告/报告详情/

数据库国产建设方案实践

2024-08-19腾讯F***
数据库国产建设方案实践

数据库国产建设方案实践 于沛涛 腾讯云数据库产品架构师 TDSQL发展历史 1.0时代: 支撑内部应用的产品数据库 2.0时代: 承接互联网洪峰的云数据库 3.0时代: 云上云下架构同源的国产数据库 TDSQL1.0发布 应用于财付通 TDSQL上线公有云 18年开始国产替代,TDSQL首批完成信通院分布式事务数据库标准测试产品 政府、银行开始大规模国产替代 在全行业开启全面替换 2019年 2002年2007年2012年2015年2017年2018年2020年2022年2023年 数据库团队成立 TDSQL金融级分布式数据库发布,在腾讯内部大规模使用 互联网客户突破1万个 首个传统银行核心采用国产数据库 银行核心:全国第一 首个国有大行核心采用国产数据库 TDSQL在各行各业已经被广泛使用 目前TDSQL可基本满足银行核心交易类系统的国产替代,达到国产数据库产品中最高级别评估。 TDSQL被广泛选择的原因 TDSQL首批通过《安可》和《政府采购标准》,是满足信息技术融合创新标准的国产数据库 •首批通过集中式数据库安可认证•代表国家认可的供应链安全可靠,不受制裁影响 •财政部发文并配套附件提出数据库要求标准 •工信部直属机构组织测试并出具报告 •集中式+分布式均通过认证 TDSQL是腾讯集团的战略产品,支撑微信等国民应用,有极强的持续运营能力 可持续运营的国产数据库 坚持自研 TDSQL提前10年布局自研能力 坚持走自研路线 •2013年开始,腾讯就提出“自研产品”的布局,TDSQL 已经持续布局10年之久,目前已投入研发人力上千人。 •掌握软件全部代码,原理、文档。 •掌握产品全部版权、商标和专利,无知识产权纠纷。 内部支撑应用 TDSQL连续多年入选集团财报 外部支撑应用 TDSQL企业级服务阵型,保证期提供可靠服务 高质量的服务团队 全方位交付/运维保障 完善的产品资料库 业务调研、高低阶设计 TDSQL已和多家国产软件厂商进行了深度 应用适配迅速,改造周期短 7大类体系文档,应急类,变更类、安装类, 扩容,备份类等。 15+自动化运维场景。 29+运维方案设计。 数据库团队规模: 产研团队1000+,650+研发,44%硕士以上学历。研发投入10亿+/年。 交付、运维、培训超3000+。全栈专家超过 200人。 交适配(例如:神马、 付长亮、宇信等)。 项目支持阵型 上线流程梳理、预演、评审 阶改造适配工作前置, 数据库技术赋能 运维部署手册 应用部署集成手册 段不占项目时间 技术服务能力 运维阶段 监控指标文档 组件监控手册 3分钟内问题响应 TDSQL安全加固手册 产品资源需求文档 7*24小时技术支持 紧急问题:研发能快速到场支持问题处理。 分布式开发文档 数据迁移手册 30min内故障恢复 应急处理手册 数据库设计文档 原因:全国六大研发中心,满足一二线城市支持响应。 到场支持(重保or故障) 赤兔系统使用手册 操作系统安全加固 TDSQL架构云上云下同源,是拥有最大“练兵场”的国产数据库,做质量优先的可靠国产数据库 架构云上云下同源,使得国产数据库质量得到保证 私有云 功能兼容性 长稳性能回归 客户场景演练 可用性沉淀 可靠的国产数据库 质量 至少 15天 至少 1000客 户 公有云 至少 20+地 域 至少30万实例 安全性 30万+ 实例 架构同源性能可靠 可靠性 自有集群 专有集群 公有集群 TDSQL拥有世界领先的事务处理能力, 优异的性价比,也符合“降本增效”的大方向 ①超大规模集群,性能稳定性最佳 构建了业界最大的分布式数据库集群(1650台),性能刷新世界记录(8.148亿tpmC),平均时延和90分位时延领先其他厂商。 在30小时的持续压测过程中,tpmC的波动率一直处于0.2%以下(标准是要求2%以内)。 ②卓越的高可用和分布式容灾能力 1个小时的容灾场景测试,进行了2次随机断电物理机器和1次destroy腾讯云实例的模拟故障,模拟故障之后,18秒完成HA切换,大盘整体影响微乎其微。 ③非常显著的成本优势(性价比) 通过持续的软硬件协同,自动化,规模化的运营能力,使得单tpmC的价格接近同类产品的1/3。 TDSQL强大的智能化管控、运维系统。极大提高管理人效,降低运维门槛 构建完善的智能化数据库生态系统,提供一站式的运维解决方案 4万+ 实例/人 8个人运维 30万+的线上实例 提供数据库自治云服务能力 数据库实时监控告警 会话实时管理与空间探查 全方位诊断优化 智能巡检与健康报告 支持全量数据审计,便于溯源 支持多种资产场景全量数据审计 提供周期性的统计报告 为数据库安全提供更为精准的威胁分析和告警 提供完善的数据库安全审计能力 DBbrainDBbridgeTDSQL 生态 T-Sec CloudDBAssistant 提供一站式迁移解决方案 支持多种关系型数据库数据库迁移 构建数据库容灾架构 实时数据传输为下游提供数据分析 数据互联互通,数据治理等 监控指标智能分析 Q&A机器人 提供数据库运维知识库 帮助学习数据库基础知识等 利用AI赋能数据库运维管理 TDSQL智能化运维平台 TDSQL有优秀的Oracle、SQLServer兼容能力,且在多个核心复杂系统经过验证 96% OracleSQL兼容性 TDSQL2024年H!1 测试用例分类 TDSQL的Oracle兼容性能力已经达到 OLTP性能(TPCC) 并轨兜底方案 168万tpmC 95% 0.3小时 HTAP性能(多表关联) 96%,持续迭代中。 产品支持 多节点读写分离 HTAP性能 (TPCH1T) 4min 95% SQLServerSQL兼容性 TDSQL2024年H!1 测试用例分类 TDSQL的SQLServer兼容性能力已经达到95%,持续迭代中。 运维:为DBA提供智能化、精细化的运营特性 •秒级更改列:需要对数据量大的表进行更改列操作场景 •SQL限流:针对某些并发量大、占用资源、导致数据库性能下降的SQL限流场景 •异步删除大表:该功能主要用于删除数据文件很大的表,避免IO的抖动。 •闪回查询:误操作需要快速恢复业务等场景 业务:提供强大的内核能力,保证性能最佳特性 •并行查询:大表查询、报表统计或者其他分析查询等 •大事务复制:对row模式下存在大事务,复制较慢的场景 •计划缓存点查优化:对于线上短小点查询较多,且使用preparestatement模式时,应用有性能上的提升 TDSQL经过多年的内核积累, 客户:有符合各个行业的实用关键特性 •热点秒杀:电商,游戏等需要频繁热点更新场景 •安全审计:金融等行业有审计的需求场景 •透明数据加密:银行、保险等对静态数据加密合规性要求 •字段压缩:日志记录、传输数据量大需要压缩等场景 有大量独有且符合各个行业的实用 优化分类 内核能力项 TDSQL内核能力特性 功能类特性 热点秒杀 拆锁降冲突,高并发写入性能提升15% 功能类特性 安全审计 审计能确保实例性能近乎不受影响,性能损耗最高仅有不到3% 功能类特性 透明数据加密 KMS采用的是两层密钥体系,涉及两类密钥,确保数据在内存和文件中都进行加密 功能类特性 列压缩 针对大字段压缩效果4倍以上压缩比,能显著节约内存和磁盘空间 性能类特性 并行查询 利用并行查询能力,调动多核计算资源,大幅缩短大查询响应时间 性能类特性 大事务复制 update场景复制时间减少85%,insert场景减少约30% 性能类特性 Binlog组提交锁 全局锁改局部锁,高并发写入性能提升19% 性能类特性 计划缓存点查优化 对点查的SQL,延迟性能提升20%-30%,吞吐性能提升20%-30% 运营类特性 秒级更改列 只会在数据字典表中记录列修改信息,避免更改列时做的数据拷贝 运营类特性 SQL限流 通过关键字的设置,限制特定SQL同一时间内可并发执行的并发度 运营类特性 闪回查询 仅需通过简单的SQL语句即可查询误操作前的历史数据,从而保障业务快速恢复运行 运营类特性 异步删除大表 在删除表时,为表的数据文件在另外一个目录中创建一个硬连接 TDSQL基于代价路由的HTAP能力,真正的“记、算”一体 智能计算引擎与行列混存架构 SQLEngineSQLEngineSQL TDSQLHTAP的性能处于第一梯队水平 TP处理层 Master1 行 Master2 行 AP插件 HTAPNode Engine TDSQL 5+ 能力突破 10x 导入导出效率 TDSQLHTAP 数百倍 混合负载查询性能 式式CDC列式 存存存储 储储 可插拔式分析引擎,灵活高效 ReplicationReplicationReplication Slave 行式存储 Slave 行式存储 Slave 列式存储 数据压缩和冷热分层,降低成本应对海量并发和吞吐,性能提升 在线业务 实时 分析 复杂 数据跑批交易对账 数据可视化数据分析 数据归档深度分析 •通过复杂语句列存加速,授信系统跑批时间,由之前3小时降低到1h20分钟 •通过HTAP智能优化器,所有SQL均未调优,直接迁移上线,极大降低迁移成本 •通过混合负载支撑能力,解决财务系统中复杂事务处理难题(3亿数据性能提升100倍) 支付业务用户信息订单信息消息业务交易业务账户系统 TDSQL独立软件部署,依托腾讯云全栈技术支撑, 在操作系统、网络、存储都有强大的开发力量和深厚积淀 Application 应用优化:配置调整、热点函数优化等 TPS提升~14% Compiler 编译优化:循环优化、LTO、PGO等 Kernel VirtualMemory NetworkStack FileSystems ThreadScheduler 系统参数调优:NUMA内存自动均衡、网络中断重绑定、开启/关闭网络RPS、利用HugePages等 CPU使用率降低~30% ARM平台提升~34% Hardwares 软硬件协同优化:充分利用CRC32、LSE、AVX等硬件特性ARM平台(鲲鹏)提升~57% x86平台(海光)提升~135% 案例 某国有大行的操作系统优化案例: •麒麟操作系统在arm平台下,tcp_mem默认设置过小,最终设置和x86架构一致; •麒麟操作系统sssd服务存在bug,proxy监听socket换成unix类型,导致proxy连接不上,最终麒麟操作系统修复bug; 腾讯云TDSQL+TENCENTOS一体化全栈解决方案 全栈自主创新数据库解决方案操作系统级优化方案 -收益- •TDSQL+TencentOS+自主创新硬件 •搭建鲲鹏自主创新数据库实验室 •搭建海光自主创新数据库实验室 •业内独创NVME软RAID解决方案 •XFS写入性能提升20%+ •数据库预热时间优化30%+ •内存节省15%,OOM概率减少80% 30% 数据库整体性能提升 15% 内存节省 打破TPC-C 世界纪录 TDSQL+TencentOS组合性能 某国有大行案例 节约成本: 使用X86的+TDSQL的成本比使用小型机+Oracle+存储成本显著下降; 分布式架构: 从单元化+微服务的分布式架构结合分布式数据库,重构业务系统,支持业务水平扩展,双活高可用,提升业务敏捷性; 自主创新: 部分业务采用ARM服务器+麒麟OS+TDSQL全栈国产,稳定运行1年时间; 性能提升: 大部分业务的CPU使用率降低到30%以下,同比业务指标显著提升; 腾讯云数据库愿与大家共同携手,为中国数据库创新 添砖加瓦,协同共进 自主·创新·引领 Thanks