行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

PostgreSQL新特性介绍

信息技术 2024-09-25 - CPA Zt

查询优化器的改进

聚合效率提升：PostgreSQL 16 对查询优化器进行了改进，提升了聚合操作的效率，具体细节未在摘要中展开。
支持Right Anti Join：从 PostgreSQL 16 开始，查询优化器开始支持 Right Anti Join，能够自动以较小的表构造 hash 表，优化查询性能。示例中，对比了 PostgreSQL 15 及之前版本与 PostgreSQL 16 在处理 Right Anti Join 时的差异。
并行full和right连接：PostgreSQL 16 开始支持并行执行 full 和 right 连接，进一步提升查询性能。示例中，对比了 PostgreSQL 15 及之前版本与 PostgreSQL 16 在处理并行 full 和 right 连接时的差异。

逻辑复制的增强

standby节点逻辑复制：数据下游可以通过备节点订阅数据修改，从而降低主库的工作负载。配置步骤包括：
1. 主库创建流复制和逻辑复制用户。
2. 搭建流复制备库，指定相关参数。
3. 数据下游创建订阅，将订阅地址指向备库。
双向逻辑复制：双向复制可以扩展主库的访问能力，特别适合写入密集型应用。配置步骤包括：
1. 两个主库创建逻辑复制用户。
2. 两个主库分别创建发布。
3. 两个主库互相订阅对方（设置 origin=none 标志）以避免数据回环。
避免回环：通过在订阅者上设置 origin=none 标志，发布者只会发送未包含 origin messages 的 WAL 记录，避免数据回环。

其他一些感兴趣的点

pg_dump的增强：
- 对子表和分区表的支持。
- 新增 lz4 和 zstd 压缩算法（-Z 选项），提升压缩效率。
- 增加压缩 long 模式支持，提供更多压缩级别（压缩比越高，耗时和资源占用越多）。
direct_io（开发特性）：
- 解决操作系统 page cache 和数据库 buffer pool 双缓存导致的内存浪费问题。
- 支持参数：debug_io_direct-wal_init（新建 WAL 文件时使用 direct io）、wal（读写 WAL 文件时使用 directio）、data（读写数据文件时使用 directio）。
- pgbench 测试显示，使用 direct_io 可显著提升性能。
pg_stat_io：
- 跟踪给定后端类型、I/O 对象类型（是否为临时表）和 I/O 上下文的统计信息。
- 主要统计数据包括读、写和扩展操作，以及以字节为单位的大小。
- 还会跟踪共享缓冲区移出、环形缓冲区重新使用和 fsync 调用的数量。

CONTENTS 查询优化器的改进01. 逻辑复制的增强02. 其他一些感兴趣的点03. 查询优化器的改进-聚合的效率提升来源：https://www.citusdata.com/blog/2024/02/08/whats-new-in-postgres-16-query-planner-optimizer/#distinct-queries 查询优化器的改进-支持Right Anti Join 开始支持Right Anti Join，会自动以较小的表构造hash表 CREATE TABLE small(a int);CREATE TABLE large(a int);INSERT INTO smallSELECT a FROM generate_series(1,100) a;INSERT INTO largeSELECT a FROM generate_series(1,1000000) a; 15及之前版本 16版本来源：https://www.citusdata.com/blog/2024/02/08/whats-new-in-postgres-16-query-planner-optimizer/#distinct-queries 查询优化器的改进-并行full和right连接开始支持Right Anti Join，会自动以较小的表构造hash表 CREATE TABLE odd (a INT);CREATE TABLE even (a INT);INSERT INTO oddSELECT a FROM generate_series(1,1000000,2) a;INSERT INTO evenSELECT a FROM generate_series(2,1000000,2) a; 15及之前版本逻辑复制的增强-standby节点逻辑复制数据下游可以通过备节点订阅数据修改从而降低主库的工作负载。逻辑复制的增强-standby节点逻辑复制 standby节点逻辑复制配置 1 主库创建流复制和逻辑复制用户 2 搭建流复制备库，指定一些参数 3 4 数据下游创建订阅，将订阅地址指向备库逻辑复制的增强-双向逻辑复制双向复制可以扩展主库的访问能力，对于写入密集型的应用更加友好。逻辑复制的增强-双向逻辑复制避免回环通过在订阅者上设置origin=none标志，发布者会只向订阅者发送那些没有包含origin messages的WAL记录，而不会发送本地的订阅者接收到的记录，从而避免数据回环。逻辑复制的增强-双向逻辑复制双向逻辑复制配置 1 两个主库创建逻辑复制用户 2 两个主库分别创建发布 3 两个主库分别互相订阅对方（设置origin=none) 其他一些感兴趣的点-pg_dump的增强 pg_dump增强对子表和分区表的支持增加新的压缩方式 pg_dump添加了导出子表和分区的功能 pg_dump的-Z选项新增了lz4和zstd压缩算法，压缩效率得到了提升增加压缩long模式支持增加更多的压缩级别 pg_dump可以拥有更多的压缩级别级别越高，压缩比越高，但是可能也更耗时和占用更多资源 long可以提高压缩比，但代价是增加了内存使用其他一些感兴趣的点-direct_io（开发特性）目前的问题：操作系统page cache和数据库buffer pool双缓存,存在一定的内存浪费开始支持dio，参数debug_io_direct-wal_init:新建wal文件时使用direct io-wal:读写wal文件时使用directio-data:读写数据文件时使用directio pgbench测试（1000万数据）其他一些感兴趣的点-pg_stat_io 跟踪给定后端类型、I/O对象类型（即是否为临时表）和I/O上下文的统计信息。主要统计数据是计算I/O操作：读、写和扩展。对于每个I/O操作，以字节为单位的大小，以帮助解释统计信息。此外，还会跟踪共享缓冲区移出、环形缓冲区重新使用和fsync调用的数量。 THANKS www.postgresqlchina.comSpeaker name and title

点击免费查看完整报告

PostgreSQL新特性介绍

查询优化器的改进

逻辑复制的增强

其他一些感兴趣的点

你可能感兴趣

云数据库 RDS 产品特性介绍

PostgreSQL17 RC1新特性体验

5G终端芯片及测试仪表新特性产业指数报告

基于PostgreSQL逻辑复制和CDC实现企业级分布式系统

易景科技（张震：PostgreSQL数据库在中国的发展

PostgreSQL如何利用可计算存储降本增效

在Linux和Windows下PostgreSQL运维避坑

MogDB中MySQL兼容性——PostgreSQL体系下的多语法解析器实现

艾超：TDSQL for PostgreSQL监控架构演进思路

全面解读State of PostgreSQL 2023报告