AI智能总结
周明宏SelectDB高级研发工程师 DataFunSummit#2023 目录CONTENT 重塑 为什么我们要重做Doris优化器 以统一的视角重新理解优化的规则 挑战理论上很完美,但是。。。 突破性能瓶颈的两个小故事 01重塑 Nereids:新一代优化器 01缺少优化规则的抽象 不方便细粒度控制规则使用,不方便query调优增加优化规则的额外成本高不能查看规则优化后的plan 02缺少CBO框架 没有统计信息收集框架统计信息推导能力不足代价模型代码零散没有逻辑代数的枚举,只能做有限的CBO 03树的遍历 只有两轮bottom-up的遍历无法实现对有循环依赖的规则无法实现一些需要改变底层节点的规则 Nereids:我们Doris 2.0见 在ssb、tpch 500G/1T测试中超越人工改写sql 用户POC测评中性能远超老优化器 02优化的本质 DataFunSummit#2023 SQL的本质--描述性语言 一条SQL的旅程 一条SQL的旅程 什么是优化 优化举例尽早降低数据规模 中美贸易详情(TPC-H q7) 优化举例尽早降低数据规模 Joinreorder 动态规划 DPSizeDPSubDPhyperCascading.... Nereids Cascading +DPhyper 03性能瓶颈 两次重要突破 02CostAndEnforce优化 01rewrite重构 节约MemoCopyIn/CopyOut 对复杂query提升两个数量级 04挑战 公平与效率 Bushy 公平与效率 Cascading 表数量较少,比如少于5 DPhyper 表数量较多 与误差共存 假设:均匀分布,字段相关性...qError 颠覆者Runtime Filter 找出“华为”品牌下商品的订单 颠覆者Runtime Filter 找出“华为”品牌下商品的订单 颠覆者Runtime Filter 颠覆者Runtime Filter 如何加入Apache Doris社区 订阅开发者邮件组 订阅社区开发者邮件dev@doris.apache.org并参与社区的邮件讨论中 双周开发者会议(线上会议) 通过会议链接参与到社区开发者双周会:https://meeting.tencent.com/dm/6iQBgkIhn5LO DorisImprovementProposals(DSIP)通过DSIP查阅社区核心功能设计方案及相关进展:https://cwiki.apache.org/confluence/display/DORIS/Doris+Improvement+Proposals 欢迎关注: 欢迎关注SelectDB微信公众号获取最新活动资讯、技术解析、社区动态公司邮箱:support@selectdb.comSelectDB官网:www.selectdb.com 欢迎关注Apache Doris GitHub &官网 ApacheDorisGitHub:https://github.com/apache/dorisApacheDoris官网:https://doris.apache.org/ 感谢观看