登录
注册
回到首页
AI搜索
发现报告
发现数据
专题报告
研选报告
定制报告
VIP权益
发现大使
发现一下
热门搜索:
新能源车
AIGC
Chatgpt
大模型
新质生产力
低空经济
当前位置:首页
/
行业研究
/
报告详情
/
1-3 Apache Doris存储层向量化改造设计与实现
电子设备
2022-07-19
DataFunSummit2022:大数据存储架构峰会
艳***
AI智能总结
查看更多
Apache Doris存储层向量化改造设计与实现
1. Apache Doris引擎介绍
OLAP数据库
:支持离线和实时场景的数据分析,使用SQL语言。
向量化编程
:利用计算机提供的SIMD指令和SIMD寄存器,实现批量计算。
2. Apache Doris存储层概览
磁盘数据处理
:数据存储经过压缩,在磁盘上进行解压和归并排序。
主键更新
:通过文件合并实现数据更新。
数据流
:从磁盘读取数据,通过缓存读取加速,进行谓词下推优化。
3. Apache Doris存储层向量化改造
改造目标
:优化数据读取、谓词下推、数据输出和数据归并。
具体措施
:
梳理代码
:识别可向量化代码。
向量化改造
:使用SIMD指令替换原有逻辑。
优化无法向量化部分
:考虑其他优化方法。
4. 性能优化技术
定长与变长类型
:
定长类型
:基本类型,支持批量处理。
变长类型
:如字符串,不支持批量处理,需要额外优化。
谓词下推
:延迟物化以减少seek次数。
延迟物化
:基于代价评估选择是否延迟物化。
5. 性能测试结果
定长类型
:存储层性能提升60%,SQL提升50%。
变长类型
:存储层性能提升50%,SQL提升30%-40%。
6. 总结
性能优化策略
:
理解代码和计算机行为。
使用性能工具。
社区参与
:加入Apache Doris社区,贡献代码和测试。
你可能感兴趣
1-4 BookKeeper:Apache Pulsar的存储实现
信息技术
DataFunSummit2022:大数据存储架构峰会
2022-07-19
【电报解读】微软正在开发英伟达网卡的替代品,服务器改造、云计算、存储需求将是未来行业增长点,这家公司网卡芯片已实现小批量出货-20240221
未知机构
2024-02-22
2023区块链数据层安全与隐私保护设计指南
CSAGCR
2023-03-17
【研选】年初降准提振市场信心,下一步政策预期有望打开,分析师看好业绩持续性强、资产质量有望逐步向好的银行;存储行业供给限产持续、终端需求回暖,这家产业链公司已实现季度扭亏为盈
未知机构
2024-01-30
电子行业:美光业绩环比向好,存储板块有望实现复苏
电子设备
华安证券
2023-07-02