行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

高性能、云原生湖仓体存储架构探秘

信息技术 2023-07-12 DataFunSummit2023：数据湖架构峰会张博卿

湖仓一体存储架构的演进与JuiceFS实践

大数据存储系统的演进

HDFS：起源于GFS，2006年发布，采用独立元数据存储（NameNode）和树形结构，支持多副本数据存储，数据分块不可修改，存算耦合架构，适合存储大文件（约2亿文件数）。
对象存储：2006年发布S3，以海量非结构化数据存储为目标，支持万亿级文件数，大小文件均适合，低廉存储成本（支持EC），高可靠持久性（11个9），基于HTTP协议的RESTful API，KV结构元数据，数据不支持修改，最终一致性。

不同类型存储系统比较

HDFS vs. 对象存储

HDFS的阿喀琉斯之踵——NameNode：
- 存储瓶颈：单一命名空间下NameNode性能瓶颈。
- 联邦架构：1.0（ViewFs+多集群），2.0（Router-based Federation，RBF）。
- 高可用架构：Quorum Journal Manager（QJM）。
对象存储的阿喀琉斯之踵——元数据：
- 元数据操作性能及一致性问题。
- 重命名操作步骤：递归拷贝数据、更新索引、删除原路径数据，一致性保证挑战。
- 元数据性能及API限制：List性能差（HudiMetadataTable），API QPS限制（IcebergObjectStorageLocationProvider）。

探索湖仓一体架构未来的存储选型

目标

扩展性好
高可用
高性能
弹性伸缩
存算分离
海量小文件管理
云原生
多种类型API

技术关键点

扩展性好
高可用
数据可靠
高性能
弹性伸缩
存算分离
海量小文件管理
云原生
多种类型API

JuiceFS

强一致性分布式文件系统
插件式元数据引擎
使用对象存储作为数据存储
元数据引擎可横向扩展
小文件友好的元数据设计
本地多级缓存
多种类型客户端
完全兼容POSIX
完全兼容HDFS API

湖仓一体架构在JuiceFS上的实践

元数据性能比较

使用NNBench（多线程测试）进行性能测试，3台阿里云4核16G虚拟机，CDH 5，HDFS 2.6环境，HDFS使用3个JournalNode高可用配置，OSS使用内网接口访问。

数据查询性能比较

左图：3台计算节点（4核CPU、16G内存、200G x 2硬盘），100GB TPC-DS数据集，Spark SQL基准测试。
右图：5台计算节点（8核CPU、32G内存、5500G x 4硬盘），PrestoSQL 3.3，1TB TPC-DS数据集，JuiceFS启用缓存并充分预热。

高性能、云原生湖仓一体存储架构探秘怵雷➃넞僅⨴Juicedata䪮助⚁㹻湖仓一体存储架构的演进目录不同类型存储系统比较探索湖仓一体架构未来的存储选型湖仓一体架构在JuiceFS上的实践 01 湖仓一体存储架构的演进大数据存储系统的演进 HDFS •起源于GFS（Google FileSystem），2006年正式发布•独⽴元数据存储（NameNode），树形结构元数据•多副本数据存储（DataNode）•数据分块存储（Block），不可修改•存算耦合架构（HDFS + YARN）•适合存储⼤⽂件，2亿左右的⽂件数对象存储 •S3于2006年发布•以存储海量⾮结构化数据为⽬标•能⽀撑万亿级⽂件数，⼤⼩⽂件均适合•低廉的存储成本（⽀持EC），可靠的数据持久性（11个9）•基于HTTP协议的RESTful API•KV结构的元数据设计•数据不⽀持修改•最终⼀致性 02 不同类型存储系统比较 HDFS vs.对象存储 HDFS的阿喀琉斯之踵——NameNode •单⼀命名空间下的NameNode存储瓶颈•联邦架构1.0：ViewFs+多集群•联邦架构2.0：Router-basedFederation（RBF） HDFS的阿喀琉斯之踵——NameNode •NameNode的单点问题•⾼可⽤架构：Quorum JournalManager（QJM）对象存储的阿喀琉斯之踵——元数据 •元数据操作的性能以及⼀致性问题如何实现重命名？mv/foo/bar 对象存储的阿喀琉斯之踵——元数据 •步骤1：递归拷⻉数据•步骤2：更新索引•步骤3：删除原路径中的数据•⼀致性如何保证？对象存储元数据性能及API限制 •List性能差：HudiMetadataTable•APIQPS限制：IcebergObjectStorageLocationProvider 03 探索湖仓一体架构未来的存储选型目标 •扩展性好 •⾼可⽤ •⾼性能 •弹性伸缩 •存算分离 •海量⼩⽂件管理 •云原⽣ •多种类型API 技术关键点 •扩展性好•⾼可⽤•数据可靠•⾼性能•弹性伸缩•存算分离•海量⼩⽂件管理•云原⽣•多种类型API •不存在扩展瓶颈•不存在单点，⾃动故障切换•冗余机制保证数据可靠性•针对⽂件系统设计的独⽴元数据•数据存储组件容易横向伸缩•缓存加速，分布式缓存，缓存亲和性•元数据存储结构优化•充分利⽤云上资源•针对不同API实现不同客户端 JuiceFS •强⼀致性分布式⽂件系统•插件式元数据引擎•使⽤对象存储作为数据存储•元数据引擎可横向扩展•⼩⽂件友好的元数据设计•本地多级缓存•多种类型客户端•完全兼容POSIX•完全兼容HDFS API 04 湖仓一体架构在JuiceFS上的实践湖仓一体架构元数据性能比较使⽤Hadoop中专⻔⽤于压测⽂件系统元数据性能的组件NNBench，将其单线程测试测试任务改成多线程，便于增加并发压⼒。使⽤3台阿⾥云4核16G的虚拟机，CDH 5，HDFS 2.6作为测试环境。HDFS使⽤3个JournalNode的⾼可⽤配置，使⽤内⽹IP。OSS使⽤内⽹接⼝访问。数据查询性能比较左图：使⽤阿⾥云3台计算节点4核CPU、16G内存、200G x 2硬盘，使⽤100GB TPC-DS数据集，通过Spark SQL进⾏基准测试。右图：使⽤阿⾥云5台计算节点8核CPU、32G内存、5500G x 4硬盘，PrestoSQL334，使⽤1TBTPC-DS数据集。以上测试中JuiceFS启⽤了缓存，并使数据充分预热。感谢您的观看 https://github.com/juicedata/juicefs

点击免费查看完整报告

高性能、云原生湖仓体存储架构探秘

湖仓一体存储架构的演进与JuiceFS实践

大数据存储系统的演进

不同类型存储系统比较

HDFS vs. 对象存储

探索湖仓一体架构未来的存储选型

目标

技术关键点

JuiceFS

湖仓一体架构在JuiceFS上的实践

元数据性能比较

数据查询性能比较

你可能感兴趣

云原生数据湖存储的架构发展和数据治理-程力

1-5 云原生开源分布式存储CubeFS在数据湖的探索与实践

云原生湖仓一体演进

1 镜舟科技&阿里云-StarRocks云原生湖仓分析技术揭秘

云原生数据库的架构演进-章颖强

数据技术嘉年华：智能·云原生·一体化——DB与AI协同创新，模型与架构融合发展

中国移动（王小玉）：新一代云原生数据库分析型数据库架构设计和应用创新

字节跳动云原生微服务架构原理与开源实践

PingCAP-孙晓光-TiDB Serverless 的云原生架构进化：从0到2万+集群的极速狂奔

2024云原生AI技术架构白皮书