行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

01-字节跳动云原生大数据发展之路-余炜强

信息技术 2023-06-06 ArchSummit北京2023|全球架构师峰会路仁假

字节跳动云原生大数据发展之路

背景

挑战：大规模高性能稳定定制优化、实时化、智能化、存算分离、云原生化、安全合规、产品一体化
问题：已有基础运营能力弱、运维负担大、业务接入复杂、成本压力大
技术趋势：EB级存储、TBps级实时流量、千万core资源调度

架构思路

规模化：大规模实时计算、大规模存储能力、极致实时优化
垂直化：实时处理、实时分析、实时生效
中心化：统一云原生存储体系、统一容器调度体系、一站式大数据平台
整合化：流批一体化、离在线一体化、软硬件一体化、多模数据体系
智能化：大数据+人工智能、智能优化、智能运维
成本优化：Serverless化、解决方案

实践案例

存储
- 支持多种存储介质和存储底座
- 多级存储自动优化存储成本
- 大数据存储引擎（如CloudFS）：单集群读写性能优异、支持EB级别数据存储
计算
- 一站式大数据平台：开发、调试、运维、调度一体化
- 大数据计算引擎：支持湖仓一体、流批一体化、大数据AI一体化
消息引擎
- 支持多云容灾调度、秒级容灾恢复
- 高性能大规模读写支持
- 存算分离架构：相比Kafka，ByteMQ具有更快的扩容速度和更高的自动化水平
搜索
- 支持PB级别数据存储，单集群百万分片
- OpenSearch产品实践：读写性能优化、集群CPU负载下降、写吞吐提升

未来规划

流数仓
软硬件结合（如RDMA、NVM）
Serverless演进
更好的弹性与更低的成本

技术交流

请扫描二维码参与交流。

报告封面

点击免费查看完整报告

你可能感兴趣

李汉波-字节跳动基于 KubeAdmiral 的多云分布式云原生实践之路

信息技术2024 第23届 GOPS 全球运维大会暨 XOps 技术创新峰会 · 北京站2024-07-17

2-5 字节跳动大数据平台安全与权限治理实践 - 许从余

信息技术DataFunSummit2022：数据治理在线峰会2022-09-15

字节跳动基于KubeAdmiral的分布式云原生多云多集群管理技术实践

开放运维联盟&高效运维社区&DevOps时代2023-04-30

字节跳动云原生机器学习离线训练实践_单既喜

文化传媒ArchSummit深圳2022|全球架构师峰会2022-07-19

火山引擎-唐鹏程- 字节跳动云原生开源 -- 资源管理与成本优化

公用事业2023第十二届全球TOP100软件案例研究峰会2024-08-21

字节跳动云原生微服务架构原理与开源实践

信息技术CloudWeGO2023-11-07

云原生应用的构建之路

红帽2020-07-01

太保集团云计算建设之路与金融级云原生转型路线

太保集团2023-04-29

微信云原生大数据平台构建及落地实践-涂小刚

信息技术ArchSummit上海2023|全球架构师峰会2023-06-06

张云尧 - 火山引擎云原生大数据在金融行业的实践

金融DataFunSummit2022：智能金融在线峰会2022-11-24