行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

5 理想汽车-迈向云原生：理想汽车OLAP引擎变革之路.pdf

交运设备 2024-12-17 StarRocks 2024 年度技术峰会 💤 👏

理想汽车OLAP引擎经历了从StarRocks存算一体架构到存算分离架构的演进，以解决原有架构的稳定性、产品化能力和资源利用率问题。

StarRocks存算一体旧架构的挑战

资源浪费：按峰值配置资源导致低峰时资源利用率低（20%），扩磁盘需大量扩容机器造成CPU和内存浪费，冷数据存储资源未被有效利用。
稳定性不足：监控预警能力不完善，用户使用缺乏规范，集群内隔离能力不足。
产品化能力不完善：不易用，导致用户随意使用。

措施

统一OLAP引擎为StarRocks，采用存算分离架构，探索on Kubernetes部署。
构建完善的监控、告警、巡检体系，做好集群规划，规范用户使用，实现资源组隔离。
完善元数据、数据导入等产品能力，跟进社区最新版本。

StarRocks存算分离架构实践

资源削峰：通过夜间预计算（pipeline_dop设为1/2，加大query_timeout）和白天服务用户（pipeline_dop正常），机器资源节省30%，大表查询性能保持（6s左右），中小表秒级响应。
弹性伸缩：验证配置显示，命中本地缓存时性能与存算一体持平，不命中本地缓存时性能下降5.8倍。
Spark与StarRocks互补：夜间Spark生产数据，日间StarRocks分析数据，单表单次写入存算分离稍优于存算一体，单BE导入能力单CN导入速度平均142MB/s。
资源利用率提升：Spark和StarRocks共用k8s集群，互相削峰填谷，资源利用率提高50%。

StarRocks统一引擎、DQS统一出口

全业务线覆盖：智能座舱、智能驾驶、运营/经营等。
全分析场景覆盖：湖仓分析、实时/离线分析、ad-hoc灵活分析、联邦查询。

存算分离架构优化方案

架构设计：
- 单集群内FE存算分离共享元数据，按场景隔离FE。
- 按场景切分warehouse，内外分离，读写分离，高优低优分离。
弹性伸缩：
- ad-hoc、低优场景on k8s弹性伸缩，内表场景设置弹性warehouse。
- 故障时基于k8s快速拉起backup集群。

海博理想汽车大数据工程师理想汽车OLAP引擎的演进历程 StarRocks存算一体旧架构的挑战 StarRocks存算分离架构实践 04 理想汽车OLAP引擎服务化建设&迈向云原生稳定性&产品化建设问题：问题：问题： •稳定性不足：监控预警能力不完善、用户使用缺乏规范，随意使用•产品化能能力不完善，不易用 •集群内隔离能力不足•机器成本不断上涨，资源利用率低 •StarRocks、Impala、Tidb共存，资源成本高、运维成本高、使用成本高措施：•统一OLAP引擎为StarRocks 措施：措施： •mutil-warehouse•存算分离•探索on k8s部署 •构建完善的监控、告警、巡检体系•做好集群规划，流程建设，规范用户使用•资源组隔离大业务&跟进社区最新版本•完善元数据、数据导入等产品能力 StarRocks统一引擎、DQS统一出口： •全业务线覆盖 1.智能座舱2.智能驾驶3.运营/经营4....... •全分析场景覆盖 1.湖仓分析2.实时/离线分析3.ad-hoc灵活分析4.联邦查询 StarRocks存算一体旧架构问题： 1）为了扩磁盘需扩容大量机器造成CPU和内存的浪费2）冷数据被查到的频率很低，也造成存储资源的浪费业务特点业务场景如上，按峰值配置资源：•是低峰时的3倍 •整体资源利用率低(20%)•造成大量资源浪费查询峰值高，但是概率低：需满足峰值要求 (智能驾驶数据挖掘业务) 1、查询性能未下降•大表查询在6s左右 •中小表秒级响应存算分离：资源削峰： 2、机器资源节省30% 1.夜间预计算：pipeline_dop设为1/2，加大query_timeout2.白天预计算结果服务用户：pipeline_dop正常 StarRocks on K8s解决弹性伸缩问题验证配置: •镜像：cn-ubuntu:3.1.5、fe-ubuntu:3.1.5•资源：128核/512GB/4*4T*3•存储：bos + alluxio 验证结论: 查询性能： •命中本地缓存：性能和存算一体持平•不命中本地缓存：相比于存算一体，有5.8倍的性能下降 Spark和StarRocks资源波峰波谷互补：•夜间Spark使用资源生产数据•日间StarRocks使用资源分析数据 •单表单次写入：存算分离反而稍优于存算一体•单BE导入能力：单CN导入速度平均可达142mb/s,且还有上升空间 Spark和StarRocks共用k8s集群，互相削峰填谷，资源利用率可提高50% 一、只有一个集群•FE存算分离后共享元数据•按场景隔离FE 二、按场景切分warehouse•内外分离 •读写分离•高优低优分离三、资源弹性、按量付费•ad-hoc、低优场景on k8s弹性伸缩 •内表场景设置弹性warehouse•故障时，基于k8s快速拉起backup集群 Thank you!

点击免费查看完整报告

5 理想汽车-迈向云原生：理想汽车OLAP引擎变革之路.pdf

你可能感兴趣

云原生2024：迈向十年编程、云和变革的征程

铸云之基 - 云原生架构变革实践之路

移动云（陶捷）：海山数仓：移动云云原生OLAP数据库的技术演进与实践

聚水潭云原生OLAP架构的最佳实践

以云原生Serverless重塑OLAP下一代标准新范式

手游量子智能广告系统基于云原生 OLAP 的应用实践

百度AI原生研发范式变革的探索之路

2023云原生应用引擎技术发展白皮书

CNCF 2025年度报告迈向云原生人工智能合规性新高度

Apache Celeborn和数据湖计算引擎云原生实践

5 理想汽车-迈向云原生：理想汽车OLAP引擎变革之路.pdf

你可能感兴趣

云原生2024：迈向十年编程、云和变革的征程

铸云之基 - 云原生架构变革实践之路

移动云（陶捷）：海山数仓：移动云云原生OLAP数据库的技术演进与实践

聚水潭云原生OLAP架构的最佳实践

以云原生Serverless重塑OLAP下一代标准新范式

手游量子智能广告系统基于云原生 OLAP 的应用实践

百度AI原生研发范式变革的探索之路

2023云原生应用引擎技术发展白皮书

CNCF 2025年度报告 迈向云原生人工智能合规性新高度

Apache Celeborn和数据湖计算引擎云原生实践

CNCF 2025年度报告迈向云原生人工智能合规性新高度