登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稳定币
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
张静- ApacheFlink流批一体的规划和在快手的进展
信息技术
2022-05-18
DataFunSummit2022:大数据计算架构峰会
周***
AI智能总结
查看更多
FLINK 流批一体的规划和在快手的进展
社区在流批一体方向的演进
为什么要做流批一体计算引擎
:
降低开发成本:一套业务代码。
提高数据质量:口径一致。
降低资源开销:避免重复计算。
降低运维成本:维护一套引擎。
降低学习成本。
流批一体架构
:
API
:统一API (已完成1.10~1.14版本),包括SQL & Table API、Relational Data Set、DataStream、物理计划等。
调度
:Pipeline Region (已完成1.12版本),以Pipelined边连接的Task集合为基本的调度单元。
调度策略
:AdaptiveBatch Scheduling (引入于1.15版本),根据已结束的producer的数据量动态确定下游并发度。
可插拔Shuffle API
:支持Blocking Shuffle、Pipeline Shuffle和Hybrid Shuffle(规划中)。
快手在流批一体方向的进展
现有痛点
:
资源浪费:TaskManager无法立刻释放计算资源。
容错开销:TaskManager异常挂掉,恢复开销大。
稳定性:长尾节点拖慢任务。
易用性:手工配置并发度,难以合理配置。
解决方案
:
Remote Shuffle Service
:调度器与Shuffle服务对接。
Speculative Execution
:支持推测执行,减少任务延迟。
Adaptive Batch Scheduler
:动态调整并发度,适应数据量变化。
技术进展
:
Remote Shuffle Service
:已对接内部服务,并完成全链路功能验证。
Speculative Execution
:核心调度层设计已完成POC,部分Sink支持推测执行。
流批一体的业务实践
离线特征拼接
:产品输出Hive Server2元数据系统智能路由组件。
Hive on Flink
:Flink对接离线生产智能引擎。
社区在流批一体方向的规划
Spark和Flink在批计算方向的能力矩阵
:
SQL语法:Spark已具备,Flink规划中。
JOIN hints:Spark已具备,Flink规划中。
ANSI SQL兼容性:Spark已具备,Flink规划中。
SQL功能:Spark已具备,Flink规划中。
复杂类型转换:Spark已具备,Flink规划中。
动态并行度:Spark已具备,Flink已具备。
动态合并shuffle分区:Spark已具备,Flink规划中。
动态切换join策略:Spark已具备,Flink规划中。
动态优化偏斜join:Spark已具备,Flink规划中。
推测执行:Spark已具备,Flink规划中。
远程Shuffle服务:Spark已具备,Flink已具备。
SQL Gateway:Spark已具备,Flink规划中。
OLAP:Spark暂不支持,Flink规划中。
运行时过滤:Spark已具备,Flink规划中。
混合shuffle:Spark暂不支持,Flink规划中。
向量化执行:Spark暂不支持,Flink仅在Databricks运行时可用。
快手在流批一体方向的未来工作
流批一体的大数据架构
:
计算
:继续加强批能力建设,探索高效增量计算。
存储
:流表一体存储,理论基础为流表二义性。
架构
:流批一体计算+存储+OLAP。
非常感谢您的观看。
查看更多
你可能感兴趣
1-6 郭轶轩 - 流批一体在快手的探索实践
文化传媒
2024 DAMS中国数据智能管理峰会
2024-12-06
祝佳俊-Apache Iceberg 在网易严选批流一体的实践
文化传媒
DataFunSummit2022:大数据计算架构峰会
2022-05-19
4-1 流批一体的实时多维分析
金融
DataFunSummit2022:多维分析架构峰会
2022-07-19
网易流批一体的实时数据湖实践 -周劲松
信息技术
ArchSummit北京2022|全球架构师峰会
2022-11-02
【财联社早知道】首次明确!国家数据局将实施“数据要素X”行动,行业有望进入加速发展期,这家公司具备六位一体的大数据核心能力;冬季呼吸道传染病高发,它研发了国内第一个获批临床的甲流病毒RNA聚合酶抑制剂
未知机构
2023-11-26