登录
注册
回到首页
AI搜索
发现报告
发现数据
专题报告
研选报告
定制报告
VIP权益
发现大使
发现一下
热门搜索:
新能源车
AIGC
Chatgpt
大模型
新质生产力
低空经济
当前位置:首页
/
行业研究
/
报告详情
/
8-2 网易日志采集传输服务建设与优化
文化传媒
2022-07-19
DataFunSummit2022:大数据存储架构峰会
墨
AI智能总结
查看更多
网易日志采集传输服务建设与优化
日志采集传输服务的业务特点
数据量大
:日志数据量庞大。
数据链路长
:数据链路较长。
数量波动大
:数据数量波动较大。
系统设计目标
高吞吐
:提高数据传输速度。
低成本
:降低网络带宽、计算及存储成本。
高可用
:保障系统稳定运行。
高可运维
:便于维护和管理。
支持海量日志采集
:能够处理大量日志数据。
低延迟
:减少数据传输延迟。
链路中部分节点异常不影响整体
:部分节点异常不会影响整个系统。
用户自助式监控与报警
:提供自助式的监控和报警服务。
Datastream-ng总体设计
分层架构
:采用多层次架构设计。
数据流图
:展示数据流的整体结构。
整体设计原则
快流转
:高效处理数据,支持协议升级。
无状态
:通过Back Pressure模型和基于信用的流量控制确保可靠传输。
自适应
:实现内存池化管理、流量自动迁移和实时水位监控。
核心组件与流程优化
DS Agent
文件状态迁移流程图
CPU优化
:作业分类,线程配置。
内存优化
:内存预分配,空闲回收。
磁盘IO保护
:采集限流。
DS HDFS Sink
基于Flink作业
:保证Exactly once。
时间/空间连续性
:增强batch sink效果。
故障转移
:应对YARN故障和HDFS故障。
链路监控与报警
关键节点监控
:使用NTSDB和Redis组合存储。
实时/历史监控
:支持多维度监控查询。
丰富报警
:提供用户自定义报警功能。
应用效果与未来规划
应用效果
Agent数量
:2万多。
任务数量
:4800多个。
日均处理日志条数
:5000亿条。
入仓数据量
:600多TB。
人效提升
:200%。
未来规划
弹性伸缩
:DS Router实例自动扩缩容。
智能诊断
:Flink Sink任务自动调整并行度。
压缩提升
:日志校对服务,提升压缩效率。
你可能感兴趣
基于云原生的作业帮大数据采集体系建设与迁移实践-伍思磊
信息技术
ArchSummit上海2023|全球架构师峰会
2023-06-06
【财联社早知道】华为申请AI模型处理专利,以提高AI模型在存储和传输方面的机密性,这家公司参股企业是业界领先的多模态AI行业大模型与算法服务提供商;这家公司已获得腾讯新“游 元梦之星 IP授权
未知机构
2023-12-13
工信部发布2019年1-7月运营商数据,关注5G建设与4G传输扩容升级
信息技术
华金证券
2019-09-01
8-2 中原银行敏捷 BI 平台建设实践
金融
DataFunSummit2022:现代数据栈技术峰会
2022-11-02
广电启动5G核心网设备采集,全国首个自动驾驶服务商业化试点启动
信息技术
天风证券
2021-11-27