您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开放数据中心委员会]:itango网络性能监控开放体系白皮书 - 发现报告
当前位置:首页/行业研究/报告详情/

itango网络性能监控开放体系白皮书

AI智能总结
查看更多
itango网络性能监控开放体系白皮书

itango网络性能监控开放体系白皮书ODCC-2023-06003 1 [编号ODCC-2023-06003] itango网络性能监控开放体系白皮书 开放数据中心委员会2023-09发布 itango网络性能监控开放体系白皮书ODCC-2023-06003 版权声明 ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制单位共同享有著作权。 转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。 对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关单位将追究其法律责任,感谢各单位的配合与支持。 I itango网络性能监控开放体系白皮书ODCC-2023-06003 编写组 项目经理: 吕鹏腾讯科技(深圳)有限公司工作组长: 岳上腾讯科技(深圳)有限公司 贡献专家: 张金琛腾讯科技(深圳)有限公司史高雄腾讯科技(深圳)有限公司王镇腾讯科技(深圳)有限公司李贤晨腾讯科技(深圳)有限公司陈关旭腾讯科技(深圳)有限公司万鹏腾讯科技(深圳)有限公司李智超腾讯科技(深圳)有限公司张旋腾讯科技(深圳)有限公司许可欣中国信息通信研究院 常诚中国移动通信集团公司 柳巍峰中国移动通信集团江苏有限公司 雷迎颖中国联合网络通信有限公司广东省分公司曹巍巍中国联合网络通信有限公司深圳分公司张卓鹏中国联合网络通信有限公司深圳分公司黄国斌中国电信股份有限公司广东省分公司 冉丛书中国电信股份有限公司广东省分公司李冰超中国有线电视网络有限公司 凌军思科(中国)有限公司 方皓思科(中国)有限公司 II itango网络性能监控开放体系白皮书ODCC-2023-06003 王沈淳思科(中国)有限公司吴灿思科(中国)有限公司 黄胡瞻博网络信息咨询(上海)有限公司樊云鹏华为技术有限公司 史伟美团 III itango网络性能监控开放体系白皮书ODCC-2023-06003 前言 随着AI、互联网、云计算等领域的快速发展,新型数据中心作为关键的信息基础设施,已经成为网络强国、数字中国、智慧社会建设的重要支柱,同时也是推动我国数字经济发展的基础设施。本白皮书以数据中心行业发展政策为指导,关注当前新型数据中心在面临网络智能化运营的挑战时,如何向自动驾驶和自愈网络方向发展。 我们强调以网络性能监控为基础,借助开源共建的理念,通过开放的架构,推动数据中心网络性能监控(NPM)的进步。我们认为,数据中心网络的未来发展方向应该是自动化和自我修复,这需要我们构建一个智能化、自动化的网络运营环境。 通过开源共建的方式,我们可以集合更多的智慧和力量,共同推动数据中心网络性能监控(NPM)的发展。同时,开放的架构可以让我们更灵活地适应网络运营的需求,更好地满足数据中心的业务需求。 总的来说,我们希望通过本白皮书,引导数据中心网络向自动驾驶和自愈网络的方向发展,推动数据中心网络性能监控(NPM)的进步,为我国的数字经济发展提供更强大的支撑。 本白皮书可作为数据中心网络工程师、系统运维、云运维、开发人员、NPM提供商、高校研究和相关数据中心从业者的技术参考。 IV itango网络性能监控开放体系白皮书ODCC-2023-06003 由于时间仓促,水平所限,错误和不足之处在所难免,欢迎各位读者批评指正。如有意见或建议请联系编写组。 V itango网络性能监控开放体系白皮书ODCC-2023-06003 目录 版权声明I 编写组II 前言IV 一、项目背景1 二、NPM发展过程及趋势2 (一)NPM介绍2 (二)NPM发展过程3 (三)NPM发展趋势4 (四)NPM的的挑战5 三、开放体系设计的理念6 (一)设计的理念6 (二)设计形态7 (三)设计的原则8 (四)设计的目标8 四、开放体系架构9 (一)基于saas服务的开放体系架构9 1、基于SAAS后台架构9 2、面向用户服务23 (二)基于组件化自定义体系架构24 五、应用场景25 (一)日常监控场景25 (二)网络变更场景25 VI itango网络性能监控开放体系白皮书ODCC-2023-06003 (三)网络调优场景26 (四)自愈网络演进场景27 六、典型案例27 (一)日常监控案例27 (二)网络变更案例29 VII itango网络性能监控开放体系白皮书ODCC-2023-06003 itango网络性能监控开放体系白皮书 一、项目背景 随着云业务的不断发展,作为基础设施即服务(IaaS)层的网络的重要性和依赖性日益凸显,网络工程师将面临更多的挑战和困难。例如,全链路网络问题的排查(包括4G、固网、骨干网、数据中心或TCP/IP协议各层的问题)都需要解决。同时,随着国家“一带一路”政策的推动,企业面临着处理来自成千上万家运营商的问题,以及提高网络工程师与用户交互效率等紧迫问题。 腾讯网络运营团队在日常工作中积累了大量的实践经验和探索成果,我们研发了itango轻量级网络性能监控平台。我们希望通过开源共建的方式,与业界同行一起努力提升网络故障处理效率,确保网络的畅通无阻,为业务的稳定运行提供保障。 我们相信,通过我们的共同努力,我们可以解决网络工程师面临的各种挑战,提高网络故障处理的效率,让网络更加稳定,为业务的发展提供强大的支持。 图1痛点问题 1 itango网络性能监控开放体系白皮书ODCC-2023-06003 二、NPM发展过程及趋势 (一)NPM介绍 网络性能监控(NetworkPerformanceMonitoring,简称NPM)是一种IT流程,用于实时监控和管理网络的性能。其主要目标是确保网络的稳定性、可靠性和高效性,以满足业务需求和用户期望。 网络性能监控涵盖了以下几个主要方面: 性能度量:这包括网络的吞吐量、延迟、丢包率、错误率等关键性能指标。 故障检测和诊断:NPM工具可以自动检测网络中的问题,并帮助网络管理员确定问题的根源。 性能优化:通过对网络性能的持续监控和分析,网络管理员可以找到优化网络性能的方法,例如调整网络配置、升级网络设备等。 报告和警告:NPM工具通常会提供详细的报告,展示网络性能的历史和当前状态。同时,当网络性能出现问题时,NPM工具可以发送警告通知网络管理员。 总的来说,网络性能监控是确保网络正常运行的关键组成部分,它可以帮助企业提高业务效率,提升用户体验,同时降低IT运营成本。 2 itango网络性能监控开放体系白皮书ODCC-2023-06003 (二)NPM发展过程 网络性能监控(NetworkPerformanceMonitoring,简称NPM)的发展历史可以大致分为以下几个阶段: 早期阶段:在网络刚刚兴起的时候,网络性能监控主要依赖于手动检查和基本的命令行工具,如ping和traceroute等。这些工 具可以提供基本的网络连接和延迟信息,但对于复杂的网络性能问题,这些工具的功能非常有限。 SNMP时代:随着网络的发展,人们开始使用更复杂的网络管理协议,如简单网络管理协议(SNMP)。SNMP可以收集和管理网络设 备的信息,使网络管理员能够更好地理解网络的状态和性能。 网络性能管理软件的出现:为了更好地管理和监控网络性能,出现了专门的网络性能管理软件。这些软件可以提供更详细的网络性能信息,包括流量分析、故障检测和性能优化等功能。 云计算和虚拟化时代:随着云计算和虚拟化技术的发展,网络性能监控也发生了变化。网络管理员需要监控和管理分布在不同地点的网络资源,这需要更复杂的NPM工具。 人工智能和机器学习的应用:最近,人工智能和机器学习技术 也开始应用于网络性能监控。这些技术可以帮助网络管理员预测网络性能问题,提前采取行动,避免网络中断。 3 itango网络性能监控开放体系白皮书ODCC-2023-06003 总的来说,网络性能监控的发展历史是一个从简单到复杂,从手动到自动,从本地到云的过程。在未来,随着技术的发展,我们可以期待更智能、更自动化的网络性能监控工具。 (三)NPM发展趋势 网络性能监控(NetworkPerformanceMonitoring,简称NPM)的发展趋势主要体现在以下几个方面: 智能化:随着人工智能和机器学习技术的发展,NPM工具正在 变得更加智能化。这些工具可以自动学习和理解网络行为,预测可能的性能问题,并在问题发生之前采取行动。 自动化:自动化是NPM的另一个重要发展趋势。通过自动化,网络管理员可以更有效地管理网络,减少人为错误,并提高网络的 可靠性和性能。 实时监控:随着数据流量的增加,实时监控网络性能变得越来越重要。实时监控可以帮助网络管理员快速发现和解决问题,避免网络中断。 云化:随着企业越来越多地采用云服务,NPM工具也需要适应这种变化。云化的NPM工具可以更好地监控和管理分布在不同地点 的网络资源。 4 itango网络性能监控开放体系白皮书ODCC-2023-06003 集成性:NPM工具需要与其他IT管理工具进行集成,以提供全 面的网络性能视图。这可以帮助网络管理员更好地理解网络性能问题的根源,并采取有效的解决措施。 安全性:随着网络攻击的增加,NPM工具也需要具备更强的安全功能。这包括检测和防止网络攻击,以及保护网络数据的安全。 总的来说,NPM的发展趋势是向智能化、自动化、实时化、云化、集成性和安全性方向发展。 (四)NPM的的挑战 网络性能监控面临的挑战主要包括以下几个方面: 复杂性:现代网络环境非常复杂,包括各种不同类型的设备、应用和服务。这使得网络性能监控变得更加困难,因为需要处理和理解大量的数据和信息。 实时性:网络性能监控需要实时进行,以便及时发现和解决问题。然而,处理大量的实时数据是一项挑战。 安全性:网络性能监控工具需要访问和处理敏感的网络数据,这可能引发安全问题。保护这些数据的安全是一项重要的挑战。 云和虚拟化:随着云计算和虚拟化技术的广泛应用,网络环境变得更加分散和动态。这使得网络性能监控更加困难,因为需要监控和管理分布在不同地点和平台的网络资源。 5 itango网络性能监控开放体系白皮书ODCC-2023-06003 预测和预防:除了发现和解决现有的网络性能问题,网络管理 员还需要预测和预防未来可能出现的问题。这需要对网络行为有深入的理解和精确的预测,这是一项挑战。 集成:网络性能监控工具需要与其他IT管理工具进行集成,以 提供全面的网络性能视图。然而,不同工具之间的集成可能会遇到兼容性和一致性问题。 总的来说,网络性能监控面临的挑战主要来自于网络环境的复杂性、动态性和安全性,以及数据处理和工具集成的问题,所以我提出开源共建的方法。 三、开放体系设计的理念(一)设计的理念 通过采纳开源共建的设计原则,我们可以构建一个充满活力和创新的生态系统。在这个生态系统中,开源agent成为关键组件,它允许各方参与者自主开发和迭代功能,从而实现更高效的网络性能监控(NPM)技术。 开源共建是一种鼓励多方参与、共享知识和资源的方法。它强调合作、透明度和开放性,使得来自不同背景和领域的开发者能够共同解决问题,分享创新成果,从而推动整个行业的发展。 生态系统是指一个由多个相互关联的组件组成的环境,这些组件共同协作以实现特定目标。在网络性能监控领域,这个生态系统 6 itango网络性能监控开放体系白皮书ODCC-2023-06003 包括了开发者、维护者、用户和其他利益相关者,他们共同参与到开源agent的开发、维护和使用过程中。 agent共同开发是指多个开发者或团队共同参与到开源agent的设计、开发和维护过程中。这种合作方式有助于提高agent的功能性、可靠性和易用性,同时也能够更好地满足不同用户的需求。 资源整合是指将各种不同的资源(如硬件、软件、数据等)组合在一起,以实现更高效的网络性能监控。在开源共建的生态

你可能感兴趣

hot

数据中心智能传感网络开放体系白皮书

信息技术
开放数据中心委员会2023-10-08
hot

开放云网络之高性能网关技术白皮书

信息技术
中国移动2023-12-27
hot

算力网络架构与技术体系白皮书

信息技术
中国联通研究院2020-10-01