博睿数据 互联网行业精选案例集 Bonree SELECTEDCASESINTHEINTERNETINDUSTRY 博睿数据重磅发布 前言 随着互联网技术的日益成熟与网络环境的日益完善,各类网络应用的需求逐渐被激发。从基础的娱乐沟通、信息查询到商务交易、网络金融及教育医疗等公共服务,互联网塑造了全新的社会生活形态,给人们的日常生活带来了极大的便利。 与此同时,互联网应用种类繁多,应用系统的复杂程度也在持续上升,这就导致IT系统故障和风险点持续增加。在这种情况下,单一使用传统监控已无法满足目前运维的需求。而多个监控产品交替切换使用,则会面临工具管理复杂、追查问题效率低、概念模型不统一等问题,影响用户体验。 那么,互联网行业数字化转型与业务创新应该如何开展? 本案例集将近年来博睿数据服务互联网客户的典型场景进行汇总,收录多家精选客户案例,分享互联网行业可参考、可复制的最佳实践。 案例导航 互联网 华为01 腾讯视频05 京东智联云09 新东方12 敦煌网17 正保教育20 51talk23 |让IT运营更智能 优质数据驱动 博睿数据赋能华为业务发展 华为使用博睿数据的主动式拨测产品BonreeNET已经7年有余,作为博睿数据的骨灰级优质用户,华为从2015年便通过BonreeNET进行CDN测试,2021年博睿数据与华为联合创新合作CEI+“智能体验运营”催化剂项目。期间,BonreeNET为华为数据和策略分析提供了重要的数据支撑。 01 背景分析 1 华为IT部门业务访问量大,重要页面亟需监控 华为拥有庞大的用户基数,且用户分布范围广,用户使用的网络也是复杂多样。重要业务能否得到有效观测,对性能提升的影响很大; 2 面对消费者交易环节易出现的问题,定位速度较慢 消费者BG部门掌握华为2C市场收入入口,面对在信息触达、商品交易、商品交付、售后维系等环节出现问题的问题,难以第一时间感知,对用户体验造成一定影响; 3 目前无法主动预警,业务可用性亟待保障 故障问题出现后,难以实现问题自动发现,问题预警率较低,缺乏用户视角; 4 主机性能优化面临挑战,缺乏优化依据 华为云的可用性监控不够完善,难以了解竞品情况,无法有针对性地进行优化;机房选点选型及后期面向用户的常态监控,需要工具来进行评估及监控保证。 应用场景 1 流程与IT相互依存,支撑华为正常运转和发展 BonreeNET为华为提供IT全流程的拨测监控,无需人工干预,便可模拟真实用户访问,包括整体页面、全元素、单元素、接口、事务流程等,进而对业务可用性进行实时监测,将页面体验用时从8s优化至3s以内。华为IT部门已将BonreeNET的级别提至T2。 2 博睿数据对电商平台进行监测,守好华为收入大门 博睿数据对华为电商平台进行实时监测,填补了门店监测的空白,为电商业务的可用性保驾护航。同时,博睿数据通过竞品对比,明确华为电商平台优化方向,有针对性地进行性能提升。 3 博睿数据监控主动预警方法论,加强可用性保障 博睿数据可通过模拟用户端真实访问流程,从而进行主动监测,弥补了用户视角的缺失。同时,博睿数据通过将拨测数据接入统一告警平台,实现问题主动告警,成功将华为故障预警率由45%提升至90%。 4 快速定位故障根因,大大缩短排障周期 面对页面访问异常、反馈时间过长等故障的出现,BonreeNET可快速知悉故障现象、具体定位故障根因,并同步至华为侧进行故障排查处理,极大缩短排障周期,将故障对用户的影响降低到最低。 5 测试CDN节点,助力华为从0到1搭建CDN 博睿数据协助华为从0到1搭建CDN,为华为提供调度策略设定依据,通过CDN节点验证测试分析问题、提出建议优化方向。在重大活动保障期间,博睿数据快速响应解决相关问题,并对CDN进行主动优化,有力的保障了华为稳定优质的后期服务能力,CDN业务收入及口碑得到提升。 6 助力华为云主机性能达到国内TOP1,性能领先友商 博睿数据为华为云的云服务器与物理机房,提供用户角度访问,获得网络层数据,进行可用性的问题定位及优化的方向;同时,成立优化小组,针对国内/外的性能对比,形成业内排名及详细的对比数据,建立优化的优先级; 博睿数据为华为云提供高防机房,利用拨测进行机房选型,进行常态化监控,实时保障用户侧、业务侧的服务可用,助力华为云在国内云主机性能中排名第一。 为什么选择博睿数据 博睿数据全国领先的监测能力 博睿数据拥有全国最大的监测网络,年监测量超 过15亿次,可以满足华为庞大业务的需求; BonreeNET安全可信,契合华为需求 BonreeNET安全可信,无需开发嵌码与客户配合, 可随时随地监测、任意应用监测。 应用效果 极大缩短页面体验用时 将华为页面体验用时从8s优化至3s以内; 故障预警率从45%升级到90%,帮助华为掌握处理问题的主 有效提高问题预警率 动性,降低投诉率; 协助华为云从0到1搭建CDN 实现一年上线800+节点,测试任务组1000+; 助力华为云国内云主机性能排名第一 华为云主机性能达到国内TOP1,领先友商。 |让IT运营更智能 助力腾讯视频提升平台性能 为用户体验保驾护航 通过博睿数据的主动式拨测能力,博睿数据帮助腾讯视频明确看到自身与竞品的优劣势,有针对性地提升性能体验。同时,博睿数据帮助腾讯视频发现并解决视频播放策略问题、视频资源CDN耗时长等问题,并搭建频播放体验评分标准,致力于保障用户使用体验。 05 背景分析 1 如何提高腾讯视频的用户认可度 视频各个细分行业竞争日趋激烈、透明化、内容重合度高,面临如何让更多的用户选择使用腾讯视频平台; 2 如何从用户角度优化提升平台性能体验 难以掌握腾讯视频、腾讯新闻、腾讯体育、微视等App客户端在各种场景下的用户体验,从而有针对性的进行性能优化; 3 如何确定自身产品体验在行业中的排名 难以确定腾讯产品与竞品体验的优劣势,不确定投入产出比是否合理。 应用场景 1 实时监控应用宝下载App客户端的性能 通过关注主要50个城市3大运营商应用市场里APP应用的下载速度、可用性等指标;博睿数据通过测试数据让腾讯资源架构部门对性能较差区域进行优化,帮助应用宝了解其在竞品中所处的排名,优化自身性能。 2 帮助腾讯发现视频播放策略问题 腾讯新闻APP、腾讯体育APP、腾讯视频APP播放视频时90%以上数据显示默认使用高清是播放;而对应竞品APP则大多数选择标清或者流畅清晰度视频。 3 快速定位视频资源CDN耗时长问题 博睿数据在测试过程中发现步骤平均DNS时间都相对比较长,通过散点瀑布图发现问题根因,为避免第三方请求导致导致dns耗时长,在配置任务时过滤掉这些非关键第三方域名请求。 4 建立视频播放体验评分标准 博睿数据根据视频播放的首帧用时/首次缓冲用时、卡顿时间、卡顿率、可用性主要4个指标权重进行综合评估打分。 5 协助腾讯视频分析播放体验差的原因 在测试过程中,博睿数据协助腾讯视频找出首帧时间长、卡顿时间长、卡顿次数多的样本,通过客户端请求视频资源地址在客户内部CDN日志系统找到对应测试散点的日志,通过客户内部日志查看分析定位具体原因。 为什么选择博睿数据 产品兼顾稳定性与实用性 博睿数据的产品运行稳定且部署方便; 服务能力专业且响应及时 专业服务团队,7*24小时及时响应。 应用效果 提升应用宝排名 应用宝在应用市场下载速度排名提升2名; 优化腾讯视频资源播放逻辑 视频播放首帧用时大大缩短,播放体验提升40%以上; 分析竞品广告播放时长、默认清晰度、流畅率等问题,有针 分析竞品策略 对性地提高性能体验; 优化视频资源主机节点覆盖 帮助腾讯视频掌握App客户端中各个域名的解析性能; 建立视频播放体验评分标准 对视频播放指标的权重进行综合评估打分。 |让IT运营更智能 助力用户体验提升 京东智联云如何从竞品中脱颖而出 基于博睿数据广布全球的真机监测节点,博睿数据为京东智联云提供网络质量监测、CDN质量评估等多种终端用户使用场景下的应用性能体验监控,帮助京东智联云精准定位性能瓶颈、提升市场竞争力,优化云服务质量。同时,在京东618重大活动保障期间,博睿数据专门成立重保小组,为京东智联云提供专业的重保服务,保障活动期间零故障发生。 09 背景分析 升自身优势? 1友商众多,如何有针对性地提 了解用户真实使用体验? 2业务范围广,如何触达用户, 系统的稳定性及可用性? 3重大活动保障期间,如何保障 应用场景 1 精准有效的竞品分析,提升服务器性能 基于博睿数据分布在全球不同网络环境的节点,对部署在友商云服务器上的资源进行探测,将自身同类型业务同步进行访问,获取同一时间、同一网络环境、同一资源下京东智联云与友商的性能优势,对表现欠佳的维度,进行优化提升,从而在与同行业的竞争中脱颖而出。 2 主动式拨测,定位用户体验差的环节 博睿数据通过对京东智联云重点业务进行主动访问探测,了解云服务业务监控状况,并根据业务健康度,做性能调整优化,如:优化CDN链路节点,尽量避免跨区访问等,并且针对变化可以进行对比测试,验证优化是否有效。在用户投诉前提前发现问题,用户投诉率降低12.1%。 3 重大活动保障期间,提供专业技术支持 在重大活动开始之前,通过BonreeNE对关键活动页面进行监测,提前通过不同网络环境的监测点发起访问,可以起到CDN预热、云服务网络质量监测、云服务链接异常等现象提前感知的作用,进而将故障问题提前解决,保障重大活动期间零故障发生。 在重大活动保障期间,博睿数据专门成立重保小组,为京东智联云提供专业的重保服务,保障活动顺利进行。 为什么选择博睿数据 强大的产品能力 BonreeNET基于广布全球的真机监测节点,可以 模拟真实用户访问体验; 专业的服务团队 专业可靠的重保服务团队,保障重大活动期间零 故障发生。 应用效果 提升京东智联云的市场竞争 在某具体案件中帮助京东智联云优化 力,优化云服务质量 业务应用性能近30%,技术维度领 先; 主动发现问题,提升用户体验 变被动为主动,客户投诉率下降12.1%; 保障活动期间CDN质量达到最佳状 保障京东618期间零故障发生 态、服务零故障,活动期间下单金额 达2692亿元。 |让IT运营更智能 博睿数据助力新东方 搭建可观测性体系 新东方以降本增效安全运营为目标,目标搭建一套对整个系统的自主运维平台,借助博睿数据的数据采集能力,与在长期服务过程中沉淀下的各类指标,实现了我们对可观测性能力的初步搭建,帮助我们实现了对关键信息的报警,让对技术不那么了解的领导也可以直观地了解到整个系统的运行情况。 —齐晨新东方运维高级经理SRE负责人 12 背景分析 测技术栈落地可观测监控平台, 1运维人员不足,需要统一可观 提高运维效率; 理,统一告警通道; 2报警和通道过多,需要模板管 统一管理,实现数据标准化; 3运维指标太少,需要增加采集 加报警平台管理,提供指标、日 4运维配置报警太慢,需要增 志、跟踪等数据; /trace结合,缺少应用属性,缺 5数据单一,缺少metric/log 少决策数据; 作台、健康度、健康评分管理。 一dashboard展示,增加决策工 6展示查询不统一,需要增加统 应用场景 底层调用架构改造1、指标监控存储统一使用prometheus;2、使用victoriaMetrics轻量级部署方案来取代thanos; 1 3、日志监控采集新增Loki,可同prometheus指标监控联动,便于运维轻量级日志使用; 4、汇聚收集trace、apm、log监控告警,以及公有云指标采集,便于分析统一告警; 5、新增统一的告警平台进行时序集群管理、统一规则管理、告警订阅、告警分发、故障自愈、事件管理、日志告警、标签管理