博睿数据汽车行业 精选案例集 AUTOMOTIVEINDUSTRYCASESTUDY 2024 博睿数据重磅发布 EXCELLENTCASES 前言PREFACE 近年来,汽车市场环境的复杂性上升,全球各类不稳定因素增加,造车新势力挑战不断�车企借助云、容器化、微服务等技术加速自身数字化变革,已经成为面向未来发展的主要趋势。在数智化浪潮的推动下,汽车企业自有系统的稳定性、性能、瓶颈以及由故障所带来的各类影响,都让系统和业务的风险不断增加。 博睿数据凭借一体化智能可观测平台领先的大数据采集和智能分析能力,真正实现全栈、全链路、全场景的智能可观测,可以帮助车企实现运维环境的可视化,直观地对应用各个服务环节的性能指标进行智能化分析,实现现有系统的故障定位和排查,助力其有效提高运维的能力和效率,从而有助于车企做出对盈亏线有影响的正确的IT战略决策。 本案例集将近年来博睿数据服务汽车企业的典型场景进行汇总,收录多家精选客户案例,分享汽车行业可参考、可复制的最佳实践。 目录CONTENTS 广汽丰田01 广汽本田04 北汽集团08 蓝谷极狐汽车11 东风柳汽14 大圣科技18 零束科技22 Smart汽车25 |让IT运营更智能 广汽丰田的运维监控体系建设 通过博睿数据的700+探针,发现广汽丰田业务拓扑,清晰展现逻辑关系,概览系统全局。同时,全面实时获取服务端性能数据,通过应用、组件、集群、容器及代码等逐层深入分析,最终从代码层和环境层帮助广汽丰田定位分析并解决自身服务端性能问题。 01 背景分析 1 微服务应用性能难以评估管理 微服务生产环境在当前生产磨合阶段需要经常调优业务参数,但是由于缺乏专业性能监测平台,仅凭团队人为经验调参,造成应用性能底下,优化周期长,变更风险高; 2 故障诊断流程复杂,效率较低 由于缺乏完善的故障诊断流程,运维人员之间缺乏有效的协同机制;且微服务下的业务调用链需要多部门协同诊断,导致复杂故障的排障周期长,MTTR增加。 应用场景 搭建基于微服务架构的应用性能监测平台 1 博睿数据帮助广汽丰田自动发现docker环境下系统的调用关系,全面展示IT架构各环节健康状况,定位集群中拖累主机,逐层问题剥离分析,提升排障效率。基于此,将原本不可见的业务系统间的复杂调用逻辑进行可视化展示,实现应用性能监控从无到有的转变。 2 建立故障诊断机制,提高排障效率 博睿数据通过调用链获取vin编码整条业务的调用情况,将业务数据、Paas环境数据、系统环境数据进行关联,进行代码级别的问题定位,进而找到问题的根源,优化业务逻辑。 为什么选择博睿数据 产品兼容性强 博睿数据产品可完美融入丰田敏捷研发现有体系中 监控维度广 博睿数据可实现全栈、全端、全场景智能可观测 应用效果 完善广汽丰田运维监控体系,对业务的访问缓慢链路进 建立微服务应用性能监测机制 行资源调配,实现慢请求占比从10%下降至5%以下、错 误率从5.7%下降至0.1%以下 赋能运维团队,故障诊断周期从4小时下降至15分钟, 优化故障诊断流程 MTTR从1小时下降至5分钟 |让IT运营更智能 广汽本田优化业务流程 实现应用系统的全面可视化 广汽本田通过借助博睿第三方的监测系统平台资源,通过网民的角度客观的数据分析,对固有的业务服务模式和评估方法进行完善和补充。从更多的视角维度为技术中心的日常服务和客户拓展提供有价值的数据信息,为决策提供数据支撑。 04 背景分析 1 业务发展迅速,需要一套切实可行的应用性能评估体系 2 为了适应快速变化的市场和竞争态势,有必要参照、引入互联网应用性能质量评估体系,借助第三方的监测系统平台资源,通过客观的数据分析,对固有的业务服务模式和评估方法进行完善和补充; 数据的深度价值有待挖掘 需要从更多的视角维度为技术中心的日常服务和客户拓展提供有价值的数据信息,为决策提供数据支撑。 应用场景 1 网站页面常态监控 2 线上云展厅监测 云展厅能给用户带来沉浸的、流畅的线上体验。用户不再需要额外安装客户端app,一个链接就能让客户了解你全店的车型、有哪些优惠活动。 3 竞争对手活动车型页面的监测 竞争对手的服务质量,活动推广和竞争对手的推广效果对比,包含页面性能时间、劫持等数据活动页面的打开质量,实时掌控全国重点城市,真实用户访问页面的体验性能和页内流媒体的播放质量。对流媒体质量,进行拖拽监测,确保4M带宽网民用户播放视频缓存时间低于3秒。 4 活动推广前选型 活动推广前,通过博睿数据拨测评估数据分析,选出最优的加速厂商,确保活动页面、视频,能稳定、快速的访问。 5 活动推广后协助解决突发故障 通过可视化的图表,进行错误的快速下转,直击问题本源,大幅减少错误带来的影响。 6 后端应用的监测情况 通过业务拓扑、应用拓扑清晰展现逻辑关系,概览系统全局。全面实时获取服务端性能数据,通过应用、组件、集群、容器及代码等逐层深入分析,最终从代码层和环境层帮助自身定位分析自身服务端性能问题。 7 推动公司应用性能优化流程建设 组建专门的应用性能优化团队,定期进行应用质量进行考核,设立优化目标。 在企业内部事务管理平台新增应用优化流程,各应用供应商会定期收到的事务管理平台的应用优化事件推送。共同推动网站性能优化,提升用户体验。 为什么选择博睿数据 公司实力值得信赖 博睿数据深耕汽车行业多年,2022年APM市场排 名国内NO1 产品能力过硬 博睿数据拥有全栈、全端、全场景智能可观测产 品,真正帮助车企实现业务可视化 应用效果 推动完善企业业务优化流程 使整个运维事件形成闭环 快速排障 快速发现,定位故障根因,恢复故障时间明显缩短 对各大运营商链路的实现了有效的监控与管理 广告的可用性95.7%,上升至98.5% 建立起对CDN加速厂家有效的考核管理指标 07 |让IT运营更智能 ALLinONE ⸺构建北汽集团的应用可观测能力 博睿数据为北汽集团建设421体系,即4个维度、2个能力、1个平台。通过智能AI能力和运维体系建设,实现实现事前故障提前预测能力、事中问题快速定位能力。进而完善现有运维监控体系,消除数据孤岛,建成“一体化运行、全业务支撑”的IT运维监控体系。 08 背景分析 1 2 越来越多的分布式架构,更加复杂的依赖关系越来越多的业务系统,更高要求的用户体验 应用场景 4个维度:用户体验/应用性能/网络性能/基础设施 1 运维体系需要体现4个能力,按照监控层级能力由下至上依次是: DEM用户数字体验监控:掌握用户侧性能体验及业务体验,从用户侧了解系统的可用性、体验数据,并协助定位系统的互联网问题及外部问题; NPM网络性能监控:协助客户发现与定位网络侧问题,解决因网络因素导致的系统性能及可用性隐患; APM应用性能监控:协助客户发现与定位应用层问题,实现代码级故障定位和全链路追踪能力,解决应用层的性能隐患; ITIM基础架构监控:全面掌握当前IT系统的物理架构及逻辑架构,实现从laaS层、PaaS层的全面监控,了解网络、系统、应用、数据库等方面的运行状态。 2 故障提前预测能力/故障快速定位能力 从既定事实发生造成影响—>真正提前预知触发管控动作避免事件发生; 从经验推测—>算法预测做到数据说话; 从被动响应运维—>主动运维真正掌控风险;从过去时态运维—>未来时态运维成为现实。 3 基于可观测性构建一体化智能可观测平台 通过一体化智能可观测平台领先的大数据采集和智能分析能力,真正实现全栈、全链路、全场景的智能可观测,故障根因定位和决策支持,显著提升IT运维的能力和效率,减少平均故障恢复时间MTTR,提升业务连续性。 为什么选择博睿数据 平台型产品 博睿数据通过平台化能力实现了IT运维监控体系的 构建,真正意义上做到了一体化智能可观测 丰富的行业经验 博睿数据产品在全国各行业领域服务的使用者广 泛,沉淀了大量的企业管理经验 应用效果 已在北汽集团OA、商城、官网、门户等30+业务系统完 30+业务系统覆盖 成监控覆盖 包括自动生成业务拓扑、端到端代码级问题定位、微服务应 13个监控场景 用性能监控、用户旅程全程记录、智能根因分析等 |让IT运营更智能 蓝谷极狐的新一代用户体验监控平台 通过蓝谷极狐汽车App各终端中嵌入BonreeSDK,获取终端用户访问感知数据,当发版测试及线上运行的时候,车主用户在使用App过程中,BonreeSDK进行用户体验数据采集。做到优化APP的用户体验,提升APP的用户使用满意度,有效减少使用过程中出现异常导致的用户投诉。 11 背景分析 1 2 3 终端车主用户体验效果无法量化APP在开发和上线后缺乏相应的监控能力,问题的发现与定位相对被动排障的沟通成本较高,导致解决问题的周期过长 应用场景 从用户角度定义用户性能体验快速精准定位异常用户 1 2 3 清晰直观展现用户使用应用的全过程 4 上线前的测试阶段到上线后进行App全生命周期运行的性能管理 为什么选择博睿数据 开箱即用 真正的开箱即用的AI,无需人工介入,准确率超行 业标准 专业能力 博睿数据的务实、敬业、和专业让客户增加了更 多的信任 应用效果 当遇到用户投诉时,可将繁琐沟通过程由以天计的成本控制在5分钟内,通过用户ID检索,并使用分享功能,即可让研发复现 安卓车主用户使用体验提升20% 用户异常使用会话 |让IT运营更智能 博睿数据系统性能自动化监控助力东风柳汽数字化运维 博睿数据对东风柳汽通过系统性能自动化监控建设,重构新形势下东风柳汽运维体系,有效提升团队综合数字化意识及能力、规避IT运营风险、建设完备的运维流程机制,有效提升用户体验。 14 背景分析 1 东风柳汽数字化转型目标及要求 随着业务的扩展,IT系统的不断建设,业务对于IT的质量服务要求越来越高,柳汽信息化相关领导提出,将全面提高数字化转型进程,深度挖掘数据价值以提高创新活力。要全面监控系统、网络和应用运行情况,保障日常巡检的全面性、排障的效率、定位问题的深度。 2 通过系统性能自动化监控建设,实现目标 从被动救火式向主动精细化转型,专业化分工、主动分析,主动优化;通过为运维人员提供运维开发平台,降低运维开发门槛,快速落地一些紧迫的运维工具,降低操作性、重复性的运维工作;从依靠经验迈向智能化驱动运维,结合数据分析、知识库、机器学习促进运维智能化。 3 重构新形势下东风柳汽运维体系 随着数字服务体验要求不断提升,传统运维方式已无法满足需要。 ·对接系统多:目前接入生产系统共计17个,DMS、SBOM、东风风行、PV等业务系统相互间存在复杂对接,后续还将根据业务调整对接其他系统。 ·规模增长快:各个项目系统规模及客户服务量均呈现快速增长趋势,对体验交互和系统稳定性、网络性能、可用性等提出更高要求。 ·保障级别高:车主APP已成为客户服务主要入口,透明,涉及经销商、主机厂等跨线条部门,系统保障级别越来越高。 升级传统运维方式为自动化运维,加强对业务系统资源高效、及时、高度精确可控的管理,以实现保障业务系统健康稳固正常不间断运行,有效避免重大故障发生。 应用场景 1 从人工判断迈向智能感知 ·上线ITIM基础架构监控平台后,所纳管范围内的设备在日常运行期间,均得到有效保障,由于基础层设施层所带来的的业务故障从原来的6%降低至1%。 ·2个机房中包含了东风柳汽所承载的生产系统、销售系统、售后服务等核心设备,上线平台后原来不可靠的人工巡检方式转变为系统自动化巡检,不仅降低了故障率,同时也为柳汽节约人力成本。 2 屏山机房生产领域网络性能监控部署架构 屏山机房生产领域网络性能监控架构部署后,多视角场景化视图,使得运维人员有针对性保障业务可用性,透视网络中各网元节点存在的问题,经过优化防火墙、复杂均衡等相关网络策