证券行业可观测性实践 精选案例集 SECURITIESINDUSTRYCASESTUDY 2024 博睿数据重磅发布 EXCELLENTCASES 前言PREFACE 在当前时代,5G、云计算、AI大模型技术迅猛发展,金融领域正迎来前所未有的机遇与挑战。政府工作报告中明确提出要“大力发展科技金融、绿色金融、普惠金融、养老金融、数字金融”,这不仅是时代的呼唤,更是金融业未来发展的必由之路。 在数智化浪潮的推动下,证券行业自有系统的稳定性、性能、瓶颈以及由故障所带来的各类影响,都让系统和业务的风险不断增加,这造成了可观测能力上的盲点。导致证券行业无法优化企业及其客户的数字体验。显然,要想有效监测复杂的云原生环境,证券行业亟需一个针对当今云原生架构的一体化智能可观测平台。 博睿数据的一体化智能可观测平台凭借领先的大数据采集和智能分析能力,真正实现全栈、全链路、全场景的智能可观测,帮助证券企业实现运维环境的可视化,直观地对应用各个服务环节的性能指标进行智能化分析,助力其有效提高运维的能力和效率,为证券业务的发展扫清障碍。 本案例集围绕项目背景、应用场景、应用效果等多个维度展开介绍,全面展示了博睿数据为证券行业深度赋能的最佳实践,期望通过这些优秀案例为业界提供可参考、可复制的最佳应用实践,同时带来更多有益的启示与借鉴。 目录CONTENTS 东方证券 01 国泰君安证券 05 红塔证券 08 招商证券 11 中信建投证券 14 中银国际证券 17 光大证券 21 东北证券 24 华安证券 27 国金证券 30 国元证券 33 上海证券 36 |让IT运营更智能 东方证券 为用户带来完美交互体验 博睿数据协助东方证券真正掌握用户体验性能数据,快速定位和分析影响用户体验的故障问题,有效提升用户满意度,为证券业务的可持续发展扫清障碍。 使用产品 BonreeServerBonreeStock 博睿数据带给我们的是一些你看不到的财富,像用户互联互通,用户体验这些问题都可以在无形中去解决,只有我们自己内部运维的人才会真切感受到博睿数据带给我们的价值。 ⸻周为伟|东方证券运维研发主任 案例荣获《金融电子化》 2021科技赋能金融业务突出贡献奖 1 背景分析 1 用户体验性能数据庞大,用户体验亟待优化 2 东方证券作为行业领先的证券企业,旗下的东方赢家APP拥有庞大的用户基数,用户日常使用手机进行资讯获取、股市行情查看、在线交易等操作时,难以掌握用户使用业务的全过程,真实用户体验难以了解,导致用户投诉率居高不下,因此构建用户评价体系、提升用户满意度成为东方证券业务发展的重要方向。 定位与解决故障问题速度慢,排障周期长 面对常见的应用使用中出现的故障诸如:页面打开慢/打不开、用户在线办理业务失败、APP无法登录等,开发人员无法做到快速复现故障场景,只能通过传统报障等手段进行故障处理,故障排除排查周期长。 3 追溯违规交易缺乏数据支撑 东方证券缺少针对性的数据分析,难以为交易审计提供有效辅助,进而杜绝违规交易的发生。 应用场景 1 APP会话散点/交互分析,助力用户体验提升 通过会话散点,博睿数据协助东方证券重点关注体验评分较低的会话,并通过查看会话信息,发现测试APP的各类可自定义的指标数据;通过交互分析,记录APP的性能数据,并对用户单个操作步骤存在的问题进行展示,快速发现影响用户体验的环节,有效提升用户满意度。 服务节点维人 2 展现上下游调用关系,快速定位与解决问题 东方证券的系统架构进行了微服务化改造,单个应用涉及的和进程众多,通过BonreeServer调用链展示,清晰展现了某与上下游节点之前的调用关系和调用延迟,为研发人员及运员提供了直观的一览图,方便快速定位和分析问题。 3 打破数据孤岛,消除开发与运维之间的隔离墙 通过BonreeServer调用链,可在开发测试环境对单个应用的上下游调用进行功能测试和压力测试,在开发测试环境精准定位问题并快速处理,测试通过后在生产环境投产,消除开发与运维之间的隔离墙,极大提高IT工作效率,助力东方证券系统实现DevOps。 4 竞品分析,优化自身行情与交易性能 通过BonreeServer调用链,可在开发测试环境对单个应用的上下游调用进行功能测试和压力测试,在开发测试环境精准定位问题并快速处理,测试通过后在生产环境投产,消除开发与运维之间的隔离墙,极大提高IT工作效率,助力东方证券系统实现DevOps。 5 实时行情分析,优化APP站点部署 BonreeStock可对行情异常刷新情况进行分析,通过检查连接的行情站点、设备的网络环境,对比友商等维度,发现行情异常刷新的原因。同时,根据东方证券提供的指定服务器,BonreeStock可配合研发对行情数据进行抓包记录,并统计同一台设备一天内站点切换次数,发现站点切换机制的问题,为东方证券在APP站点部署方面进行优化提供思路。 为什么选择博睿数据 雄厚的公司实力 APM行业首个A股上市公司、企业核心竞争力强 卓越的产品性能 产品稳定性与安全性强、可实现完整可观测性 应用效果 APP性能数据记录 APP交互执行率高于99% 系统架构瘦身 将27个测试用例精简为3个脚本 清晰的上下游调用关系 故障定位时间小于0.1min,故障率低于0.1% 异常交易的终端地址、APP版本、网络状况、客户端IP以及 杜绝违规交易 会话持续时间一目了然 |让IT运营更智能 国泰君安端到端 一体化监控体系建设之路 博睿数据为国泰君安提供全栈技术解决方案,持续关注证券业务接口的可用性与网络连通性,在国泰君安多套系统中做了相应部署,实现快速告警、定位、解决问题,保障300W+日活用户的使用体验。 使用产品 BonreeServerBonreeNetBonreeStock 5 背景分析 1 国泰君安业务对IT性能的要求不断提高 2 国泰君安业务水平稳居全国券商排名前三,IT水平连续数月居于全国券商榜首,确立了全方位的行业领先地位,随着数字化转型的进一步推进,国泰君安对于IT性能稳定性的要求不断提高。 日活用户量大,用户体验如何保障 国泰君安APP日活用户已达到数百万,用户体验保障面临全新的挑战,用户投诉率较高。 3 数据孤岛导致问题定位与排障速度慢 国泰君安的业务规模与用户体量决定了其系统的庞杂性,业务种类繁多、相互影响,独立的监控工具带来的监控数据孤岛,造成定位问题时间长排障周期长。 应用场景 1 保障用户体验,提升用户满意度 国泰君安始终坚持以用户为中心的理念,致力于为用户提供卓越的体验。博睿数据助力国泰居安在影响终端用户之前,及时发现和处理问题,并对出现问题的环节进行优化和改进,有效提用户满意度和保留率。 2 监测核心业务系统,实现端到端性能可视化 BonreeServer为国泰君安提供端对端的监控应用系统,通过相关调用拓扑图,展现各组件间调用关系,同时对于硬件自身CPU、内存以及相关I/O进行实时监控,及时预警,推动运维方式由被动式维护向主动式维护转变。 3 定位性能瓶颈,提升IT体验与效能 4 国泰君安内部IT架构微服务化,单个应用涉及服务和服务数量庞大,需要通过端到端调用链展示,BonreeServer可监测从发出请求到会话结束过程中的所有调用关系,通过调用耗时、吞吐量等数据展现每一次调用,帮助国泰君安在复杂的拓扑中快速准确地定位性能瓶颈。 保障业务稳定性,提高系统管理水平 国泰君安拥有庞大的系统架构,在部分应用的管理上缺乏具体量化指标来量化开发软件的质量,在引入博睿数据APM后,对应用关键指标进行量化,并在测试阶段进行评估,及时对问题及故障进行修正,避免了上线后出现重大生产问题而影响业务稳定性。 5 精准定位故障,降低IT运营风险 6 通过BonreeNet的主动式拨测,对国泰君安网络状况、应用运行等方面进行实时监控,准确定位每一次慢请求或错误请求的产生原因,定位重点问题的影响范围,降低国泰君安IT运营风险,实现用户数量和业务体量增长,持续打造核心竞争力。 助力行情排名提升,服务可靠性再升级 通过BonreeStock全方位立体化的展现行情业务的运行情况,实时监测行情的异常波动情况,与BonreeNet主动式拨测的数据相结合,判断影响行情排名的关键因素,从而保证国泰君安行情排名稳定,展现强大综合实力。 为什么选择博睿数据 技术实力领先 行业内首家通过CMMI5级评估认证的企业 产品功能领先 全栈/全端/全场景智能可观测,性能稳定高效 应用效果 APP稳定性监测 APP响应时间小于0.3s,请求错误率低于3% 快速发现影响性能的方法代码、数据库和调用关系,减少 代码级问题诊断 MTTR时间 用户体验关联 无缝关联DEM,实现端到端监控 行情排名提升 2020、2021年行情综合排名蝉联榜首,交易全A级 案例入选爱分析 2022中国IT运维创新实践案例 |让IT运营更智能 红塔证券的IT运维创新实践 博睿数据为红塔证券提供APP性能监控、后端应用程序监控、行情速度和交易优化、关键业务或指标的拨测三方面的服务,为红塔证券保障业务稳定性、优化用户体验,增加用户粘性保驾护航。 使用产品 BonreeServerBonreeNetBonreeStock 8 背景分析 1 用户数量庞大,保障用户体验十分重要 随着红塔证券的覆盖率越来越广,用户数不断增加,对用户使用体验的关注度也越来越高。登录不成功、连接超时、响应缓慢、耗时较长等一系列影响用户使用体验的问题,需要在用户使用前及使用过程中及时发现并优化。 2 亟需全面的监控体系以优化系统性能 用户使用APP以及其他关键业务的性能分析和全局可用性监测迫在眉睫,红塔证券急需部署和上线性能监控相关的功能。同时也需要通过分析采集到的性能数据,快速进行产品优化及更新迭代,保障业务稳定性。 应用场景 1 实现对红塔证券APP的性能监控 2 通过APP性能监控,帮助红塔证券获取APP用户使用过程中的网络问题、各区域用户性能、各个链路请求耗时情况、错误和慢请求、交互信息、崩溃、卡顿以及其他用户体验相关的问题原因。 应用拓扑自动可视化,了解应用健康情况 3 BonreeServer增加了对红塔证券服务层和应用层的监控能力,实现对服务器应用健康情况的实时监控,及时发现慢请求和错误请求,并智能剖析线程和代码,帮助红塔证券了解后端应用性能表现的各个环节;代码级别的问题、容器级别的问题、系统层面的问题、业务调用层面的问题等。无需研发人员参与,自动透视代码运行效率,应用拓扑自动可视化,透视业务和IT设备之间的关联关系。 对行情和交易服务器的性能和可用性进行实时监控 4 博睿数据实时对红塔证券行情和交易服务器的性能和可用性进行监控,优化了包括手机证券在内的服务性能、行情查询和交易速度等。 对分布式节点进行监控与优化 博睿数据对分布式节点进行主动式拨测并优化,并通过行情节点测试,明确优化后的效率提升。 5 对比竞品性能,有针对性地进行优化 通过对比同类型或同等规模券商的网上交易平台或其他关键业务的性能,帮助红塔证券取长补短,持续优化,进而达到行业前位的水平。 为什么选择博睿数据 深耕金融行业与关键场景 博睿数据在为金融行业提供服务中积累了丰富的经验 产品稳定可靠 博睿数据产品在客户生产环境稳定运行超过14 年,兼具稳定性与可靠性 应用效果 5面对APP用户使用过程中的网络问 快速定位问题根因 题、各区域用户性能、错误和慢请 求、交互信息、崩溃、卡顿以及其他 用户体验相关的问题,做到快速定位 问题根因 5 直观展示后端应用性能表现的 代码级别的问题、容器级别的问 各个环节 题、系统层面的问题、业务调用层 面的问题等均可一目了然 键业务的接口的连通性和可用性 续监测登录、查询、行