关注【博睿宏远】公众号,申请免费试用 目录 1产品简介1 1.1概述1 1.2产品优势3 1.3应用场景5 2快速入门5 2.1导航介绍6 2.2探针部署9 2.2.1部署9 2.2.2服务端探针部署10 3使用指南14 3.1仪表盘14 3.1.1新建仪表盘14 3.1.2仪表盘展示及修改16 3.1.3仪表盘删除17 3.1.4其它功能17 3.2警示提醒18 3.2.1故障18 3.2.2告警27 3.3观测洞察28 3.3.1指标体系28 3.3.2数据分析34 3.3.3全局拓扑39 关注【博睿宏远】公众号,申请免费试用 3.3.4分布式追踪45 3.3.5检索中心52 3.4数字体验57 3.4.1终端应用58 3.4.2用户会话70 3.4.3终端网络请求74 3.4.4崩溃与错误78 3.5应用服务83 3.5.1服务、接口、服务实例83 1.1.13.5.2关键方法86 3.5.3数据库调用88 3.5.4消息队列90 3.6基础设施95 3.6.1主机95 3.6.2容器96 3.6.3进程组97 3.7配置99 3.7.1监控配置99 3.7.2聚合识别规则108 3.7.3数据采集124 3.7.4健康评分134 3.7.5AI阈值检测137 3.7.6警示配置142 3.7.7标签管理164 关注【博睿宏远】公众号,申请免费试用 3.7.8数据安全168 3.7.9集成与关联168 3.7.10部署管理170 关注【博睿宏远】公众号,申请免费试用 1产品简介 1.1概述 博睿数据核心产品BonreeONE,是国内首个真正实现智能运维的一体化智能可观测性平台。通过博睿数据领先的大数据采集和智能分析能力,稳定强大的中台能力,具备全球竞争力的产品特性,真正实现从用户到基础设施全栈,全链路,全场景数据可观测,并统一数据规范,从时间和空间上建立起可观测数据关联性,并进一步利用AI智能预测故障、定位根因提供决策支持。真正实现快速高效排障,提升业务连续性,支持业务敏捷迭代,改善客户体验并获得竞争优势。 技术的进步改变了各行各业的业务模式,反过来随着企业数字化转型的推进,新的业务模式也促进了技术的迭代升级。一方面企业的业务对IT系统的依赖度越来越强,这意味着保障业务的快速、持续、高质量的迭代越来越重要。另一方面系统架构、资源环境的复杂度、弹性、动态性增加,传统的监控工具分散、庞杂,虽然提供了各种监控数据,但由于数据量大、数据种类杂、数据关联性差等,导致整个系统不具备可观测性,最终导致业务受损停滞、用户体验差而流失、失去竞争力。我们认为可观测性是“业务”和“技术” 1 关注【博睿宏远】公众号,申请免费试用 之间的中枢引擎,以数据驱动devops敏捷地持续发布高质量的数字化产品,以数据驱动智能化自动化系统运营,从而保证业务战略的平稳高效实施,保障数字化用户体验。 基于此,博睿数据推出了“BonreeONE”产品,她是一个“有见解的一体化智能可观测平台”。我们在一个平台上覆盖了终端应用、微服务、基础组件、基础资源、编排工具等的全栈监控,统一处理Metric、Log、Trace、Event、Metadata、Profile等数据,从时间和空间上建立数据关联性,进一步利用AI/ML技术和领域知识提出见解、发出警报、定位根因。除此之外,我们还在用户行为、服务组件调用、资源利用等层面进行了业务标识,帮助devops聚焦业务,从业务的视角来看待系统,洞察故障对业务的影响、业务的用户体验、业务的资源利用等问题。 从数据到智能,从无序到有序 桌面的有序使人专注,工作的有序使人高效,人生的有序使自己踏实不迷茫,而数据的有序,则能提升资源利用效率,驱动业务创新增长。 在这个数字化时代,数据的价值愈发凸显。面对海量复杂的数据,如何从无序中找到有序,让数据走向智能?作为中国可观测领域的风向标,博睿 2 关注【博睿宏远】公众号,申请免费试用 数据正是站在数据与智能的交汇点上,以其国内首个一体化智能可观测平台 ——BonreeONE,引领着这场数据变革的风暴。 它开箱即用,拥有强大的数据采集能力,全栈监控,使数据有序关联;它借助AI技术精准预测故障,根因定位,已为千行百业超1000家头部 客户实现快速高效排障,提升业务连续性。 在博睿数据的世界里,数据不再是无序的碎片,而是有序的智慧之源。我们相信,通过我们的努力与创新,从数据到智能、从无序到有序的转变将引领着行业未来的发展。 博睿数据,让IT运营更智能! 1.2产品优势 统一 数字化系统本身就是一个整体,终端、微服务、组件、基础资源、网络等各部分相互影响和依赖,任何一点出问题都可能波及整体业务。BonreeONE把用户访问、应用程序、组件制品、基础设施的所有数据有机地整合在一起,提供一个一体化、成体系的解决方案,实现端到端全栈的可观测和告警,打破数据孤岛、简化数据治理、降低管理维护成本。 关联性 得益于BonreeONE统一标准的特性,我们很容易从时间和空间上建立起数据的关联性,完整构建了监控对象之间的关联关系、监控对象上产生的指标、日志、trace、事件等数据的关联关系、业务过程各分布式节点的依赖执行关系。无论是巡检、排障、评估报告都能完整还原上下文。当用户发现某一实体出现故障时,BonreeONE可以自动计算出故障相关的影响范围,自 3 关注【博睿宏远】公众号,申请免费试用 动关联出相关的指标、日志、调用链、事件、用户会话、业务等。当用户发现某一指标异常或某一笔业务调用链路异常时,可以进一步追踪细查相关的记录明细从而定位问题。 智能见解 得益于BonreeONE统一和关联的特性,我们基于知识库经验规则和自研的SwiftAI中台,主动对所有数据进行异常检测和相关性分析,从而智能地发现问题、提出见解、预测故障、识别虚假和重复告警、分析问题影响范围、定位根因。 聚焦业务 为各角色提供业务视角,无论是研发还是运维还是产品运营,不仅仅可以关注自己职责相关的信息,也可以知道自己负责的部分是如何支撑和影响业务的。 1.3技术优势 BonreeAgent免配置集成化智能探针 14年沉淀大数据采集能力,500+技术框架原生支持采集所需数据,支持20 万+探针数据上报 SuperTrace应用程序性能在线智能分析技术 实现从前端到后端全链路自动标记和关联调用链,识别性能奇点,方便客户去做分析和判断 OneIntegration智能对接几百种第三方数据 拥抱Zabbix、Prometheus、OpenTelemetry等主流开源生态,三方数据接入开箱即用 Zeus多模态联邦查询大数据引擎 4 关注【博睿宏远】公众号,申请免费试用 基于客户诉求,博睿数据自主研发的数据引擎,拥有稳定强大的中台能力,实时高效,助力智能运营。 SwiftAI自适应生成式人工智能技术 170+技术加持,国内独家“无监督知识图谱”根因分析算法,常态化收敛比达 98%的告警收敛算法。 SmartTopo实体关联拓扑智能构建技术 无需人工配置,自动从观测数据获得IT系统架构关联关系,实时更新并展示拓扑和关联关系。 1.4使用场景 保障和提升用户体验,全栈监控,全团队目标一致 数字经济时代,用户体验是重中之重,数字系统所有环节的监控和管理都是为了保障和提升用户体验。为了实现对用户体验问题的全面感知,全栈监控必不可。BonreeONE平台开箱即用地把影响用户体验的各环节都监控起来,帮助企业实现覆盖终端、网络、云、边、服务、组件等的全栈监控,并且利用关联追踪和智能见解的能力提升工作效率。 搭建更适合云原生的可观测平台 企业在利用K8S、容器、服务网格等云原生技术提升软件交付效率的同时也需要配套的搭建适合云原生的监控观测平台,传统的割裂的监控工具不适应云原生持续发布、弹性动态等特点。ONE平台的SmartAgent完美适配云原生技术,帮助客户享受云原生技术红利。 监控体系治理,搭建统一的可观测平台 为了监控无死角,排障不遗漏,企业根据纳管的对象搭建了很多监控工具。但随着数字系统的复杂化,监控体系变得混乱难管理,堆积的数据指标 5 关注【博睿宏远】公众号,申请免费试用 不成体系,数据价值低,排障定位问题难。ONE平台把各类监控数据和元数据有机融合,标准化规范化地管理起来,解决重复建设、工具多难维护、数据多但价值低等问题。 高质量可观测数据加自研SwiftAI能力平台,让AIOps更落地 当前AIOps落地难效果很难达到用户预期,很大原因是数据质量低,AI算法的场景适应差。ONE平台对数据进行统一治理,形成标准规范化的数据,大大提升数据质量。ONE平台的SwiftAI中台将技术经验和算法结合对常见运维场景进行适配,提升了故障异常检测、根因定位的效果,实现开箱即用的AI能力。 满⾜企业安全性要求兼容多元化数据接入 根据用户数据源的外网访问策略,One集成功能提供了多元化的数据接入接入方案,能够满⾜不同类型客户的数据源接入需求。同时提供了丰富的数据处理算⼦对结构、异构数据进行加工,帮助客户完成数据接入。 2快速入门 2.1导航介绍 一级导航 二级导航 描述 仪表盘 仪表盘 让您能够灵活地快速搭建可视化仪表盘,用于日常巡检、监控大屏、概览等场景。 警示提醒 警示提醒 此模块会列出我们认为您最需要关注的事件信息,如:故障、告警。 告警 展示平台发出的告警信息。 6 关注【博睿宏远】公众号,申请免费试用 故障 展示平台发现的故障,以及故障的影响范围、故障的根因、故障判定的过程。 观测洞察 观测洞察 我们采集和集成了很多可观测数据,此模块为您提供了分析这些数据的工具,让您按照自己的经验和思路洞察数据背后的真相。 检索中心 灵活的检索任意明细数据。 指标体系 分类整理了所有指标,方便您统一指标体系,统一事实标准。 数据分析 灵活分析数据的工具。 分布式追踪 选中分布式链路上的任意节点,分析该节点的依赖和影响,洞察流量在不同链路分支的分布、耗时占比高的链路分支等。 全局拓扑 提供了一个立体的拓扑,包括横向的调用关系和纵向的依赖关系。 数字体验 数字体验 此模块的数据主要来自于各用户端(APP、小程序、web、pc),您可以透过环境、设备、用户、代码、请求等评估应用质量和用户体验。 终端应用 提供了对整体应用的质量和用户体验的评估。 用户会话 记录并展现了用户旅程以及应用程序在此过程中的活动和表现。 7 关注【博睿宏远】公众号,申请免费试用 崩溃与错误 多维度分析崩溃、卡顿、异常等问题。 网络请求 多维度分析网络请求的质量,洞察慢请求、请求错误、资源请求、CDN请求、socket请求的问题。 应用服务 应用服务 此模块的数据主要来自于服务端的应用服务层,提供了跨进程、跨网络区域、代码级的调用链路分析。 服务 列出所有服务,提供每个服务的性能洞察,包括服务对基础设施的依赖、服务的上下游、服务实例和服务接口性能数据。 接口 列出所有接口,提供每个接口的性能洞察。 关键方法 列出用户定义的所有关键方法,提供方法级的性能洞察。 数据库 列出所有从应用服务侧感知到的数据库实例,提供每个数据库以及每个SQL的性能洞察。 消息队列 列出所有从应用服务侧感知到的消息队列实例,提供每个消息队列以及每个Topic的生产和消费的性能洞察。 基础设施 基础设施 此模块提供了对与业务无关的基础设施的监控和洞察。 技术组件 提供了对组件、中间件等通用软件的监控和洞察。 8 关注【博睿宏远】公众号,申请免费试用 进程 提供了对进程组和进程实例的监控和洞察。 容器 提供了对容器的监控和洞察 主机 提供了对主机的监控和洞察 部署配置 部署配置 统一的部署和配置管理 部署状态 查看探针和smartGate的部署情况、启用禁用情况。 部署中心 提供探针下载部署和更新的引导 配置中心 统一的配置中心 平台能力 平台能力 账号相关的管理 基本信息 账号信息的查看和修改 License管理 Lic