热门搜索：

郑欣-无处不在的模型之简要质量度量

信息技术2024-05-132024 第22届 GOPS 全球运维大会暨 XOps 技术创新峰会 · 深圳站王***

AI智能总结

质量度量模型概述

1. 质量模型的重要性

概念抽象：IT研发过程复杂，难以宏观衡量质量。
碎片化：单一指标度量表达复杂，难以全面反映质量。
难以指导改进：仅展示指标而未进行深入分析，不利于质量改进。

2. 质量建模挑战

理论模型选择：众多质量模型如何选择？
公共模型的应用：如何将公共模型应用于实际？
指标管理：如何管理和使用大量指标？
模型验证：如何证明模型的有效性？

3. 质量度量模型构建

建模三要素：数据、指标、权重。
数据预处理：数据清洗、确定置信区间、确定中位数、确定基线和优秀线。
指标管理：定义指标实体、指标属性和指标关系。
建模方法：使用知识图谱构建知识库，从结构化和半结构化数据中提取知识。

4. 质量度量模型应用

一元线性回归：通过总分预测各科成绩，确定提高概率顺序。
多元线性回归：通过多个变量预测总分，应用于多因素分析。
模型诊断：通过R²检验线性关系、正态性、方差齐性和独立性，评估模型拟合度。

5. 模型应用实例

确定分析目标：如代码总流失率、崩溃率、系统可用性等。
数据理解：理解数据背景和需求。
数据准备：数据清洗和预处理。
建立模型：选择合适的模型进行构建。
模型评估：评估模型性能。
模型发布与应用：发布模型并应用于实际场景。

关键数据

一元线性回归：通过总分预测各科成绩，提高概率顺序为数学 > 英语 > 物理 > 化学 > 历史 > 道法 > 语文。
多元线性回归：通过多个变量预测总分，应用于多因素分析。
模型诊断：R²值用于评估模型拟合度，R²越接近1表示拟合度越高。

以上是研报主要内容的总结，重点关注了质量度量模型的关键点和关键数据。

无处不在的模型之简要质量度量高效运维社区郑欣郑欣高效运维社区资深专家曾就职于大连创盛，EMC²，立思辰，作业盒子等企业，担任测试管理相关工作。专注于测试团队效能提升改进，敏捷化转型，DevOps改造等相关领域的工作请替换您的照片 01无处不在的模型目02质量度量模型 contents 录03模型诊断 04模型应用 PART01 无处不在的模型漏斗模型金字塔模型无处不在的模型 23年3月21日，随着ChatGPT4的发布，大模型被推上了风口浪尖。 LOREM LOREM 中小模型是我们工作的法宝。 LOREM LOREM 波士顿矩阵分层模型为什么要建质量模型 1）概念抽象：IT研发过程比较复杂，很难对质不量进行宏观的综合判断。易解没办法衡量好坏。理 2）碎片化：用单一指标平铺的方式进行度量表达，可读性差，表达片面限制人们的分析理解。木桶效应质量建模碎片化 4）难以指导改进：仅对指针标进行展示，不代表反馈对差了质量。缺失了加工分析，性得出结论的过程，不利于优化改进。 3）缺乏针对性：对企业长期存在的痛点问题，对应性差。无法通过指标引导，进行各种痛点问题的集中体现。 3 4 质量模型困境效果评估模型选择 1.理论模型多，如何选择？ 2.公共模型涉及广泛，如何指导实践？ 3.指标多，如何管理使用？ 4.建模之后，如何证明模型正确有效？模型一定是正确的吗？模型演进随着科学的发展，每天都有模型被抛弃、修正、提升、迭代模型应用模型是定制的，方法是通用的，建模方法可以在垂直范围内跨领域应用。千里之行，始于足下：积累一些分析优化的方法，通过数据分析，持续优化迭代模型，持续改进。 1 2 从本质上说，所有的模型都是错误的，但有些是有用的。 ——乔治.伯克斯（GeorgeBox）日心说（欧多克斯）地心说（哥白尼）300年质量度量模型 1991年ISO/IEC9126提出： •内部质量——研发过程； •外部质量——软件提供的功能和价值； •使用质量——用户角度；包括3个层次： •质量特性 •质量子特性 •度量指标图1-1部分质量模型图1-2ISO25000质量模型 •建设范围——理论模型 •建设素材？ •建模方法？图1-3McCall质量模型 PART02 质量度量模型简要建模方案-定权模型建模三要素：数据、指标、权重指标数据指标（自变量）X权重指标（因变量）X权重优秀90 基线60 范围等级分数内部质量分权重1 100% 等级5 5 [90%-100%) % 等级4 4 [80%-90%) 等级3 3 [60%-80%) % 等级2 2 [0-60%) 等级1 1 单测增量行覆盖率 x 权重A 单测通过率 x 权重B 静态扫描缺陷 x 权重C 。。。。。。 x 权重D x 外部质量分权重2 x 使用质量分权重3 。。。。。。权重4 xx 内部质量分质量分质量度量模型-数据数据 100% 等级5 5 [90%-100%) % 等级4 4 [80%-90%) 等级3 3 [60%-80%) % 等级2 2 [0-60%) 等级1 1 优秀90 基线60 范围等级分数图2-1数据清洗思维导图图2-3正态分布图2-2趋势散点图图2-2置信区间散点图 1.数据预处理 2.确定置信区间 3.确定中位数 4.确定基线 5.确定优秀线质量度量模型-指标类型示意指标类型示意指标内部质量 —代码质量单测增量行覆盖率内部质量——过程质量提测成功率单测通过率缺陷有效率静态代码缺陷情况二次缺陷率 *** *** 内部质量 ——正确性缺陷分布交付效率（可选）平均交付时长缺陷密度平均缺陷恢复时长缺陷严重率自动化测试执行效率 *** *** 外部质量 ——正确性生产缺陷数量成本（可选） *** 生产缺陷密度 *** 缺陷逃逸率 *** *** *** 内部质量01 外部质量02 使用质量03 知识图谱是知识库的一种，是知识的一种描述、组织和存储方式。他是人类语言中所涉及的概念、实体、属性、概念之间、实体之间的关系。 •建设范围——理论模型 •建设素材——指标+元数据体系、数据 •建模方法？图2-4指标属性质量度量模型-指标指标管理： 1.指标实体 2.指标属性——统计检索 3.指标关系——下钻上卷构建知识库，是将知识从结构化、半结构化的数据中提取出来，包括命名实体识别、命名实体的链接与关系抽取。实体是客观世界的事物，是构成知识图谱的基本单位。命名实体指自动识别制定类别实体。 •建设范围——理论模型 •建设素材——指标+元数据体系、数据 •建模方法？图2-6E_R图2 图2-5E_R图1 质量评价模型-权重建模三要素：样本选择——指标数据预处理——数据建模和参数估计——权重 •建设范围——理论模型 •建设素材——指标+元数据体系、数据 •建模方法？图2-7权重的计算方法 PART03 模型诊断质量度量模型图3-1部分机器学习模型一元线性回归编号姓名语文数学外语总分 1 喜羊羊 97 98 99 294 2 美羊羊 83 82 89 254 3 沸羊羊 76 75 71 222 4 慢羊羊 63 67 64 194 5 懒羊羊 59 55 42 156 应用范围：量纲一致一元线性回归方程,用于预测 Yt=axt+b a为斜率，b为截距误差最小原则：最小二乘法图3-2散点图1 线性关系中，有可能出现多条直线。如何进行选择呢？图3-2散点图2 编号项目内部质量外部质量使用质量总分 1 喜羊羊 97 98 99 294 2 美羊羊 83 82 89 254 3 沸羊羊 76 75 71 222 4 慢羊羊 63 67 64 194 5 懒羊羊 59 55 42 156 图3-3散点图3 一元线性回归编号姓名语文数学外语总分 1 喜羊羊 97 98 99 294 2 美羊羊 83 82 89 254 3 沸羊羊 76 75 71 222 4 慢羊羊 63 67 64 194 5 懒羊羊 59 55 42 156 图3-4散点图4 编号项目内部质量外部质量使用质量总分 1 喜羊羊 97 98 99 294 2 美羊羊 83 82 89 254 3 沸羊羊 76 75 71 222 4 慢羊羊 63 67 64 194 5 懒羊羊 59 55 42 156 图3-5分数表格当总分增加1分的情况下，这1分来自某个学科的概率。按提高概率大小排序，得到：数学>英语>物理>化学>历史>道法>语文，其结论就是学校在以后的教学策略中，要重视数学，其次是英语、物理、化学、历史和道德与法治，最后是语文。多元线性回归多元线性回归之标准方程法：编号姓名短跑（s）x1 跳远（m）x2 跳绳（个/分）x3 总分y 1 喜羊羊 6=x11 8.9=x21 200=x31 y1 2 美羊羊 7=x12 8.5=x22 180=x32 y2 3 慢羊羊 8=x13 8=x23 150=x33 y3 4 沸羊羊 9=x14 7.5=x24 140=x34 y4 5 懒羊羊 10=x15 7=x25 120=x35 y5 应用范围：量纲不一致标准方程法 hθ（x）=θ0+θ1x1+θ2x2+。。。+θnxn 编号项目单测覆盖率x1 缺陷数量x2 缺陷严重率x3 内部质量y 1 喜羊羊 6=x11 8.9=x21 200=x31 y1 2 美羊羊 7=x12 8.5=x22 180=x32 y2 3 慢羊羊 8=x13 8=x23 150=x33 y3 4 沸羊羊 9=x14 7.5=x24 140=x34 y4 5 懒羊羊 10=x15 7=x25 120=x35 y5 图3-6线性代数矩阵图 θ=（XTX）-1XTy 图3-7多元线性图回归模型诊断回归模型诊断： 1.检验线性关系 2.检验正态性 3.检验方差齐性 4.检验独立性模型弥合度：回归线和各观测点的接近程度误差计算总平方和（SST）真实值-均值的平方和回归平方和（SSR）预测值-均值的平方和残差平方和（SSE）真实值-预测值的平方和 R2=SSR/SST=xT*y相关系数/弥合度建设步骤： 1.识别重要变量 2.判断相关性的方向 3.估计权重（回归系数） R2越趋近1，说明弥合度越高；越趋近于0说明弥合度越低。 PART04 模型应用 Thanks 高效运维社区DevOps时代荣誉出品 GOPS全球运维大会2024·深圳站 THANKS 感谢大家观看 7Pace 确定目标-目建立模型模 - 代码总流失率崩溃率系统可用性缺陷密度确平均检测时间估 (MTTD) 平均故障间隔时间 (MTBF) 平均解决时间（MTTR）（[时间段]内的[添加行数]+[修改行数]+[删除行数]）标理解和转化-指标准备- 调优发布与应用 - 型分析目标、数据理解、数据准备、建立模型、模型评定模型发布与应用。、 [总执行时间]/[失败总数] 【从发现到解决的总时间】/【修复总数】客户满意度（CSAT）修复漏洞的平均时间代码覆盖率 [满意客户总数]/[客户调查回答总数]*100 [漏洞发现到修复之间的总时间]/[时间段]内的[漏洞总数] [测试的代码行数]/[代码库中的代码总行数]*100 一元权重模型的建设确定目标-目建立模型模可靠性功能代码特点界面可访问性系统性能缺陷管理文档跨平台适应性安全保障总体满意度故障率、系统可用性、崩溃率理解和转化-指标准备- 调优发布与应用 - - 标故障概率、错误数量、错误的严重性型代码行数、代码清晰、遵守编码规则确估分析目标、数据理解、数据准备、建立模型、模型评模型发布与应用。定、检测崩溃和错误的平均时间、系统故障之间的平均时间解决错误的平均时间、工单积压：

点击免费查看完整报告