中国DevOps社区峰会2023·广州 量化管理在软件研发中的应用 张玉洁-禅道-产品经理 张玉洁 禅道软件(青岛)有限公司·产品经理 禅道项目管理软件 ZenDAS统计分析工具 识别与定义对象 分析历史数据分布规律 分析历史数据因果规律 识别并实施改进措施 定量的评价改进效果 目录 1 2 小刘的困扰数据收集难 3数据无规律 4数据分析难 5Q&A 小刘的困扰 迭代难题 照葫芦画瓢 困难重重 迭代延期 迭代难题 照葫芦画瓢 困难重重 •数据收集难 •数据无规律 •数据分析难 数据收集难 度量角色划分 度量指标定义 定义度量 数据收集 度量角色划分 •度量的采集和定义是由两个角色共同协作完成的。 •度量定义者是上游,数据收集者是下游。 •度量定义非常关键,直接影响数据收集的准确性。 名称 完成研发需求数 范围 迭代 对象 研发需求 目的 规模估算 描述 迭代中已完成的研发需求数 单位 个 采集时间 迭代完成后 小刘的定义有什么问题? 名称 完成研发需求数 范围 迭代 对象 研发需求 目的 规模估算 描述 迭代中已完成的研发需求数 单位 个 采集时间 迭代完成后 •定义描述不清晰。 •用excel的方式储存。 数据无规律 小刘的数据 数据的清洗 小刘的数据 对数据实施正态性检验。 正态性检验的作用是确定数据是否具有正态分布的特征。如果数据满足正态分布假设,那么一些统计方法和假设检验的结果将更加可靠和准确。 小刘的数据——正态性检验 正态性检验的p值是用来评估数据是否服从正态分布的概率。 如果正态性检验的p值较大(通常>0.05),则表示数据在统计意义上可以被认为是服从正态分布的。 小刘的数据——控制图 控制图分析可以提供关于过程稳定性、能力和异常情况的重要信息,帮助组织监控和改进其过程,以实现质量控制和持续改进的目标。 •中心线:中心线代表数据的中心或平均值。 •控制限:控制图上通常会绘制上下两条控制限,用于标识过程的稳定性范围。 1.寻找迭代交付效率低的原因。 存在异常迭代,迭代临近发版,时间主要用来解bug。解决方案:移除异常迭代。 2.寻找工期偏差率高的原因。 开发小组长在迭代全部任务完成之后没有及时关闭迭代。解决方案:修正数据。 清洗之后,P值>0.05,符合正态分布。 数据分析难 相关性分析 数据建模 数据预测 数据监控 相关性分析 相关性分析是一种统计方法,用于衡量和描述两个或多个变量之间的相关关系和相关程度。 r是相关性系数,取值范围在-1到1之间。r的绝对值越接近1,表明两个变量之间的相关性越强,反之越弱。p值用于评估两个变量之间的相关关系的显著性。如果相关性检验的p值较小(通常小于0.05),则表示两个变量之间存在显著的相关性。 通过p值判断变量之间是否具有相关性,再通过r值看相关程度。 数据的建模——回归分析 作用: •预测与优化:基于给定的因子值,回归方程可以用于预测目标变量的值。这可以帮助确定在给定因子条件下,目标变量的表现。然后通过对因子进行调整和优化,可以寻找最佳的因子组合,以达到期望的目标结果。 •因子优先级排序:回归方程中的系数还可以用于确定因子的优先级排序。系数绝对值较大的因子对目标变量的影响更大。 •过程控制和调整:通过实时监测因子值和目标变量的变化,并结合回归方程的预测能力,可以进行过程控制和调整。如果因子值偏离了预期的范围,导致目标变量与期望的预测值之间存在较大差异,可以及时采取措施来调整和控制因子,以实现目标的达成。 数据的预测——数据分布 根据影响历史数据,我们无法直接推断出未来目标变量与影响因子的具体数值,但可以拟合出数据的分布。根据数据分布,预测目标值的概率密度分布,通过目标值的概率调整影响因子取值,获取改进方案。 蒙特卡罗模拟又称为统计模拟法、随机抽样技术。依赖计算机从输入变量的概率分布中大量、随机抽样,以得到输出变量的分布。 例: 目标:到达公司的时间概率分布 影响因子:起床耗时,洗漱耗时,路程耗时... •预测值达到目标期望后,可以针对性的实施改进措施。 •改进后通过实时监测因子和目标变量的变化。 •实时监控过实时监测因子和目标变量。评价改进措施有无效果。 •如果因子值偏离了预期的范围,可以及时采取措施来调整和控制因子,以实现目标的达成。 通过运用量化管理知识和统计分析工具,以更科学的方式做管理。 THANKS!