这篇科学报告研究了一种使用随机森林识别健康纵向预测因素的方法。该方法用于分析来自30年运行的Doetinchem Cohort Study的研究暴露体与自我感知健康之间的关系。该方法在先前的研究中具有良好的预测性能,并通过应用说明其潜力。该方法通过部分依赖和累积的局部效应图来可视化预测变量和结果之间的关系,并通过将风险表示为随时间的平均风险和平均趋势来总结风险。该方法证明了ML可以解释得比普遍认为的要多,并且可以在重复测量暴露的研究中用于确定生命过程中重要的健康纵向预测因子。该方法与上下文无关且广泛适用。