2023年DataFunSummit 因果分析及其在库存控制中的应用 ErliWang(王尔立) NEC实验室,中国 Apr22,2023 C 本体 目录 库存控制描述 背景:时间序列, 因果关系 因果关系有助于需求预测 因果关系有助于 补充 战略 01库存控制说明 •目标:在最大化高价值客户需求之间取得良好的平衡 实现并最大限度地减少存储、交付和废物成本。 客户 库存控制流程 历史交易 日历 活动 库存:good2 观察 最优顺序 库存good1 需求预测 需求预测' … T1T2 •原样:根据我们的调查,许多大公司仍然, •需求预测是基于过去的经验,而不是数据驱动,难以进一步改进。 •库存政策简单采用(s,S)策略,未考虑实际存在的不确定性,如错误的库存水平。 历史观察 ·因果分析有助于理解业务流程以解释性方式发生的原因。 哪一个应该被信任? 自动确定关系 Time 浏览 曝光 Price 订单 4/19/2023 45 1 324 178 4/18/2023 11 0 319 156 4/17/2023 78 0 288 205 4/16/2023 56 1 4/15/2023 37 0 𝑶𝒓𝒅𝒆�=𝟎.�∙𝒃𝒓𝒐𝒘𝒔� 𝑶𝒓𝒅𝒆�=−𝟎.�∙𝒃𝒓𝒐𝒘𝒔�+𝟏.�∙�𝑬𝒙𝒑𝒐𝒔𝒖𝒓𝒆=�+𝟎.�∙𝒑𝒓𝒊𝒄� t-3t-2 t-1t 浏览 曝光 𝑶𝒓𝒅𝒆� 305238 296199 𝑶𝒓𝒅𝒆� =𝟎.�∙𝒃𝒓𝒐𝒘𝒔��−�+𝟎.�∙𝒃𝒓𝒐𝒘𝒔� � � �−� =−𝟎.𝟎�∙𝒃𝒓𝒐𝒘𝒔��−�+𝟏.�∙�𝑬𝒙𝒑𝒐𝒔𝒖𝒓�𝒕−�=� +𝟎.�∙𝒑𝒓𝒊𝒄𝒆(�−𝟏)−𝟏.�∙𝒑𝒓𝒊𝒄𝒆(�−𝟐) … 预测关系 Price订单 可视化关键因素 估计的善良 每个州的决定 •库存控制的关键是将每个状态映射到行动,满足 •路线图: 域适应B 需求预测D •方法-1:改善需求预测D; •一个最大的挑战是准确预测需求。•我们提供基于Web的服务,实现可解释的预测和多目标干预。 •方法B;2:跨不同环境有效管理库存 •在每个环境中重新学习政策代价高昂。 •我们结合因果发现与近期的强化学习进展,以提供高质量的排序策略。 目标预测 因子分析 Simulation 决策计划 确定原因 数据驱动中的因素方式。 预测多个目标在未来 根本原因查找 确定密钥因素 分解目标 观察到多个 信道 模拟 后续变更 支持多个 客观比较 搜索 最优决策 2背景:时间序列、因果关系 •时间因果模型的基础 •时间序列数据的假设 •串行数据:当数据集中的信息依赖于数据集中的其他信息。 •时间序列数据的独特性在于它具有自然的时间信息。 •因此,时间序列分析需要数据 •弱静止:期望函数和协方差函数不随时间变化。 ·假设过去存在可预测的模式 •自相关:是两个或多个观测值之间的相似性,它们之间存在时滞。 •帮助我们识别历史数据中的有用模式 •SCM(结构因果模型)是强大的,因为它接近数据生成的机制。 1.SCM从开始 1.干预一个新的价值 2.Somequantityofinterest 参考: 彼得斯,J.和扬津,D.和Scholkopf,B.因果推理的要素-基础与学习算法。麻省理工学院出版社,2017年。 •时间表示:完整图,单位图和汇总图 •多元时间序列结构学习 •基于约束:依赖于独立性测试和条件独立性测试,条件集增加。 •示例:PCMCI[uai'20],SVAR-FCI[kdd'18],PC+传输熵(例如,PCGCE[uai'22]) •基于分数:区分不同分数的不同图形(例如,BIC) •示例:动力动力[AISTATS'20] •受限模型类:通过假设特定模型类来确定因果模型。 •示例:VAR[80s]、VAR-LiNGAM[JMLR'10]、NBCB[ECML-PKDD'21] 格兰杰因果关系:量化一个时间序列的过去有助于预测未来的程度。 •示例:NGC[TPAMI'22] 3.因果关系有助于需求预测 •主要技术挑战 •关键算法描述 •案例研究:需求预测 •功能:结构学习、关键驱动因素和预测 •我们的因果分析平台 估计的善良 每个州的决定 •库存控制的关键是将每个状态映射到行动,满足 •路线图: 域适应B 需求预测D •方法-1:改善需求预测D; 最大的挑战之一是准确预测需求。 •我们提供可解释的预测和多目标干预作为基于Web的服务。 •方法2:有效管理不同环境中的库存B; •在每个环境中重新学习政策代价高昂。 •我们结合因果发现与最新的强化学习进展,以提供高质量的排序策略。 •贝叶斯网络具有丰富的理论功能:马尔可夫性质、d-分离性、路径分析、... 我们专注于预测任务。 •一般选项:基于父、基于马尔可夫毯和基于O-set。 因果发现: 在因素之间寻找模式 -0.5 3.3 PCGESLiNGAM BayesiaS.A.S LiNGAM 1.7 (自02起,在15年更新()2022年更新) 单变量时间序列:仅用于目标的自相关 t-2t-1t -0.5 ARIMA Facebook (更新2022) Google (自2015年起) 1.2 多变量时间序列:瞬时和/或滞后关系 t-2t-1t 格兰杰VAR ---------------SVAR,PCMCI+VAR-LiNGAM VAR-LiNGAM OSS HANA-ML (2022年更新)(2022年更新)(更新2022) 问题: •应理解冗余或误导性边缘 地面实况VAR 使用最少的信息损失。 参考: -VAR:LutkepohlH.多时间序列分析的新介绍.施普林格出版社,德国柏林,2007。 -VAR-LiNGAM:HyvärinenA.,ZhangK.,ShimizuS.,andHoyerPO.使用非高斯性估计结构向量自回归模型.机器学习研究杂志,11:1709-1731,2010。 -PCMCI+:RungeJ.(2020):在自相关非线性时间序列数据集中发 现contemporaneous和滞后因果关系.第36届不确定性会议论文集。 人工智能,UAI。2020 VAR-LiNGAM PCMCI ·更多变量,更多滞后加权绝对百分比误差 •比较分类边缘的前1%、5%、...、100%中的系数恢复的准确度。 (节点=5,滞后=3) (节点=5,滞后=5) (节点=10,滞后=3) (节点=10,滞后=5) •动态随机一般均衡是研究经济随时间变化的宏观经济模型 •美国商业周期中的冲击和摩擦:贝叶斯DSGE方法(europa.eu) 'dc':消费差异'dinve':投资差异'dy':GDP差异'dw':工资差异'labobs':劳动力供应'pinfobs':通胀'robs':利率 BayesiaLab林回归ARIMA RNN 预测 [标准:预测未来;多变量, 时间索引数据] 必须将时间滞后嵌入数据集。 仅与时间✁线性关系, 仅用于目标✁单变量时间序列技术过程。 一种基于神经✁方法,擅长处理串行data 可解释性 [标准:事前或事后,关键因素,观察分解] 事前可解释性,如排名、归因。 不考虑其他系统变量。支持时滞系数。 由于黑盒预测器,人们只能探索给定样本✁局部可解释性。 Simulation [标准:政策空间,模拟多变量多时策略] 支持一次性策略模拟。 模型中没有可用✁策略。没有其他可用✁操作。 我们可以借用最相似✁策略实例,而策略空间有限。 LSTMVAR 我们✁(之后) 一种特殊✁RNN缓解梯度问题。 基于VAR✁是一个最成功和灵活✁ 多变量时间序列。 用最少✁信息损失纯化图,以便提高预测能力 (与RNN相同) 过多✁冗余边缘可能会误导 决策者获得关键因素。 易于分析关键因素,并针对分解为时滞因素。 (与RNN相同) 不准确✁系数估计会损害 仿真性能。 支持未来✁多变量战略计划多时间戳。 能力 数字HR ManufactoryRetailing EV 获得原因✁洞察力-and-effect*快速掌握强烈✁因素影响目标尝试“什么”如果“场景”*模拟不同之前✁政策实施优化干预 *实施政策 实现预定义✁目标因果分析-因果分析分析解决方案:产品&解决方案|NEC 预测性销售预测Maintenance*帮助零售商*预测设备优化库存失败生产客户PlanningSegmentation *预测产量*帮助零售商定制 水平和优化营销信息时间表能源存储性能管理分析 *监测能量*使用销售额 消耗量平方英尺到能源模式optimizestore节省布局制制造业ICT解决方案:解决日方配案品需求预测解决方方案|NECOLE_ol(co.com) 车辆性能优化*调整为车辆✁动力总成或不Battery性能监测*表示如何大量✁能量车辆将消耗在不同✁条件充电基础设施优化*额外充电基础设施某些领域 汽车生产管理解决方案: 汽车行和解方案|NEC 4.因果关系有助于补充战略 •主要技术挑战 •情况1:新领域中基于反事实✁数据增强 •情况2:行动空间大✁在线补货策略 “最佳”决策✁方法 估计✁善良 每个州✁决定 •库存控制✁关键是将每个状态映射到行动,满足 •路线图: ·方法-1:改善需求预测D; 域适应B 需求预测D •一个最大✁挑战是准确预测需求。•我们提供可解释✁预测,并通过基于Web✁服务实现多目标干预。 •方法2:有效管理不同环境中✁库存B; •在每个环境中重新学习政策代价高昂。 •我们将因果发现与最新✁强化学习进展相结合,以提供高质量✁排序策略。 情况1:基于反事实✁数据增强 •问题:历史数据经常与不同✁场景混合。 CART-POLE(umass.edu) 在同一域上,基于模型✁生成器可以实现与无模型方法相当✁功能。 然而,,当我们转移到新域时:-基于MLP✁生成器恶化 显著; -基于因果关系✁生成器仅需无模型方法所需样本量✁1/10即可实现相似✁性能,在新环境中它将重新学习策略。 •我们将因果恢复与基于反事实✁数据增强相结合,以实现顺序 跨异构环境✁决策 •优势:非专家数据集可以被利用来解开因果机制,从而在从多个来源收集高质量数据方面实现巨大✁成本节约。 使用生成器和编码器 在个人层面增加数据。 使用发电机到列车控制器 •目标:从国家到行动✁最佳映射(政策) •我们假设交互骨架保持不变,但 相互作用✁强度在不同✁领域是不同✁。 𝒔′ =max[,+-] 当前状态行动需求 •奖励✁定义是: •收入:根据当前库存✁实际订单履行; •成本:额外库存和交付费✁持有成本。 푲 ,=最小,max0,′−훿−퐼(푡+푏풂) 푘푘푘푘푘[풂>0]푘푘푘푘 푘 income •Trainin□g=□&ad持a有pt成a本tio订n:购成本 •每次试验包含多步作为初始数据集,并对20次试验进行随机排序•在适应新领域时分配解开领域索引。 情况2:在线订购策略大动作空间 •问题: •由于多种商品,决策空间太大•许多方法假设股票状态将被精确计算。 •自1960年代以来研究全面观察✁系统 •然而,... •Costing损失数十亿美元可口可乐零售研究委员会(咨询,1996年) •KangandGershwin(2005)found51%✁库存准确率在一家全球零售商中,DeHoratius和Raman(2008)发现准确度来自大型零售商✁37家零售店✁超过350K库存记录只有35% •多种方法:预防,纠正和整合 •集成