因果推断在有限资源决策中的应用
1. 什么是因果推断
因果推断用于回答在改变某个因素后,另一个因素如何变化的问题。与传统的关联学习相比,因果推断能提供更深层次的洞察。
2. 有限资源决策
场景一:网约车补贴分配
- 在给定总预算的情况下,如何在不同用户/城市间分配补贴以最大化整个交易市场的Gross Merchandise Volume (GMV)。
场景二:机票定价
- 在给定飞机总座位数的情况下,如何根据不同预定日期的价格策略来最大化整个航班的运营收入。
场景三:背包问题
- 给定一组物品(每种物品有自己的重量和价格),在限定的背包容量内选择物品以使总价格最高。
3. 因果推断技术助力智能决策
典型应用
- 经典价格需求曲线 和 投入回报曲线
- 案例分析
- 通过准确预估投入回报曲线来解决资源分配问题,例如通过拉齐不同城市的边际ROI来提高整体效益。
- 挑战
- 如何准确预估投入回报曲线。
- 随机实验的设计与执行,特别是满足SUTVA假设的情况。
- 建模方法
- 因果森林 (Causal Forest): 直观但难以处理高维0/1特征交叉。
- 元学习器 (Meta-Learners): 公式清晰,但假设较多。
- 表示学习 (Representation Learning): 深度学习优化框架,但模型可解释性较差。
- 双重/稳健机器学习 (Double/Debiased Machine Learning): 公式清晰,但需要两个模型学得好且正交。
- 效果评估指标
- Qini分数: 序列指标,无法度量ITE预估的MAPE。
- AUUC (Area Under Uplift Curve): 序列指标,适用于无成本约束场景。
- AUCC (Area Under Cost Curve): 更接近最终结果,适用于有明确成本约束的场景。
4. 未来工作与讨论
- 未解决的问题
- 因为法律法规等原因无法进行随机实验时的因果推断方法。
- Treatment维度过高时的因果推断方法。
- 处理不满足SUTVA假设的随机实验样本时的方法。
- 当观察到的提升信号极弱时,优化模型的方法。