登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稳定币
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
2-1 因果推断在游戏中的应用 - 房栋 腾讯游戏
文化传媒
2022-06-12
DataFunSummit2022:数据科学在线峰会
G***
AI智能总结
查看更多
游戏中的因果推断:挑战与解决方案
游戏场景中的因果推断挑战
用户体验和隐私因素导致缺乏实验数据。
观察数据存在干预偏差,如人工运营或算法选择偏差。
高活跃用户与低活跃用户被过度干预问题突出。
解决方案
利用观测数据进行因果推断,评估干预效果。
使用ATT(干预组平均处理效应)评估干预人群效应。
使用ATE(平均处理效应)评估整体效应,需通过加权方式均衡样本分布。
常用方法包括倾向性得分匹配(PSM)、Inverse-Probability-Treatment-Weighting(IPTW)、Double-Machine-Learning(DML)、Double-Robust-Estimator(DRE)、X-Learner。
双重稳健估计(DRE)在业务中更稳健,可在倾向性分数预测不准时调整。
技术挑战与解决方案
一般因果推断工具集(如微软econml、dowhy、uber causalml)非分布式实现,无法处理大数据量。
多场景数据量巨大,需精细化运营策略。
分布式低复杂度倾向性分数匹配(Hist-PSM)
通过将连续变量转化为直方变量实现匹配,降低内存占用和计算代价。
Hist-PSM步骤:计算倾向性分数、PS分桶、计算个体数量、计算阈值、提取个体、合并数据。
分布式计算架构将匹配任务分解为子任务,提高效率。
Hist-PSM内存占用更小,计算代价更小。
通过平衡性检验,Hist-PSM挑选的对照组在各类混淆变量的分布与干预组近似。
分布式鲁棒双重稳健估计
传统双重稳健估计在二元结果场景存在问题,如大量小于-1或大于1的ATE出现。
Binary双重稳健估计将二元结果问题转化为连续回归问题,使用线性回归模型的预测值逼近分类任务真实标记的对数几率。
仿真检验显示,Binary双重稳健估计相比UBER-X-Learner和传统双重稳健估计,平均偏差降低42.16%和38.54%。
安慰剂检验显示,Binary双重稳健估计比PSM和DRE更加密集地分布在0附近。
缩减样本量仿真检验显示,Binary双重稳健依然表现出良好的ATE估计。
分布式面板双重差分
玩家参与不同活动次数、程度不同,受多种活动同时进行影响,难以区分效果。
构造面板二重差分(PanelDID)模型对各个活动的效果进行归因。
整体分析流程:构造面板数据、构造面板二重差分模型、参数估计、得出结果。
示例显示,可通过模型得出各活动效果(ATE)。
总结与展望
探索更多潜在的业务场景。
优化在未知ground-truth环境下的检验。
标准化分析方法论。
查看更多
你可能感兴趣
因果推断方法在微视激励和供需场景的应用与前沿方法探索 (2)
文化传媒
DataFunSummit2022:因果推断在线峰会
2022-12-16
因果推断在有限资源决策中的应用
有色金属
DataFunSummit2022:因果推断在线峰会
2022-12-16
李东晨 - 因果推断在金融场景中的应用
金融
DataFunSummit2022:智能金融在线峰会
2022-11-24
因果推断在海外游戏增长中的应用
文化传媒
DataFunSummit2022:因果推断在线峰会
2022-12-16
序列数据的因果推断在仓储管理的应用
交通运输
DataFunSummit2023:数据科学在线峰会
2023-07-13