2023DataFunSummit 投放场景下的问题分析和用户价值预估 演讲人:徐国强—腾讯—数据科学 Contents 目录 投放场景下的问题分析 投放场景下用户价值建模实践 未来工作展望致谢 01投放场景下的问题分析 用户价值在用户增长的作用 用户增长模型用户价值模型是不同用户状态下的用户模型 获取客户 用⽤户⽣命周期状态图 户 运CLTV建模是⼀项底层的通⽤能⼒,其⽬的是准确预估处于不同⽤户状态的⽤户 营价值。增⻓模型的各个环节都可以在看清⽤户价值的基础上,制定出合理的增⻓策 略,从⽽实现增⻓⽬标的达成。 降本增效背景下,每个STAGE都需要优化ROI ⽤户增⻓中的AARRR模型 ⽤户增⻓中的RARRA模型 •投放获客场景:通过CLTV建模预估不同渠道cohort粒度的CLTV,得到每个渠道投放的ROI,调整出价策略和预算分配策略。 •投放获客场景:通过CLTV建模得到⽤户粒度的CLTV,在投放过程中对媒体流量进⾏筛选,提升买量效率和效果。 用户增长技术两阶段:从外部获取新用户、持续激活新增和存量用户 •⽣命周期运营场景:预估运营策略⼲预下的⽤户价值弹性,找到对运营策略敏感⼈群,叠加资源分配策略提升整体⼲预效果。 用户增长中的用户价值定义 CLTV的定义 CLTV(CostumerLifetimeValue)最早为市场营销领域的重要概念,表示的是⽤户在⽣命周期内为产品带来的收⼊总和。在⽤户增⻓实践过程中,⽤户时⻓、 ⽤户活跃等也可以被认为是⼀类⽤户价值。我们通常采⽤的建模⽬标的是SCV(nLTV),即⽤户在⽣命周期的某个session内的价值。 CLTV和SCV的关系 客户资产的定义 CE(CostumerEquity)客户资产被定义为⼀组⽤户的CLTV总和。在⼀些场景下,客户资产最⼤化是产品的重要优化⽬标。例如:⽣命周期运营中,在有限的资源下,最⼤化运营⼲预下的⽤户活跃是最⼤化客户资产的任务之⼀。 用户价值建模行业相关工作 CLTV建模行业相关工作 •随着⼤数据和机器学习的发展,⾏业相关⼯作越来越多,主要围绕数据稀疏、数据不平衡、多分布等问题展开。 scholar上能检索到的CLV相关⼯作⽂章趋势 ⾏业公司LTV相关的机器学习研究中的代表⼯作 投放场景下的问题分析和用户价值的应用 付费投放获客是多方博弈下对公域流量的利用 •付费投放是用户增长领域最重要的用户触达工具。 •多个参与方目标不完全一致,是博弈关系。 媒体广告平台侧现状付费获客广告主侧现状 •广告平台越来越开放,希望引入更多一方数据,优化广告效果•越来越希望通过数据的深加工,更加自主的提升投放的ROI •广告主需要一个统一的对接方案,解决渠道严重的割裂现象 渠道分布越来越割裂 amsbaidu快手电子市场 流量供给流量优选 广告平台开放RTA 获客广告主更加关注ROI …… 投放场景下的问题分析和用户价值的应用 提升获客的LTV是提升ROI的关键抓手 𝑅𝑂�=𝐿𝑇� 𝐶𝐴� 1.提升LTV 2.降低CAC •CAC优化中,降低�价可带来分母快速下降,但严重影响拿量能力。 •LTV优化中,对媒体流量的优选是潜客拉新中投放端最有效抓手。 投放场景下的问题分析和用户价值的应用 提升LTV的解决方案 随⼴告平台、数据能⼒的⽀持和⾃身能⼒不断探索,提升LTV的⼿段不断进化。 内容选品:分析建模“品类”带来的人群LTV差异,优化投放品类。 回传LTV建模:广告平台深度�价能力+浅层指标回传,实现“平台助力质量建模与优选”。 RTA(RealtimeAPI):自主建模个性化LTV表征用户价值,并通过RTA实时流量优选/分层�价。实现方案统一,适合平台化。 •问题:粒度太粗,数据稳定性差。 •问题:行业统一建模,难以深入解决业务特有问题。 •优势:个性化粒度,自主灵活建模,具备ABTest。 02投放场景下用户价值建模实践 大禹投放平台 ⼤禹投放平台是腾讯PCG内部的⼀站式⼴告投放平台,向BG范围内产品的增长业务线提供素材创意、广告投放、RTA策略、效果分析等多维度的能力,让接入产品更低成本、高效率的落地广告投放业务。 ⼤禹投放平台已经服务于⼿机QQ浏览器、腾讯应⽤宝、全⺠K歌、腾讯动漫等⼗余个业务和产品,并且为这些业务的付费获客投放的ROI带来的巨⼤的提升。 多业务下的用户价值建模面临的挑战 接⼊产品多样化 多业务场景下LTV建模⾯临的关键问题 接⼊媒体渠道多样化 投放场景下CLTV建模目标选择问题 投放场景CLTV建模如何量化选择建模目标基于Pearson相关性选择建模目标 cohort粒度CLTV在激活后随时间增加⽽不断增⻓,选择多⻓窗⼝期作为建模⽬标是个权衡问题。 • • • • 较高的线性相关性对替代建模会更优把握。 𝑃𝑒𝑎𝑟𝑠𝑜𝑛(𝐿𝑡𝑣14,𝐿𝑇𝑉120)在0.7~0.8左右,基本属于强相关性。14天样本等待期和观察期对多数场景基本可接受。 综合看,LTV14是比较可行的建模指标。 窗口期设置过长 1.样本等待期长,与大部分场景在初期即有需求形成矛盾。 2.决定了线上ABTest时观察周期偏长,严重影响迭代。 LTVn之间的Pearson相关性分析 RTA流量优选场景必须要选择短期的、敏捷的指标进行建模和观察。 投放场景下LTV建模效果评估方法 常见模型评估方案 ⾏业⼤部分⼯作及我们针对渠道粒度LTV建模评估均采⽤nMAE、nMAPE评估⽅法,但在投放应⽤场景中存在问题。 流量优选场景下,LTV建模更偏向于Discrimination问题,而不是Calibration问题。 样本的Ranking比样本的精确值更重要。 •方法1:将头部x%样本为正样本,其他或末尾y%样本为负样本,评估AUC •方法2:采用NormalizedGiniCoefficient[GoogleZILN2019] nGini系数在Gainchart基础上计算曲线下面积。模型B的Gini系数为:(A+B)/(A+B+C) 优先采用nGini系数 nGini模型评估方案拓展 当投放场景主要为头部高价值用户的筛选或�价时,需要补充关注头部用户的Precise-Recall等指标。 ABTest实验上线前效果前测 ABTest上线前,根据业务LTV提升⽬标或规模缩减程度,通过关系趋势表推算应 ⽤阈值,估算实际提升效果。 样本收集成本高带来的数据稀疏问题和解决思路 用户价值建模中的样本稀疏问题 为提升个性化建模的准确性,在搜索和推荐场景中通常采⽤超⾼维⽤户特征和海量样本的⽅案。付费投放因为预算条件,获取海量样本⼏乎不可能。 投放中采用高维用户特征建模个性化,但样本规模远小于特征空间 用户价值由多种因素共同作用,某些因子属于用户特质,引入外部数据强化此类信息的用户表达,可以在业务间迁移。 引入预训练手段解决样本稀疏问题 源业务因子模型下因子相关性源业务因子模型下LTVn相关性预训练因子模型解决方案 用户价值建模中的多成分多分布问题和解决思路 增值付费场景零值膨胀问题 付费用户占比<1%,样本不平衡问题严重 只建模金额 •增值服务类产品LTV分布⾮常极端,付费⽤户占⽐极低,回归预测效果较差。 增值付费商业模式下ltv分布 零值膨胀分布解决方案 付费率和付费金额联合建模[ESMM阿里2019]ZILN:零值膨胀下LTV建模的方案[Google2019] 用户价值建模中的多成分多分布问题和解决思路 CLTV多分布和多成分问题 •很多场景不满足Lognorml分布,本质上是多种分布的叠加。 •从微观角度来看,用户收入是由多种成分构成,形成多成分多分布问题。 LTV多分布示例 多成分多分布问题解决方案 MDME多分布LTV模型[快手2022] LTV多成分多分布示例 贝叶斯子成分依赖模型[阿里DBMTL2019] 用户价值建模中的多渠道问题和解决思路 投放渠道之间数据复用问题 •大禹投放平台目前接入的渠道10个以上 用户获取渠道1vivo-store ... 用户获取渠道2快手-联盟 样本数据源1 获客 APP 样本数据源2 基于领域迁移的多渠道建模解决方案 •业务LTV建模时直接累加数据复用存在数据冲突 多渠道样本规模示例 增加域适应机制(例如[DANN,2016]),提升多个渠道之间的数据复用效率 03未来工作展望 基于客户资产模型优化用户价值分层,通过渠道间预算分配策略达成客户资产最大化。 总预算和ROI约束下,求解规模最大化的全渠道分层投放策略 持续迭代用户价值模型,从序准往值准优化,探索更精准的投放策略。 2023DataFunSummit —THANKS— 感谢您的观看