序 阿里妈妈成立于2007年,是淘天集团商业数智营销中台。秉承着“让每一份经营都算数”的使命,阿里妈妈技术团队深耕AI在互联网广告领域的探索和大规模应用,并通过技术创新驱动业务高速成长,让商业营销更简单高效。 2021年5月,我们开始通过「阿里妈妈技术」微信公众号持续分享我们的技术实践与经验,覆盖广告算法实践、AI平台及工程引擎、智能创意、风控、数据科学等多个方向。 每年此时,我们都会整理过去一年颇具表性和创新性的工作沉淀制作成册,这些工作有的已为业务创造实际收益,有的是一些常见问题的新解法,希望可以为相关领域的同学带来一些新的思路。 期待明年此时,每位朋友都有新的收获,而我们也带着更多探索实践来与大家分享交流~ 《2024阿里妈妈技术年刊》开放下载,如果对这本电子书有想要探讨的问题,或有更好的建议,也欢迎通过「阿里妈妈技术」微信公众号与我们联系。 最后,祝大家新春快乐~祝福如初,愿不负追求与热爱,万事尽可期待!如果觉得还不错,别忘了分享给身边的朋友~ 阿里妈妈技术团队 关注阿里妈妈技术,了解更多精彩内容~ 目录 决策智能1 阿里妈妈首提AIGB并实现大规模商业化落地,将在NeurIPS2024正式开源Benchmark1 【NeurIPS'24】开源|AuctionNet:针对大规模博弈环境的出价决策Benchmark7 【KDD'24】AIGB:基于生成式模型的自动出价优化新范式17 【KDD'25】AIGA生成式拍卖:感知排列外部性的整页优化机制28 强化学习在广告自动出价场景的大规模落地实践39 召回/预估模型52 【CIKM'24】展示广告预估技术最新突破:基于原生图文信息的多模态预估模型52 展示广告多模态召回模型:混合模态专家模型66 【WSDM'24】展示广告预估模型优势特征应用实践76 大规模约束优化85 【KDD'24】合约广告中的双目标库存分配85 【KDD'24】合约广告中大规模多重线性约束库存分配问题的高效局部搜索算法98 【AAAI'24】合约广告中基于风险约束的Pacing算法优化111 智能创意123 开源|阿里妈妈技术开源FLUX图像修复及蒸馏加速模型123 开源|筑基砥柱:EcomXL-万相实验室AIGC电商基础模型131 懂你,更懂电商:阿里妈妈推出淘宝星辰视频生成大模型及图生视频应用143 乘风破浪,川流入海——LLM在阿里妈妈智能文案的应用157 尺寸魔方:AIGC赋能下的视觉创意智能延展168 AtomoVideo:AIGC赋能下的电商视频动效生成178 【ACL'24】视频解说生成算法及在电商广告中的应用188 【ECCV'24】SPLAM:基于子路径线性近似的扩散模型加速方法197 【NeurIPS'24】FlowDCN:基于可变形卷积的任意分辨率图像生成模型207 【ACMMM'23】视频尺寸魔方:分层遮掩3D扩散模型在视频尺寸延展的应用216 因果推断224 【WSDM'24】CausalMMM:基于因果结构学习的营销组合建模224 【ICML'24】面向因果效应估计的耦合生成对抗模型235 隐私计算242 阿里妈妈营销隐私计算平台SDH:公用云应用案例分享242 风控技术252 重磅!阿里妈妈新一代反作弊平台「DNA」算法揭秘252 算法工程264 揭秘阿里妈妈『AI小万』背后的AINative工程能力264 AI生成存储基座:自研超大规模向量数据库DolphinVectorDB280 多智能体292 哪家AI能成卧底之王?淘天技术团队发布多智能体博弈游戏平台WiS292 决策智能 阿里妈妈首提AIGB并实现大规模商业化落地,将在NeurIPS2024正式开源Benchmark 阿里妈妈技术 导读 2023年,阿里妈妈首次提出了AIGB(AI-GeneratedBidding)Bidding模型训练新范式。AIGB是一种全新的迭代范式,把自动出价问题建模为生成式序列决策问题,这是生成式AI在该领域的首次应用。经过一年的探索和研发,我们在阿里妈妈广告平台成功部署AIGB并取得显著效果,我们还把过程中的发现和经验总结成论文发表在KDD2024,详细分享了这一全新的迭代范式。 为了激发该领域进一步的技术创新,我们今年发起了大规模拍卖中的自动出价比赛,并特别设置了AIGB赛道,这一理念得到了NeurIPS的认同,阿里妈妈成为国内工业界今年唯一一家获得NeurIPS比赛主办权的组织。同时,我们也将在NeurIPS2024上正式开源AIGB的Benchmark:业界首个标准化的大规模模拟竞价系统和大规模博弈数据集。 论文名称:AIGB:GenerativeAuto-biddingviaDiffusionModeling 论文作者:JiayanGuo,YusenHuo,ZhilinZhang,TianyuWang,ChuanYu, JianXu,YanZhang,BoZheng发表会议:KDD2024 论文链接:https://arxiv.org/abs/2405.16141 背景:在线广告场景中的自动出价 广告业务是互联网公司营收的一项重要来源。仅在2023年,在线广告市场的规模就 达到了6268亿美元。在线广告往往是通过流量拍卖的方式进行广告投放。广告主需要设定合理的出价从而竞得流量。近年来,自动出价(Auto-Bidding)技术已成为推动广告市场持续增长的关键因素。相比于传统的手动出价,自动出价充分考虑了线上流量分布、竞价环境、预算以及各种限制因素,在为广告主带来了更多价值的同时,促进了平台业务的增长。一种典型的自动出价目标是在给定预算及其他约束的条件下最大化广告主的流量价值。典型的自动出价任务包括给定预算下的最大化拿量任务Max-Return,以及给定预算和ROI约束的最大化拿量任务TargetRoas等。 在实践中,自动出价的优化问题一般会被看作一个序列决策问题,出价模型在整个投放周期(通常为1天)内随着流量和竞价情况的变化动态调整出价参数从而优化整体效果。模型需要具备一定的全局视角,进行整体规划和决策。对于序列决策问题,一种被业界广泛采用的解决方案是强化学习(RL)。RL方法可以通过不断和环境交互寻优,从而不断提升策略效果。RL也是目前一种主流的Bidding解决方法。但是这种方法由于存在一定的内生性缺陷(价值函数预估和自举法导致的训练不稳定),不擅长处理Bidding面临的长序列决策问题,容易出现训练效果差的问题。因此,我们期待通过算法范式的升级来提升Biding模型的线上效果。 生成式模型助力Bidding范式升级 生成式模型近年来得到了迅速的发展,在图像生成、文本生成、计算机视觉等领域取得了重大突破。目前最新的生成式模型在分布拟合以及相关性关联等方面显著地优于浅层神经网络。工业界Bidding策略优化的核心是基于历史的Bidding数据,通过模型挖掘策略与效果之间的相关性从对策略进行优化,是生成式模型落地的一个较为理想环境。基于这一洞察,我们提出了AIGB(AI-GeneratedBidding)解决方案。AIGB是一种基于生成式模型(Transformer、DiffusionModel等)的出价问题解决方案框架。与以往解决序列决策问题的RL思路不同,AIGB将Auto-Bidding视为一个策略生成问题,通过生成模型强大的特征关联以及分布拟合能力,直接捕捉历史Bidding数据集中优化目标和出价策略之间的相关性从而优化策略。相比于RL方法,这种新的建模范式避免了价值函数预估和自举法所所造成的误差,尤其擅长处理Bidding所面对的长序列稀疏回报的问题。 图1:图左历史投放轨迹中,颜色深浅代表计划return的不同。右图为AIGB模型根据不同需求生成的新策略。整个模型看作一个分布处理pipeline,输入历史非最优但存在有效信息的广告投放轨迹,输出符合优化目标的新策略。 图1直观地展示了生成式出价(AIGB)模型的流程。我们将出价、优化目标和约束等具备相关性的指标视为一个有一定规律的数据分布。在训练阶段,我们可以利用生成模型对这一数据分布进行数据挖掘寻优,这使得模型能够自动学习出价策略、状态间转移概率、优化目标和约束项之间的相关性。在线上推断阶段,生成式模型可以基于约束和优化目标,以符合分布规律的方式输出出价策略。 理论上,AIGB范式可以兼容多种生成模型。目前常用的生成式模型包括Trans-former、DiffusionModel等。但不同的模型侧重点不同,例如,Transformer模型主要基于自注意力机制,能够对样本中跨时序和分层信息进行提取和关联,擅长进行自回归处理。而DiffusionModel则缓慢地将随机噪声添加到数据中,然后学习逆向扩散过程以从噪声中构造所需的数据样本。加噪和去噪的过程可以类比为是把特征用马赛克遮住然后再还原的过程。相比之下,可以从细节到整体捕捉多个层次的相关性,从而提取出更多的有效信息,更擅长进行分布建模。因此,基于不同的生成模型特点,可以构建出不同的建模方案。 DiffBid:基于扩散模型(DiffusionModel)的AIGB 在AIGB框架下,我们引入了基于扩散模型方案DiffBid。DiffBid由规划模块和控制模块组成。对于规划模块,我们首先将一个完整投放周期内广告主剩余预算、消耗速率、ROI、流量价值等出价相关状态信息随着时间不断变化的过程看作一条Bidding轨迹,然后利用扩散模型对历史数据集中的海量Bidding轨迹序列进行建模(图2),以最大似然估计的方式拟合轨迹数据中的分布特征。因此,DiffBid可以基于给定目标规划出对应的出价轨迹。在此基础上,DiffBid会再利用一个逆动力学控制模型根据环境的变化尽可能逼近规划轨迹。 图2:左为正向过程,右为反向过程。DiffBid正向与反向过程示例,对于一条由剩余预算序列轨迹,正向过程不断加入噪声,破坏其有效信息,然后反向过程生成新的轨迹,最大限度将这部分丢失的信息还原。 在近一年多的实践中,我们通过多轮线上实验,反复验证了DiffBid的效果。截至目前,DiffBid已经多个场景的实验中相比于传统的RL方法产生了显著的正向效果。其中在某场景Max-Return任务中,产生了GMV+3.6%的结果。在TargetRoas任务中,在保证整体ROI满足要求的情况下取得了GMV+5.0%的结果。特别在TargetRoas中,由于ROI反馈稀疏且滞后,RL方法训练难度较大,而DiffBid受影响较小。因此,DiffBid既为广告主带来更多收益,又很好保障了广告主的ROI。 与此同时,我们通过进一步分析,发现DiffBid模型在提效的同时,还能够对实际投放轨迹产生一定的平滑性优化(图3),在DiffBid策略生效后,投放轨迹的异常状态显著减少,振荡性显著降低,与此同时减少过快消耗的现象。广告主的投放体验也因此得到改善。 图3:真实线上剩余预算散点图。横轴为剩余时间,纵轴为剩余预算。越分散代表消耗越振荡,投放平滑性越差。此外在图a中,存在大量提前消耗完毕的投放轨迹。这部分轨迹可能会由于错过一部分晚上的高性价比流量导致效果下跌。而DiffBid可以明显减少这种问题 除了实际线上效果的优势外,相比于其他方法,DiffBid还具有其他两方面的优势。首先,相比于通过端到端方法直接输出Bidding信息,DiffBid生成的轨迹信息具有更好的可解释性(图4)。有助于我们对模型效果进行更好的评估,从而助力优化工作。例如,我们观察模型规划出的轨迹和实际线上的轨迹,如果出现规划出的最终剩余预算不为0的情况说明模型并未能有效利用所有预算。如果规划轨迹与实际轨迹差距较大,则说明逆动力学控制模型自适应能力较差。在定位问题之后,可以较为方便地进行针对性优化。其次,DiffBid对多目标的兼容能力更强,与此同时支持在训练完成后对目标进行调整从而优化规划轨迹。基于这一特点,我们可以更为方便地加入一些将业务逻辑指标作为优化目