您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[DataFunSummit:2023年用户隐私与数据安全峰会]:隐私保护下的京东广告数据算法实践 - 发现报告
当前位置:首页/行业研究/报告详情/

隐私保护下的京东广告数据算法实践

AI智能总结
查看更多
隐私保护下的京东广告数据算法实践

DataFunSummit2023 隐私保护下的京东⼲告数据算法实践 演讲⼈:叶朗朗-京东-⾼级算法⼯程师 •隐私保护背景现状 •匿名化隐私保护及群体建模简介 •京东⼲告群体建模⽅案实践 •展望 隐私保护背景现状 DataFunSummit2023 背景 国内重⼤合规事件国际重⼤合规事件 •2021年度⼯信部对201款App予以下架处罚 •2022年2⽉份公开通报的SDK包括百度定位SDK、字节⼲告SDK、⺴易推⼲SDK、科⼤讯⻜商业化SDK等 •⾕歌⻄班⽛罚款1000万欧元、俄罗斯72亿卢布、法国5亿欧元 •Facebook德国200万欧元、美国50亿美元、爱尔兰1860万美元 •IAB欧盟25万欧元 国内事件因素分析国际事件因素分析 6.4% 7.5% 10.7% 56.4% 11.7% 15.1% 36.3% 欧盟 违规收集个⼈信息 APP强制、频繁、过度索取权限 欧盟数据保护委员会《通⽤数据保护条例》(GDPR)欧盟各国《数据安全保护法》 违规使⽤个⼈信息 欺骗误导⽤户下载、欺骗误导强迫⽤户违规调⽤⻨克⻛、通讯录、相册等权限超范围收集个⼈信息 强制⽤户使⽤定向推动功能 美国 美国联邦贸易委员会更新《消费者信息保护准则》 美国加州州⻓签署《关于隐私和消费者保护的第694号法》美国弗吉尼亚州正式通过《消费者数据保护法》 应⽤分发平台上的APP信息明⽰不到位 东南亚 新加坡-新加坡个⼈数据保护法(PDPA) 泰国、越南和印度-个⼈数据隐私保护法和相关草案 背景 个性化开关改造 ID隐私政策和个性化监管 Google禁⽤第三⽅cookieiOS14.5限制IDFA获取 持续影响⽤户识别能⼒ ⽤户特征缺失 仅能参考后验信息打分 热⻔爆款托底 ⾼eCPM物料优选空间有限 ⾮个性化排序 个性化排序 ID获取率下降,⽤户个⼈信息减少 投放ROI降低,影响站外⼲告收⼊、引流能⼒、归因能⼒、反作弊精准度 前端 ON 个性化开关 OFF ⾮个性化召回 个性化召回 个性化信息使⽤受限,影响个性化营销 流量匹配效率下降 ⽤户体验下降 后端 《个保法》 《算法推荐管理规定》 《个⼈信息保护法》2021/11/1⽣效:个⼈有权拒绝仅通过⽤户画像、算法推荐等⾃动化决策的个性化⼲告 《互联⺴信息服务算法推荐管理规定》(征求意⻅稿):算法推荐服务提供者应当向⽤户提供不针对其个⼈特征的选项,或者向⽤户提供便捷的关闭算法推荐服务的选项 匿名化隐私保护及群体建模简介 DataFunSummit2023 匿名化隐私保护及群体建模流程 原理匿名性指标 通过将个⼈数据集集中在更⼤的群体中,从⽽掩盖与个⼈相关的信息 •Suppression:对敏感信息直接抹除 •Generalization:敏感信息泛化 群体推荐/⼲告 •群体特征挖掘 •群体特征应⽤ •Noise:敏感信息加噪 K-Anonymity:K-anonymity要求每个群体⾄少要有K个个体。 L-Diversity:L-Diversity要求每个群体中的敏感属性要有⾄少L个可区分的取值。 T-Closeness:T-Closeness要求敏感属性在某个群体中的分布和在整体中的分布之间的距离不超过阈值T。主要关注群体信息带来的信息增益。 群体建模流程 ⽤户编码 •⽤户历史⾏为编码 •信息量、可区分性、鲁棒性 ⽤户群体⽣成 •局部敏感哈希、聚类⽅法 京东⼲告群体建模 ⽅案实践 DataFunSummit2023 群体建模算法 Stage1.基于图对⽐学习表征的⽤户编码Stage2.基于⾃编码器的⽤户群体⽣成Stage3.群体评估及特征挖掘 Stage1 •Augmentation&Encoder Stage2 •ClusterAssignment ℎ=ƒ�,ℎ&=ƒ𝑁(𝑑*𝐷𝑟(�� �=𝑎𝑟𝑔maxƒN𝑇� i�∅i� •InfoNCELoss :𝑇:� ⁄� :𝑇:�⁄� •AuxiliaryReconstruction W �*;;i *ii �= N−� 𝑐(𝑛𝑐𝑎�ƒ N,� 𝐿𝑐�=−3 log :𝑇:�⁄�𝐿𝑐�=−3 log �� 𝑟M�iO ∅i𝐶i 𝑢∈� ∑𝑣∈�* ;� i∈� ∑j∈�*:i:j⁄� •CohortCentroidUpdate •CrossEntropyLoss 𝑚&=𝑚� +𝜆ƒ∅Ni,𝜆&=^� �=−3� log𝑦& �i 𝐶ii 𝑐𝑙i𝑐G ii�=𝐿𝑐𝑙i𝑐G+𝛼𝐿𝑐�+𝛽𝐿𝑐� i 群体建模站内应⽤实践 基于群体的⼲告检索与召回 基于群体的打分排序 Anonymizer 群体化召回 以群体为主体,群体多粒度 群体化排序 排序模型去个性化,群体统计特 征、粗粒度标签 ⾼频集为触发器 展望 DataFunSummit2023 跨域群体建模站内应⽤实践 合规约束下,利⽤基于匿名化隐私保护的群体技术,挽回站内个性化信息缺失及跨域ID流通隔离造成的损失 CohortDA 基于群体的⼲告检索与召回 CohortDB ④ DSP 基于群体的打分排序 CohortDC CohortSA SSP CohortSB CohortSC ① ② ③ ④群体召回排序 ③群体公共定义 ②跨域群体⽣成 ①跨域数据交换 DataFunSummit2023 感谢观看