网易云音乐推荐系统中的冷启动与多目标高效实现
背景介绍
- 网易云音乐于2013年4月上线,凭借歌单、社区、音乐人及个性化推荐算法,已成长为拥有亿级月活跃用户的音乐平台。
基础架构
冷启动 & 召回
-
冷启动:
- 问题:海量音乐资源(40万音乐人,亿级歌曲,百万艺人)每天新增,质量参差不齐;如何有效探索这些资源?
- 解决方案:
- 冷启池选择:选择潜在优质歌曲,匹配合适歌曲-用户探索。
- 在线学习更新:通过实时样本引擎、实时训练引擎、实时推理引擎进行冷启探索。
- 行为概率迁移:利用后验行为概率迁移到先验内容概率,预测歌曲被用户长时间播放的可能性。
- 知识图谱构建:构建音乐内容知识图谱平台,涵盖歌曲、艺人、影视、综艺、游戏等主题,解决推荐系统的稀疏性和冷启动问题。
- CB2CF方法:基于内容的歌曲Embeding 和行为建模,通过MSE loss进行召回。
-
召回:
- 实时冷启探索:通过实时日志平台进行实时样本、训练和推理,实现快速响应。
排序 & 多目标
-
排序:
- 多目标建模:
- 目标多样化:包括歌曲播放时长、收藏次数等。
- “跷跷板现象”:单目标优化容易导致其他目标下降。
- 解决方案:通过“共有-私有”网络结构,使每个目标任务有共享的Expert和独有的Expert,减轻“跷跷板现象”。
-
差异化多目标建模:
- 红心歌曲推荐:对特定目标进行mask处理。
- 播放-购买全链路多目标建模:覆盖播放、收银台购买等环节。
- 虚拟链路多目标建模:针对两种链路,从用户感知角度抽象出三个通用阶段:play awareness → cashier awareness → pay awareness。
- 商业变现:推荐场景的会员转化率相对提升30%。
以上总结了网易云音乐在推荐系统中的冷启动与多目标高效实现的关键技术和策略。