网易人工智能实践 LOFTER的个性化推荐系统 朱阳平 元气事业部-LOFTER业务部-智能分发组 目录 网易人工智能实践 1 业务简介 2 推荐系统目标 3 推荐系统方案 4 总结和思考 业务简介 领域:二次元、同人、摄影、绘画、娱乐、文学等8000万兴趣标签 2亿+创作文章(图片、长短文、视频等多种形式) 网易人工智能实践 1200万+创作者 LOFTER-看见每一种兴趣 网易人工智能实践 目录 网易人工智能实践 1 业务简介 2 推荐系统目标 3 推荐系统方案 4 总结和思考 推荐系统目标:社区推荐的目标 平台 推荐系统 目标 分发效率&发现性 指标 点击率、停留时长、互动数、新颖性 用户 目标 网易人工智能实践 运营定向投放、可控流量多 指标 可控流量、互动、内容 目标 创作者激励 指标 发文数、发文质量、多样性 创作者 目录 网易人工智能实践 1 业务简介 2 推荐系统目标 3 推荐系统方案 4 总结和思考 推荐系统方案:架构 业务数据上报 物料上报行为上报 在线特征平台静态特征实时特征用户特征内容特征 缓存&Redis 模型服务 LR Kafka DCN 网易人工智能实践 DINDSSM LTR 实时增量更新 周期更新 静态特征处理&模型训练 周期更新 业务场景 首页推荐 更多推荐 精选视频流 领域页推荐 …… 分发算法 推荐池建设 精选、用户偏好...周期监控 多路召回 用户画像、协同...向量召回 过滤和填充 通用过滤、业务过滤...人工 多任务排序 特征、DCN/DIN...多目标 展示层 推荐理由...首标签 Flink Storm 新物料 新用户 实时特征处理 实时行为 数仓(Hive&HDFS) T+1特征处理协同过滤模型训练 SparkNSearch深度学习平台 推荐系统方案:内容理解 基于Content基于行为 娱乐动漫…… 用户行为序列session 新文章 国内男明星………… 国产动漫………… 蔡徐坤迪丽热巴 海贼王 凹凸世界…… UGC标签&关键词 网易人工智能实践 数据: 自动化构建&运营人工标注 分类算法Multi-class/Multi- labelLeanring Word2Vec-SkipGram Keywords&Embedding ImageEmbedding128 TF-IDF TextRankWord2Vec ResNet-50EfficientNet*B4 128 推荐系统方案:用户理解 基于统计向量表征 TripletLoss(User,Item+,Item-) 网易人工智能实践 用户正向行为文章 不同行为不同权重 文章 标签/类目/博客 /合集/... 泛化&轻量 dense SimilarityFunction dense 时间衰减&多个时间窗 用户偏好 dense 性 迹 基础属行为轨偏好标签 dense 性 签 基础属类目标统计特征 用户长短期偏好 用户特征文章特征(Item+,Item-) 推荐系统方案:分发算法 0102 网易人工智能实践 推荐池建设召回 0304 排序展示层 全量文章池(多!)筛选 生产反推 创作者 精选标准全站用户画像 热度飙升 …… 周期性监控 分级推荐池近期文章新文章 网易人工智能实践 经典好文局部可见 通用 追更用户;创作者扶持稳定兴趣:摄影/绘画等 引战嫌疑:肖战等 用户画像类召回(u2tag2i)CF召回(u2u2i) tag2i索引 网易人工智能实践 用户实时行为召回(u2i2i) Swingi2i 向量召回(u2i) TripletLoss(User,Item+,Item-) 用户实时正向文章 (种子) Sessioni2iItemEmbedding densedense SimilarityFunction NSearch/Faiss计算u2i相似 性 迹 性 签 densedense 负样本构造 tripletloss设计 正负Item参数共享 种子文章:行为;时间;视频 多种i2i算法 基础属行为轨偏好标签 基础属类目标统计特征 合集i2i 用户特征文章特征(Item+,Item-) 目标 提升点击率、停留时长、互动率等多目标 模型 方案 数据构造 正样本 用户侧 特征工程 点击 有效播放 点赞 分享 评论 …… 负样本 曝光未点 过滤 路人/机器人 …… 用户基础属性 网易人工智能实践 长期/实时画像 实时行为轨迹 …… + + 文章侧 文章基础属性 文章多模态特征 文章行为向量 统计特征 交叉特征 …… DCN DIN 模型增量更新 策略 多样性控制(标签/类目/博客等) 网易人工智能实践 展示 ) 推荐理由(可解释性 推荐理由 订阅热门、已关注、热度飙升个性化;控制数量;避免用户画像 展示UGC标签 个性化 推荐系统方案:效果总结 推荐池建设方案(创作者、智能合集等) 召回(用户多兴趣;在线向量召回) 排序(多任务;实时模型) 展示层(视频/图片优选封面) 规则筛选推荐池 召回 热度、用户偏好标签 排序 少量特征+LR模型 运营精选、多种文章形式 召回 用户画像召回、实时行为召回 排序 复杂特征+CTR任务的DCN模型 推荐池建设方案 网易人工智能实践 精选、周期性监控…… 召回 用户画像召回、实时行为召回CF、向量召回…… 排序 复杂特征、多种模型、多任务目标 展示层 推荐理由、首标签个性化展示 目录 网易人工智能实践 1 业务简介 2 推荐系统目标 3 推荐系统方案 4 总结和思考 总结和思考 社区推荐 用户:高效&发现 创作者:激励 网易人工智能实践 平台:定投;可控流量 推荐系统方案 通用架构:内容&用户理解;召回;粗排;精排;策略 不同场景定制优化 同样重要:推荐池建设、新用户冷启动、展示层优化 WEAREHIRING~~~ 1.了解网易数帆-机器学习平台:https://www.163yun.com/product/ml 2.了解网易数帆-多媒体智能开放平台:https://www.163yun.com/product/yz 3.热招岗位: 网易人工智能实践