登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稳定币
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
6-4 数据科学在用户兴趣分群上的探索与实践 - 陆祁 爱奇艺
信息技术
2022-06-12
DataFunSummit2022:数据科学在线峰会
A***
AI智能总结
查看更多
数据科学在用户兴趣分群上的探索与实践
01 数据科学VS 用户兴趣分群
数据科学的作用
:精密分析、结合业务、可解释性更强、解决实际问题能力强。
用户兴趣的计算
:反映用户对主题或事物的匹配价值和接受程度,包括中长期偏好和短期即时意图,应用于运营推荐、搜索广告等场景。
02 基于事实生成的用户兴趣标签
用户兴趣权重标签设计
:
比较性问题:同一用户的不同内容、不同用户的相同内容、不同用户的不同内容的可比性。
加权权重设计:时间衰减函数(内容、类型、明星、频道、时间、价格等)。
降权头部内容影响:起始值和行为稀疏用户处理。
研究主题:抽取多样用户行为,计算兴趣偏好,归一化得到0-1权重。
用户兴趣标签的验证与迭代
:
效果检验:盲测用户问卷检验排序性,线上ABTEST(如明星偏好权重标签)。
事实标签权重解释性:每天全量decay不适合实时场景,增加属性维度供业务方灵活使用。
用户兴趣结构化事实标签
:
显式行为:评分、弹幕、评论、关注、预约、收藏、内容分享、购买等。
隐式行为:快进、后退、暂停、倍速、站内/外搜索、下载。
细分用户行为,更准确捕获内容偏好。
03 基于内容聚类的用户兴趣分群探索
兴趣圈层定义
:喜欢相同内容的用户群体,通过算法发现内容关联性。
应用场景
:内容运营(数据支持)、内容供给规划(大数据驱动)。
圈层聚类基本思想
:用户相似度高则面向同一圈层。
用户圈层聚类系统
:
客观观影行为作依据。
颗粒度可控。
数据获取便捷。
内容相似度计算
:
使用距离计算公式(Jaccard similarity)计算任意两部内容观影用户相似度。
优化1:内容体量。
优化2:内容上线时间间隔。
优化3:频道规模差异。
内容聚类原理介绍
:
层次聚类:通过计算两两内容用户相似度,依次向上聚集。
图剪枝线:决定内容聚合颗粒度。
用户兴趣圈层示例
:
通过综合内容内核、用户特征等推测用户核心诉求。
不同兴趣圈层用户诉求差异通过聚类体现,传统内容标签难以表达。
非常感谢您的观看
查看更多
你可能感兴趣
【T112017-教育生态与人才培养分会场】OpenDataOpenValue-数据科学合作研究平台的探索与实践
文化传媒
TalkingData
2017-09-20
【T112017-人本数据和智能分会场】Smart Data Lab-数据科学基础设施搭建的探索与实践
信息技术
TalkingData
2017-09-20
虎牙-郑健彦-智能弹性在虎牙降本增效上的探索与实践
信息技术
2023第十二届全球TOP100软件案例研究峰会
2024-08-21
6-4 大象时序 TimescaleDB 在专网领域的应用与实践
信息技术
DataFunSummit2022:大数据存储架构峰会
2022-07-19
国内医疗真实世界数据在慢性病防治中的应用探索-神经科学法规与上市咨询服务
医药生物
精鼎洞见
2024-11-19