登录
注册
回到首页
AI搜索
发现报告
发现数据
专题报告
研选报告
定制报告
VIP权益
发现大使
发现一下
热门搜索:
新能源车
AIGC
Chatgpt
大模型
新质生产力
低空经济
当前位置:首页
/
行业研究
/
报告详情
/
郑伟东 - 基于沉淀数据的尾部流量建模方法
信息技术
2022-11-24
DataFunSummit2022:智能金融在线峰会
小***
AI智能总结
查看更多
风控建模四板斧
1. 尾部流量及沉淀数据的特点
尾部流量
:
构成:管制禁申、低额新户授信拒量、睡眠户、交易拒绝户。
特点:风险高、费用高、件均偏低、数据缺失。
经营目的:增加新户、激活老户。
潜在风险:高风险、多头借贷。
沉淀数据
:
问题:资信数据昂贵,需尽量减少费用。
目标:最大化挖掘有效信息。
阶段:
授信申请阶段:客户基本信息、ID关联信息、客户授权数据、客户行为数据、三方资信调用。
交易申请阶段:用户提交借款信息、三方资信调用、App/H5内操作事件信息、贷中客户行为数据、未完结订单数据。
贷中调额阶段:调额用户输入信息、历史调额后借贷行为表现、贷中客户行为数据。
贷后阶段:贷前数据变化、贷中数据变化、贷后客户行为数据、贷后跟进记录、贷后扣款还款信息。
2. 扩容-低通过率下的样本扩容
方法:
共生融合风险标签:拓宽样本量、有效拒绝推断。
放松坏人定义:0-1二分类模型难以界定好坏边界。
长短期指标选择:长期指标建模效果优于短期。
3. 分群-沉淀数据时效性分群
根据用户在子产品授信节点前,在其他产品发起最近一笔动支申请的时间分组,发现:
整体而言:trade1 > trade2 > trade3。
统一使用沉淀数据建模的模型在几个客群上的效果:
Trade2 > Trade3 > Trade1。
4. 头部优质客户排序优化
方案一:Ensemble模型
Step1:全量样本建模。
Step2:基于Step1排序,对头部样本单独建模。
Step3:将Step1与Step2结果进行Ensemble。
Step4:试验验证。
方案二:加权法
Step1:全量样本建模。
Step2:基于Step1排序,对头部样本进行加权。
Step3:基于加权后的全量样本再建模。
Step4:获得最终模型。
方案三:算法优化
修改目标函数和评价函数,加大头部错判坏样本的惩罚,使头部坏用户打低分,好用户打高分。
使用Focal Loss算法。
你可能感兴趣
基于价量数据的非线性估计模型(2024年第13期):3000点下方信号转弱,提前关注尾部风险
国泰君安
2024-06-29
工业深度脱碳:建模方法和数据挑战(英)
建筑建材
未来能源研究所
2023-08-01
量化资产配置与组合投资周报:风险平价模型求解方法改进:基于大类资产数据的实证分析
华宝证券
2017-12-05
基于决策树分析的最优产品创新策略探索: 一种数据挖掘方法
韩国科技政策研究所(STEPI)
2017-10-31
数据分层行动手册:基于价值的数据访问方法
信息技术
splunk
2022-09-21