首页 > 社交 > 科普中国

详解风控模型中的逻辑回归评分卡与模型评估内容

常驻编辑 科普中国 2022-11-17 模型   建模   缺失   注释   概率   变量   详解   分数   逻辑   特征   评分   编辑   内容   图片
A8K拜客生活常识网

(2)时间稳定性PSI:不同时间分布是否变化A8K拜客生活常识网


A8K拜客生活常识网

评价特征稳定性:衡量特征是否随时间的推移发生大的波动,可用于变量监控。模型上线前做特征选择,剔除不稳定变量。A8K拜客生活常识网

评价模型的稳定性:对数据集的预测/分类结果进行稳定性评价。模型上线部署后,可通过PSI曲线报表来观察模型的稳定性。A8K拜客生活常识网

PSI计算方式:PSI=SUM(实际占比-预期占比)*ln(实际占比/预期占比)A8K拜客生活常识网

PSI越小,代表稳定性越好。A8K拜客生活常识网

A8K拜客生活常识网

A8K拜客生活常识网

编辑切换为居中A8K拜客生活常识网

添加图片注释,不超过 140 字(可选)A8K拜客生活常识网


A8K拜客生活常识网

(3)变量预测力:IV,通过IV筛选预测能力比较强的特征。IV计算可通过woe计算得到,IV越大,代表变量预测能力越强。A8K拜客生活常识网

A8K拜客生活常识网

A8K拜客生活常识网

编辑切换为居中A8K拜客生活常识网

添加图片注释,不超过 140 字(可选)A8K拜客生活常识网

1.3.3特征选择的方式A8K拜客生活常识网

过滤法:A8K拜客生活常识网

1)缺失率>x,A8K拜客生活常识网

2)方差波动A8K拜客生活常识网

3)psi>x,A8K拜客生活常识网

4)corr>x,A8K拜客生活常识网

5)woe单调,A8K拜客生活常识网

6)ivA8K拜客生活常识网

嵌入法:特征选择整合为模型的一部分,比如决策树A8K拜客生活常识网

包装法:通过统计模型或者机器学习来选择特征A8K拜客生活常识网


A8K拜客生活常识网

2 分箱A8K拜客生活常识网

2.1 分箱概述A8K拜客生活常识网

分箱的定义:将变量取值划分成不同的分组。A8K拜客生活常识网

分箱的目的:适应缺失值和极端值,对于缺失值和极端值放在单独一个箱里。这样变量就会平滑一些,模型也更稳定。A8K拜客生活常识网

常用分箱方法:等频/等距分箱,决策树/best-ks/卡方分箱A8K拜客生活常识网

分箱的原则:组内差异小,组间差异大,每组分箱占比不小于5%,必须有好坏两种分类(对于二分类而言必须一个箱里好坏样本都有)。A8K拜客生活常识网


A8K拜客生活常识网

2.2 分箱方法A8K拜客生活常识网

相关阅读:

  • 3d打印软件有哪些(3d打印模型素材下载)
  • 评价模型有哪些(5种常用的分析方法)
  • 驾模要多久(做牙模型需要多久)
  • 数据挖掘实例及数据分析流程,数据挖掘的概念与过程
  • 人工智能与动物对话
  • 改变世界的发明32丨DNA双螺旋结构分子模型
  • 氧化锌的蚀刻模型
  • 白癜风原创突破背后:一部历时六年的“失败简史”
  • 数字孪生城市,提升城市高效运营管理,推动智慧城市建设
  • 科学家建立仿真模型以研究大质量恒星在塑造周围环境中
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。