ENG

SCORISTA Hotline 156-8099-1090

分析

采用模型融合方法来提高评分卡的质量

06.09.2019
由思考瑞思塔新闻处提供

我们是如何创建能够提高预测能力的模型的融合方法?

思考瑞思塔-是给小额信贷机构提供评估服务公司。我们根据信贷报告给顾客提供评分、贷款“通过”或“拒绝”的决策、停止因素及借款人的参数。

       收到的信贷报告中的参数可以用于评分模型。贷款决策卡是按照固定的要求创造的:

-评分必须有公正透明的机制

-贷款决策必须符合合同中的保证指标(如:AR、还款水平及逾期日期、第三个月的surplus)。

       在服务提高质量及达到保证指标的过程中,我们发现,贷款决策卡中只有基于一个模型的评分,但是决策是由六个模型提供出来的。显然,从六个模型融合出来的评分更靠谱。

       实际上,我们创建模型中使用的样品依赖性的,评分相关性的,目标异构性的,样品不够大,所以不适合用经典方法:boosting, stacking, blending, bagging。因而,我们不得不创建自己的模型融合方法。

模型融合的目

       目前客户的LTV是最有价值的维度,因为利息水平降低,还款变坏,并且不光要预测贷款逾期,而还要预测这个客户最后会给公司带来多少利润。我们知道,小额信贷机构的主要利润来自重复借款人。

们如何准备样品

        我们是按照时间来准备样品如的果我们有一年的观测数据的话,其中半年的数据用来学习,后续三个月用来验证(多余学习),再用三个月来测试该模型。这样的方法有助于避免季节性,但是会最大限度减少对意外事故的发生-流量变化。

模型的融合工作

1

       先给第一个和第二个模型的一对单元创作坐标。 把M1和M2合并起来,也就是说,第一个单元M1和第一个单元M2获得坐标1-坐标I。结果每一对有包括100万单元的单维矩阵I。后来我们原样的(风筝性地)把获取的坐标和下一个模型合并起来。然后同样给每一对单元创作独特的坐标-结果又有100万等等。

       我们做到M6后,可以得到具有100亿亿单元的矩阵。

       接下来,我们需要矩阵L的单元连续合并到有统计显著性的观测指标。我们需要了解,是否要合并下一个单元还是根据具体规则把它和下一个联合合并。

       为了验证假设,只必要根据统计显著性指标进行融合。也可以根据单元里的BR数量进行操作。

2

       我们融合到新的具有1万单元的矩阵LV出来,也就是说,从100亿亿次压缩到不超过1万次。

3

       我们得到了矩阵LV后,根据LTV变量给每一单元计算BR值。BR很杂乱,所以为了能够解释,我们把矩阵改变并当作元功能来继续操作。我们按照BR值进行分类,并且如果单元数量超过1千个,把它们按照BR的具体规则合并起来。

4

       再给观测数据每一单元进行编号并可以获得新评分的指标。接下来,我们要检查结果。我们有新的100步的评分。总的来说,根据样品,也可以进行25、50步的分配。

       我们对每一个模型及每一个评分的未变量进行分配。新的评分必须给每一个模型带来评判。

       如果分配中有不正确,需要返回到步骤1,给模型加上重量,并再进行同样的程序。

       模型融合方法已经是Scorista可用的方法之一。和我们一起测试该方法您可以计算贷款风险并提供预测能力。过程很简单-可以通过网站或电话两种方式申请。我们给您计算您可以用的贷款决策总分。计算器安装在客户的服务器上。