“高大上”的风控，究竟是什么？（二）

2018-01-08 08:52:00

本章分为两个阶段，介绍一套可对外输出风控的系统，当然内部也是可以用的，相对复杂业务系统来说，本文介绍的会简单一点，根据公司业务场景不同，请进行相应的扩展。

上章，大概对风控所涉及的几个内容做了大体的介绍（我思路可能有点乱），从本篇开始开始介绍干货吧。
首先，针对一套对外输出的风控系统来说，最重要的是如何在多个领域、不同的场景通过一套标准性设置进行配置后输出。输出的形式不建议用太复杂的，风控目前最多的使用模型是通过各种规则进行各项目打分，也就是俗称的评分卡。
评分卡，通过对各个维度预置评分，通过用户数据进入后对应不同的阈值所对应的份数，最终为用户生成一个总分。
这里举几个例子：

如果按照上面的3组维度来说，做一个评分分级的话，应该是如下所示：

这里举了3组例子，第一组是比较普遍的通过数据接口进行验证的数据，第二组是通过数值来进行区分的数据，第三组是通过用户自身信息进行分类的数据。
如果，此时进来一个A用户，他实名认证返回结果，是通过。但是命中了5个多头，性别为女。那A用户的总分=5+（-10）+0.6=-4.4分。
如果按照上面例子的评级来说，A用户得分-4.4分，级别为一般，审核状况需要人工核实。
通过这么一套评分卡，对于每个用户进件之后就能有个综合用户概况。那么，初始评分是怎么得来的呢？初始评分主要是通过专家模型，说白了其实是拍脑袋想出来的分，就是风控人员主观意识觉得这个用户该得多少分。就跟上述举例是的，性别维度，可能根据场景不同，男性和女性的评分比值都会有所不同的。当然后期，会根据用户数据越来越多，不停的校验模型，对评分卡的阈值进行调整的。
说了这么半天评分卡，那么如何跟系统挂钩呢？这就是本章要解决的问题，下图是一个系统框架，数据都是采用第三方数据源，和订单数据以及用户上传数据。
看起来比较简单，这些涵盖了本系统的基本功能服务构成、基础框架、业务库和数据库内容。
言归正传，辅助功能比如一些权限管理、运营相关、数据报表、财务充值等这里就不介绍了，主要为大家介绍下风控系统核心的——风控决策引擎。
听着叫风控决策引擎感觉好高大上，其实说白了就是配置类的一个东西。使用逻辑，如下图所示

其实，主要是前期对风控字段的数据清洗过程，通过对外部数据接口和手机设备指纹以及用户数据，进行统一化字段清洗，清洗后，通过硬编码形式进行平台的数据字段、数据字典的添加后，方便风控人员在前台进行任性的组合使用。

通过数据清洗后，系统用户就可以在前端进行配置了。比如，

做了三种条件，支持单独条件、条件组合、交叉验证形式，对风控策略进行添加，并对相应的策略进行打分。
单独条件、条件组其实就是满足验证类的需求，我这里就不细说了。主要细说一下，交叉类规则。
交叉类规则，大部分应用点是在反欺诈模型上，通过多维度数据交叉形成的规则，尤其是最主要的时间段属性，做风控的大家应该要明确一点，时间段属性是能判断这个人是不是存在是机器的可能性的重要一点，尤其应用在部分平台的内容反作弊、活动反作弊等上面，反作弊主要是为了减少那些羊毛党他们下手的可能性，当然，并不是上了风控就能100%杜绝了，风控的只是通过各种手段，增加那些想作弊的人的作弊费用，从而降低他们作弊的可能性而已。
话说回来，交叉验证这里，上面做的比较简单，主要是通过主属性、从属性的概念去实现，但是对于复杂业务场景来说，主属性和从属性可能属性的字段本来就是已经组合的字段了，会更加复杂，这里只举例最简单的。
我举几个规则例子：

通过上述这种形式，对于命中的交叉验证类规则进行打分，其他步骤与上述评分卡一致。
这个实现形式，我大概说一下，对于系统来说主、从属性是两个变量，判断类型是预先写好的算法，所以对于主从属性是否能应用该算法的数据类型要前期进行设置的。
把这些配置好后，就可以进入策略流程阶段了，什么叫策略流程？其实就是工作流，通过前期以接口形式把输入参数对接后，通过一定流转规则对用户数据进行流转，最后输出结果就行了。
那为什么策略要做成工作流的形式？策略流程怎么做？这个下篇文章会说到。

“高大上”的风控，究竟是什么？ （二）

相关阅读

相关文章

“高大上”的风控，究竟是什么？（二）