从0到1搭建业务指标追踪平台

乘风随行 2023-08-04 06:54:58

一、为什么要做

数据指标的异常波动分析是数据同学经常会碰到的case，也是业务同学经常会提的分析需求。数据指标的异常追踪，特别是核心关键北极星指标，关系到高层策略方向制定，业务日常的运营，可以说在时效性和准确性上非常关键。

业务指标的监控需要业务同学和数据同学紧密配合，但在日常的数据运营过程中，业务变化是直接导致数据异动的重要原因，经常会发现业务变化对数据同事来说存在滞后，不对称的情况，导致数据排查异常耗费较长时间。

业务指标监控，如果没有一个体系化的流程和监控机制，会让参与各方都会感觉“人在囧途”，具体情况，基于互联网金融业务场景，我们来逐个分析下：

1. 产品运营团队

新上线了个优化的小版本，数据同学却抱怨没提前通知他们，数据出了异常排查时间长。

这周做了个拉新活动，原本以为新注册用户数会大增，没想到带来了一大批垃圾注册用户。

流量太大，放款资金承接不住，我要经常修改流控开关，一动数据就会异常报警，也不知道到底是什么原因。

2. 风控团队

入催率升高了，到底是用户质量变差了，还是用户还款还不进来了，每次排查都要一两天。

三方征信源数据认证天天报警，也不知道对我风控通过率到底有没影响，怎么快速排查？

3. 支付和财务团队

还款失败率升高了，找技术排查还是找数据排查，谁能最快给我定位原因？

是支付渠道出问题，还是资方那边出问题？

问题定位到了，都过了一两天了，对外沟通还要时间，用户投诉不断……

4. 数据团队

指标动不动就预警，业务到底发生了什么？

为什么我总是最后一个知道真相？

数据异常，是数据问题还是业务问题？

能不能配合的默契点啊，数据业务多互通有无啊… 你们做了啥怎么不提前知会数据部？

真是人在囧途，每个团队都觉得自己人在囧途！

从0到1搭建业务指标追踪平台

二、做什么

那到底是人出了问题，还是流程问题、工具问题？

基于以上异动定位的场景，根本原因还是流程和工具建设不到位，导致效率低下，相互抱怨。

这里面本质上的问题是信息不对称，没有将常见的异常归因流程沉淀下来。单单从流程上来说，业务根本没有义务将日常的产品迭代和业务活动及运营策略都提前告诉数据团队，那是否就证明数据团队只能被动的从数据上了解真相呢？

这里我们先不讨论流程问题，更多的去讨论如何利用数据去提前发现真相，及时帮助业务归因复盘。

那该如何优化？

从0到1搭建业务指标追踪平台

三、怎么做

先，我们要梳理下信贷业务的指标体系。

信贷业务主流程链路节点和核心指标构建如下：

从0到1搭建业务指标追踪平台

其次，根据业务方关注的细化流程来看。

具体到业务部门，比如产品部门最关注的就是节点转化率。

前端环节涉及到的节点：注册——实名——计算额度——发起申请——审核通过——放款。

对于各个节点的转化率，漏斗情况，是产品同学每天都要关注的数据。

再次，抽象出一些通用的异常归因指标体系，可下钻定位。

比如，像风控好产品团队都会关注的入催率指标，在风控平稳期（没有大规模上线优化策略时期），当入催率指标下降时，我们发现大部分原因是由于用户还款通道出问题，导致用户想还却还不进来，进一步下探，我们就需要下钻到还款失败率，再到进一步定位失败原因，我们需要下探到还款失败原因（按资方和按渠道维度），到此，我们大概率能看出是哪个资方的哪条还款渠道出了问题，接下来给到支付团队去紧急修复或者去做外部沟通。

关键指标我们梳理出来了，那采用何种方法去监控异常？

首先，我们要考虑的是如何定义异常。有对比才会有异常，如何定义对比的基线？

一般来说，有如下几种比较方法：