用户运营如何通过搭建uplift模型精准发券
作为运营向用户定向发优惠券是不是经常面临这么两个困惑:
困惑一:大规模发券,营销成本很高,使用率很低困惑二:优惠券使用率很高,优惠券带来增量业绩很小ROI低,导致这种情形往往是把券发给了那些活跃用户,这些用户即使不发券也会大概率下单。
我们通过实际案例来探讨一下如何解决这个问题
背景:针对流失用户发召回短信召回,假如流失池里100万用户,我们只有10万条短信预算,如何圈选这10万人做到利润最大化?
解决思路:
1、确定召回利益点券,假如发放满300减50券
2、随机选实验组和对照组各5000用户,实验组发券,对照组不发券
3、在一个转化周期内回收结果,标记使用和未使用
4、搭建uplift差分模型,分别用实验组和对照组搭建回归二分类响应模型
5、待营销用户输入模型计算uplift score,按uplift score降序圈选剩余9万用户发券
6、对比模型定向用户使用增益值,证明精准营销价值
一、首先,我们来介绍一下uplift模型原理
Uplift增益实验(Uplift Modeling)是一种用于估计个体干预增量(Individual Treatment Effect,ITE)的模型,即干预动作(treatment)对用户响应行为(response)产生的效果。Uplift增益实验的基本思想是,通过建立一个预测模型,来估计每个用户在干预和不干预的情况下的响应概率,然后计算两者的差值,即增益值。
原理逻辑很简单,粗白的说就是预测用户在干预返券和不干预发券两种情形下的回购率,差值就是干预的增益值,这么操作可以剔除那些即使不发券也会回流的用户。
其次,运营同学能不能搭建出这类的预测模型呢?
很多企业存在的问题是,一群工程师埋头研究这些所谓大数据模型,而恰恰这群人是脱离业务的,预测模型的精髓是用户特征工程是否能够有效代表用户的意愿,工程师们能想到的用户特征无非是用户浏览行为,比如打开APP次数、浏览时长、浏览页面数;用户购买行为,比如加购、收藏、购买、消费频次、消费间隔时间等,而这些特征能够有效预测一个用户的购买行为吗?显然不能。
比如这组数据建模
单从这些浅层的用户行为数据建模会产生纯臆测的结果,从数据逻辑出发,用户收藏的越多,加购的越多产生购买的概率很高,但从用户真实场景出发,用户是否购物受到竞争平台比价、心情是否愉悦等多重因素影响,而这些特征恰恰是最接近业务最接近用户的运营同学来挖掘的。
我相信很多运营同学不具备数据挖掘和建模能力,这篇文章的目标是简单来介绍运营同学如何通过工具来实现大数据挖掘和建模工作,从而让自身价值进一步提升
二、我们来看下模型的实操搭建
第一步:用户特征工程的梳理
除了用户浏览行为、消费行为、偏好行为特征,更重要的是挖用户的趋势行为,比如消费间隔周期的趋势、消费品类数、消费金额等等趋势,如果一个用户消费品类由多元变得单一或者消费客单价分布由多低变高或由高变低,消费频率由稳定变随意或随意变稳定,都可以预测一个用户下次消费行为。
比如电商平台的一个用户,在上个消费周期消费品类包含3c数码、生鲜、日百,本周期消费品类只有3C,且综合客单价由几百变成上千,复购周期趋势由30天变成60天,那这个用户继续购买生鲜的概率有多高?
通过挖掘用户行为趋势,再结合AB实验响应的数据,就可以搭建预测模型了
第二步:搭建回归响应模型
uplift需要针对策略组和对照组分别搭建响应模型,最后目标用户分别输入双模型后,计算uplift分值
借助分析挖掘工具,我们搭建以上数据流,用户计算在干预和未干预情况下响应率
首先来看下模型的预测精准度
建模数据70%用于培训,30%用于测试,培训集预测正确率79.53%,AUC达到了0.848;测试集预测正确率69.7%,AUC值0.744;模型预测性能可以接受
第三步:如何精准发券
uplift响应模型可以帮我们生成几类预测图,分别是响应图、增益图和利润图,我们可以基于这几类图指导券的营销动作
1)基于响应图结果精选用户发券
响应图显示了在不同百分位的用户中,实际响应(如优惠券使用)的比例。在发券活动中,响应图可以展示在每个百分位用户群体中,有多少比例的用户实际使用了优惠券。
根据以上累积响应图,我们可以看到曲线从接近100%开始逐渐下降,最终趋向于50%的水平线。这表明在图表的左侧,模型预测的响应率非常高,随着向右移动(即覆盖更多的用户),响应率逐渐降低。为了确定向前多少的用户发放优惠券,需要考虑几个因素:
- 整体响应率:这是所有用户中响应优惠券的平均比例。在响应图中,这个值似乎是50%。
- 目标响应率:您希望通过发放优惠券达到的最低响应率。这通常高于整体响应率。
- 成本与收益:发放优惠券的成本和预期收益。我们需要找到一个平衡点,使得收益最大化,同时成本保持在可接受范围内。在累积响应图上,可以找到一个点,该点的响应率符合我们的目标响应率。从图表左侧开始,沿着曲线向右移动,直到找到一个点,其响应率等于或略高于我们的目标响应率。该点对应的百分位数就是您需要向前多少的用户发放优惠券。例如,如果我们的目标响应率是70%,我们需要在曲线上找到响应率为70%的点。假设这个点对应的百分位数是20%,这意味着我们应该向前20%的用户发放优惠券。
2)基于增益图发券
增益图展示了模型预测的响应与随机选择相比的相对增益。在优惠券活动中,增益图可以指示在特定百分位的用户中,优惠券带来的额外销售增长。
图中,增益值为1.5914,这通常表示模型预测的效果比随机选择好1.5914倍。具体来说,如果随机选择的响应率是某个固定值,那么使用模型预测后的响应率是这个固定值的1.5914倍。这个增益值通常用于评估预测模型在特定百分位上的性能,特别是在营销活动中,用来确定哪些客户群体最有可能对促销活动做出响应。在实际应用中,如果增益值大于1,这意味着模型的预测能力优于随机选择。在增益图中,百分位46处的增益值1.5914表明,在模型预测为最有可能响应的前46%的用户中,响应率是随机选择用户响应率的1.5914倍,这是一个相对较高的提升,表明模型在这个百分位上的预测是有效的。
3)基于利润图发券
利润图表示在不同百分位的用户中,通过使用优惠券所获得的总利润。对于发券活动,利润图可以帮助我们评估在不同用户群体中发放优惠券的总体财务效益。
设置参数图如下:
- 成本 (Cost):每张优惠券的发放成本是5元。
- 收入 (Revenue):每次成功响应(客户使用优惠券)的收入是10元。
- 宽度 (Width):宽度设置为1%,意味着利润图上的每个数据点代表了1%的用户群体。
这提供了一个细粒度的视图,可以看到每增加1%的用户,利润是如何变化的。百分位46%,利润630:在图中,当目标用户群体的百分位达到46%时,累积利润达到630元。这表示如果按模型预测的顺序,向前46%最有可能响应的用户发放优惠券,那么预期的总利润将是630元。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!