带你认识留存率:纠正你对留存的所有错误认识
01 究竟什么才是留存率
其实产品领域的很多指标,都缺少业界通用的定义。
并不是没有优秀的定义,只是还没有在业界普及开来。
就拿最简单的产品转化率来说,有多少人能分清用户转化率和用户数比值的差异呢?
再比如复购率,A 产品的复购率是 60%,B 产品的复购率只有 40%,并不一定是 A 比 B 好,很可能是 A 在复购率口径的定义上取巧,让复购率显得好看一点,方便拉投资。
从这一点来看,可以说我们现在所处的时间段,还是一个方法论初生的时间段。
那么,当我们说到留存率时,到底什么才是留存率?
有人说:今天来了,第2天还来,就是留存;第7天还来,就是7日留存。
这种说法还算符合常见的数据平台的定义,不过还不够精准。
有人说:今天来了,7天之内又来过,就是7日留存。
别笑,真的有某明星独角兽高管要求这么定义 n 日留存,并且还说服了 CTO,要照此开发相应的报表每日跟踪。当时亲临其中的我,只好委曲求全,整出来两个概念,一个叫第 n 日留存,一个叫 n 日内留存。
抱着强势批判性思维,我们先去看背后的业务目的,有没有合理性:
想看 n 日内的“留存”,代表着想要看这么一种业务表现:T 日来的人,有多少在之后的 T+1 到 T+n 日还来,这部分还来的人,才能算我留存下来的用户。而觉得不应该看第n日留存的原因,是觉得只看某一日来没来,过于随机了,要是用户 n+1 日或者 n-1 日来怎么办,不都没统计进去吗?
仔细品一品,问题有两点:
- 看 n 日内留存的目的是为了看流失,即有多少人来过一次之后就不来了,然后通过流失反过来得出他想要的留存。出发点是合理的,但是方法确实不当。随着 n 的增加,n 日内留存下来的人会越来越多,换句话说随着时间的流逝,留存下来的人越来越多,这显然是反直觉的。
- 不看第n日留存的原因是没有认识到留存率代表的是群体特征,而非个体特征。如果一张彩票的中奖率是 10%,有 100 万人买,那么我中奖还是不中奖,都改变不了最终有 10 万人会中奖的事实。同样的,对群体而言,单一个体是 n+1 日来还是 n-1 日来没有区别,在统计特征上影响不了群体中有多少人第 n 日回来。而拿单个用户谈留存率是没有意义的,你总不能说因为你中奖了,所以中奖率就是 100%,因为中奖率在讲的是买彩票的一大群人而不是你一个人——指标不适用。
定义留存率的目的,是想要衡量我们从各个渠道那里所获得的流量,最终有多少留下来成为我们的忠实用户。从这个业务背景出发,真正的留存率,一定是针对新用户而言的。对着老用户谈“留存”,实际是在谈另外的业务,比如:
- 新用户留存下来成为老用户之后,有多少能继续留下来,这个业务应该叫用户流失,而不是留存
- 新用户留存下来成为老用户之后,某天来过之后多少第二天还来,这个业务应该叫用户回访或者访问频次,而访问频次又是跟产品形态强相关的,微信每天不只使用一次,而经期管理类 App 一个月使用七八次就不错了
而对于每日所有活跃用户的”次日留存”,就更没有意义了。
这个虚假的数据指标完全被用户的构成所左右:一部分是当日的新用户次留,另一部分是当日的老用户的次日回访 (访问频次) 。
当每日活跃用户 90% 以上是新用户的时候,这个”次日留存”就会很低,而 90% 以上是新用户的时候,这个”次日留存”就跟产品形态强相关,也就是忠实用户的平均使用频次。
所以科学的留存率(日)定义,应该是:T 日新增用户中,在第 n 日(即 T+n 日)再次活跃的用户,占 T 日新增用户的比例。
谷歌的官方说法更简洁,叫:Percentage of new users who return each day。
02 留存率应该怎么看
通过上面的定义,我们再去看日留存曲线的时候,一定是一条这样的曲线:
通过这条曲线,我们可以清楚的知道每一天新增的这批用户,随着时间的流逝最终留存下来了多少。并且这条留存曲线一定是可以通过乘幂函数拟合的,把第 n 日的留存率记为 Ret(n),则一定有:Ret(n)=a*n^b
这里说了这么多“一定”,其实是想强调留存曲线几乎是一条标准的客观规律,无论什么样的产品形态,都有这么一条曲线。他们可能有高有低、有急有缓,但是都可以用一条乘幂函数表示。
而理解了留存曲线是客观规律这一事实,就能理解为什么我们可以用次日留存、7 日留存等作为产品的重要指标了——因为他们都是对留存曲线一整条曲线的点估计。
说白了,就是把一整条曲线降维成一个点,这样我们就可以每天观察这个点的变化情况,从而得知产品的留存状况是变好了还是变坏了。
下图中是次日留存和 7 日留存的变化曲线,X 轴是日期,Y 轴是留存率,业务含义即在 X 日新增的用户,其对应的 n 日留存率是 Y。
很明显,如果没有这种降维方法的话,我们就要给每一天画一条留存曲线了,几十条留存曲线摆在一起是看不出来留存随日期的趋势变化的。
当然,有降维就一定有信息损失。所以我们还是要注意多角度的观测留存曲线才行。
留存曲线有两个重要特征:
- 前期快速下降
- 一定时间后进入平稳期
如果我们想要提高产品的留存表现,就要从这两个方面出发,缩短用户群组进入平稳期的时间 (尽快激活) ,并且让更多的用户进入平稳期 (激活更多) 。
03 次日留存的意义
总有这样一种观点,认为自己的商业模式是很低频的模式,用户往往要几个月才会消费一次,比如酒店、旅游,所以次日留存没有意义,也不需要提高次留。
我想从几方面多角度地全方位批评一下:
- 你以为用户次日不来,次月就会来了?Naive,第二天都没有用户想起你来,一个月之后用户早就把你忘光了,都去隔壁消费了
- 用户的转化是一个过程而不是一个点,一定是从认知、认可再到认购的过程,次留代表的就是认可。只有用户认可你了,才会有后续的认购。
- 越低频的产品,用户的决策链路越长,往往花几个月的时间货比三家,最后决定性的几分钟完成交易链路上的转化。想想如果在这几个月的时间内用户从来都没有访问过你的产品,会是多可怕的事情。所以对低频产品来说,次留同样重要。
并且由于留存曲线是一条统计意义上的曲线,次留是 15% 并不代表只有 20% 的留下来,可能拉长到一个月时间后,总共有 40% 的用户留下来。
然而通过把次留从 15% 做到 20%,你是可以预知到一个月后留存下来的用户有可能超过 50% 的。
这也是这个数据指标的重要价值:通过量化的方式衡量业务表现的变化,并且尽可能的更早发现变化。
注意:重点是衡量业务变化,而不是衡量业务,如果没看懂,建议仔细品一品。
另外衍生一点:次留可以不拘泥于 App,小程序这些具体形态上,从更高的层面上,应该聚焦到产品价值本身的留存上。
如果能通过搜索引擎,社交媒体等,持续的让用户体验到你的产品的核心价值,就能做到用户留存了。
通过 RSS 订阅的方式订阅和持续阅读:Genius,微信公众号:产品研究笔记
本文作者 @Guibin
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!