什么是代理指标?
当我读大学的时候,当在家里需要上知网、JSTOR等网站上下载论文,通常我们先登录学校图书馆的代理服务器,然后再访问论文网站。与我们的电脑发生连接的,其实是图书馆代理服务器,再由代理服务器向JSTOR发起数据请求。
实际上,在指标体系里,也有一类指标,我们称之为代理指标(Proxy Metrics),当一个指标不容易被衡量时,我们就需要另一个指标来替代,而这个替代指标就成为代理指标。
一、我们为什么需要代理指标?
在聊这个问题之前,我们先从产品和运营的视角,聊下为什么需要指标。
指标是对业务发展状况和进度的量化,对于业务策略具有指向性意义。换句话说,我们所做的所有工作,都是为了某几个指标而努力,也仅需为这些指标的提升(或下降)而负责。
因此,我们会通过观察这些指标的变化,对我们策略进行归因,明确哪些策略是有用的、哪些是做了无用功、哪些带来了负向收益。
一般情况下,我们会将其中最重要的指标称为北极星指标——围绕该指标的升降和拆解,指导核心策略制定与执行。
好的产品或运营,每天上班第一件事情一定是观察昨天的数据。如果发现核心指标有波动,我们要明确造成波动的原因(后续会有专门的章节来讨论如何进行数据归因),从而及时发现问题。
但是在一些情况下,一些指标很难获得,通常有以下两方面的因素:
① 指标难以量化。如,我们要衡量用户对产品的满意度,仅仅通过应用商店打分、NPS问卷是不够的——要么数据过于稀疏,要么打分场景让用户的选择有极强的倾向性(如用户通常是在有差评的时候去打分,或者给予用户一些激励引导用户打高分);而要通过用户访谈,覆盖的样本过少,又容易导致数据不置信。
② 指标观察周期长。如Netflix将用户的月留存率作为其产品功能优化的北极星指标,所有的A/B实验也需要将该指标作为收益评估依据。但是,要获得月留存率,时间过于滞后——毕竟,等1个月之后才能发现问题,或者明确某个策略收益,用户早就流失了,代价过高而不可接受。
跳出产品领域,一个更典型的例子是GDP。我国GDP数据,通常以季度为单位进行统计和发布,这是十分滞后的指标。
对于惜时如金的金融机构而言,各种买入、卖出的投资决策,又极其依赖宏观GDP的数据,这么高的延时显然不可接受——毕竟它们为了提前数十毫秒获取信息,愿意花费大代价拉光纤专线。为此,他们购买了大量的另类数据(alternative data),关于另类数据在后面再细讲。
所以,我们需要更容易、更快速获取的代理指标,来替代难以获取的终极指标。终极指标是我在本文中所使用的替代词汇,其本身并无任何意义。
二、选择代理指标的标准
需要指出的是,并没有一个指标,就叫做代理指标,它只是我们在解决业务问题的时候,引入的一个概念,帮助我们更好衡量业务进展与质量。
代理指标的挑选,需要满足以下因素:
容易测量:这一点无须展开讨论。需要指出的是,这里的“容易”,既指测量方法上的简单,也指观察周期短、时效性强。如Netflix,将首次会话(session)中至少添加3个影片在候选集,作为月活的代理指标。
与终极指标之间存在相关:换句话说,代理指标的变化,可以反映在终极指标上。一般而言,我们尽可能挑选与终极指标存在正相关的代理指标,即二者在往同一个方向变化。当然,一些情况下也可以使用负相关的代理指标,如ANR(App Not Respoding,App未响应)比例,与用户留存负相关;在智能客服领域,转人工率是衡量客服智能程度的重要指标,越低则意味着智能客服可以独自解决更多问题,无须人工介入。
可干预:通过我们的产品功能优化、运营活动,代理指标可以对这些策略有比较灵敏地反馈。我们此前做过一款视频剪辑工具,做出来的视频可以发布到抖音。一开始我们将剪辑出来的视频播放次数,作为衡量产品质量的代理指标,但是我们后面发现,我们的策略迭代并不能真正影响到这一指标。
不可投机:这一标准源自Netflix。很多指标,可以通过产品功能设计、运营活动,来人为地强行提升(或降低)。这样的“骚操作”,本质上掩盖了业务问题,短期内对于汇报、晋升有帮助,但长期来看对产品、用户伤害非常大。如Netflix曾经将打电话给客服的比例,作为衡量用户体验的指标之一。但是产品经理发现,只需要在页面中把客服电话隐藏起来,就能有效降低这一指标。
平衡短期目标与长期收益:好的代理指标,能帮助我们正确优化产品和运营策略,需要兼具短期目标与长期收益,不能过于短视。在互联网广告早期,由于难以衡量广告对销售额的提升作用,我们一度将CTR(Click Through Rate,点击率)作为衡量一条广告好坏的代理指标。我们一切操作都是为了提升点击率,当反映到创意策略上时,就是美女、促销、降价的劲爆信息。短期看,提升CTR能帮助大家达成KPI,但是对于用户体验、品牌形象,则会有潜在的、长期、致命的伤害。
三、更宏观视角看代理指标
我对于代理指标的思考,更多来自于产品领域之外,特别是经济领域,他们花费大量时间、精力来研究另类数据,作为评估经济发展质量的代理指标。
我将另类数据界定为:为达成某个目标,在其实现过程中生产出来的数据。
比如,为了达成汽车售卖,汽车生产(特斯拉工厂的地理围栏数据)、流通(货车/货轮的卫星图像数据)、终端售卖(4S店的客流量数据)等这些过程数据,都可以来监控、预测汽车销量。以上这几个环节的数据生产和收集,贯穿在整个售卖过程中,可以实现更早、更及时的统计和分析。相比基于事后统计得来的汽车销量数据,过程数据在时效性和准确度上显然更有保证。
在这个意义上,alternative data也可以翻译作“可替代的数据”:以过程数据,替代结果数据。
举几个例子,帮助大家更好理解另类数据。
为了测算特斯拉汽车销量,一家名为Thasos的数据供应商另辟蹊径,他们“监控”了特斯拉位于Fremont的工厂。
公开资料显示:该工厂占地370英亩,约为1.5平方公里;2021年平均每周生产 8,550 辆汽车,据称是全美汽车生产效率最高的工厂。
Thasos围绕Fremont厂区建立了一个电子围栏,采集工厂范围内智能手机发出的地理位置信号。通过信号数据量计算,2018年6月到10月,特斯拉工厂夜间加班时长增长了30%。
这些地理位置数据,据《华尔街日报》报道,源自1,000款左右的App,其中大部分都是需要准确获取地理位置信息的应用,如天气类、导航类的App。
微众银行使用卫星图像,来分析特斯拉工厂和张江高新园区内停车场车辆数,以及主要港口的船舶活跃情况,来评估疫情之后经济恢复状况。
类似,招银理财用夜光数据,来监测工厂开工:
除厂区散发的灯光越强外,人员和物流状况也会随着开工活跃程度的提升而增加。该公司将143个工业园区卫星夜光数据汇总,构建了从2014年到现在的月度全国工业开工指数。
Orbital Insights用卫星图像来监控中国的原油储备,借助的是影子:储油罐顶部有一个可以浮动的盖子,随着其中原油的多少而起伏。通过卫星图像测量盖子投射到油罐上的影子大小,可以得到储油罐中原油的高度,进而估算原油储备。
参考材料:
[1]Gibson Biddle.Proxy Metrics;
[2]21世纪经济报道.:哪个城市夜光最强?卫星数据显示,全国工业企业复工接近50%;
作者
简写2019。理性派,思考本质问题。坚定地用数据和结构化解决一切问题。
本文
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!