“时间颗粒度”,帮你更好地设计产品
时间具有多变性,日、月、年对我们的意义是不同的,因为其呈现出来的时间段是不一致的,日体现的时间长度肯定远小于月,长短不一的时间长度组成了时间的多样性,而不同时间长度下统计出来的数据结果具有不同的意义,这就是数据对“时间”的敏感性。
通过一个案例来看一下,蹲点观察楼下十足便利店3月份的人流情况,可以发现“3月1号的人流量”和“3月份一整个月的人流量”是不一样的,前者表现了单天的人流量,后者表现了整个月的人流量。
我们发现,不同的“时间”产生的数据结果有其各自的意义,所以我们要怎么去选择这些不同的“时间”呢?
一、认识多种多样的时间
首先我们需要了解时间的多样性,从“时间颗粒度”的角度来认识,主要分为“分时维度”和“日期维度”。
01 分时维度
分时维度是反映日内情况下随着小时或者分钟的变化,展示单位小时或分钟下的数据,具有较强的时效性。我们可以通过观察“一天内不同分时”和“多个日期相同分时”呈现出来的数据现象,来发现“分时维度”下的数据特点。
1. 观察一整天不同时段的数据
通过“分时维度”得到一天内不同时间段的数据值,将这些数据“图表可视化”为随着时间段变化的折线图,从图中我们可以了解下面的这些信息:
- a.数据在一天不同时间段内的趋势情况以及斜率,从几点到几点呈增长趋势,从几点到几点呈下降趋势
- b.数据最大值和最小值出现的具体时间段或者时间点
- c.数据在相邻两个时间段之间的环比情况
- d.数据在不同时间段之间的增长和下降程度
这些信息能让我们对数据在不同时段的趋势情况有一个了解,为对时间段要求比较精确的产品动作提供了依据,帮助我们发现短时间内的异常波动,为发现问题提供了异常数据的支持。
看个案例,下图是一张访问用户量分时段折线图,我们就可以基于数据最大值出现在14:00的这一现象,发起一次push消息的行为,因为该时间段下用户数量最大,可以尽可能的获得曝光量;我们也可以在0:00-5:00这个时间段安排产品上线等需要服务器发布的行为,基于的现象就是这个时间段访问用户量少,对用户的干扰低。
访问用户量分时段折线图
我们也可以把一天内不同时段的数据“图表可视化”为饼图,从图中我们可以了解到下面的这些信息:
- a.数据在不同时间段的占比情况
- b.数据占比最大的出现在哪个时间段,占比最小的出现在哪个时间段
这些信息能让我们对数据在不同时间段的分布情况有一个了解,单独了解占比的意义不是特别大,但是可以配合其他的数据分析方法得到一些更细致的结论。
比如下图是12:00-18:00不同时间段用户访问量的饼图,结合“二八定理”,我们就可以得出12:00和13:00这两个时间段提供了80%的访问量,这两个时间段就是我们主要需要维护的时间。
访问用户量分时段饼图
2. 观察多个不同日期,相同时间段的数据
通过将多个日期下的相同时间段的数据“图表可视化”为随着时间段变化的对比柱形图,从图中我们可以了解到这些信息:
- a.数据在不同日期相同时间段下的同比情况
- b.数据在不同日期下是否有可以抽象出来的趋势共性,多个日期是否都是从几点到几点的数据呈增长趋势,从几点到几点的数据呈下降趋势,这个现象就可以作为一个共性趋势。
这些信息有助于我们归纳出数据的共性,一方面我们可以根据这些共性设计和优化产品;另一方面也可以以此作为异常值的判别方式,如果观察多个日期下都是在01:00~05:00的数据为0,这个时候发现突然有1天在01:00有大量的数据,就可以断定为是异常数据了。
同样来看一个案例:
下图是星期五和星期六的访问用户量的分时段柱形图(截取部分时间段),运用上面提到的观察角度,很容易就能发现虽然日期不同,同时段的数据有大小差异,但是数据趋势是具有共性,都从12点开始呈增长趋势,在16点达到峰值,之后呈下降趋势,我们就可以得出我们用户访问行为的规律。
访问用户量分时段对比柱形图
对分时维度数据做个简单的总结:
- 定义:以分钟或小时作为颗粒度单位
- 数据格式:分钟+每分钟数据;小时+每小时数据
- 数据意义:反映日内的数据情况
- 适用场景:对日内数据敏感或者日内数据具有重要意义的场景,比如金融服务、数据监控等场景
02 日期维度
日期维度是反映一段时间内随着日期的变化,展示不同日期下的数据,具有较强的完整性。我们也通过观察“一段时间内不同日期”和“不同周期内的日期”呈现出来的数据现象,来发现“日期维度”下的数据特点。
1.一段时间内不同日期
通过“日期维度”得到一段时间内不同日期的数据值,将这些数据“图表可视化”为随着日期变化的折线图,从图中我们可以了解下面的这些信息:
- a.数据在这段时间内的趋势情况,从哪一日到哪一日呈增长趋势或者下降趋势
- b.数据最大值和最小值出现的具体日期是哪一天
- c.数据在相邻两天的环比情况,是环比上涨,还是环比下降
这些信息有助于我们复盘一段时间内(常见的最近7天,最近30天的)的数据趋势,为我们后续的业务动作提供数据支持,数据随着日期不断增长,是否需要投入更多的资源;数据随着日期不断降低,是否需要改变策略。
案例:
下图是某淘宝店04-11到04-17的销售额数据,我们发现数据在11日到17日这7天呈现一个上升趋势,店铺主就需要考虑库存是否充足,是否需要增加储备等。
04-11~04-17店铺销售额折线图
2. 不同周期内的日期
不同日期虽然日期不同,但是在一个周期内存在一定规律——4月14日是星期二,4月21日也是星期二;3月1日是3月的第一天,4月1日是4月的第一天。
这就是日期在不同周期内的规律,我们可以借助这个规律来观察不同周期内的日期变化,将这些数据结果“图表可视化”我们也可以得到对比柱形图,从图中我们可以了解到下面这些信息:
- a.数据在不同周期内相同位置日期的同比情况
- b.数据在不同周期内的日期是不是会表现出相同的规律或者趋势
这些信息可以帮助我们归纳出周期下数据具有固定的规律,根据这个规律可以指导我们一些业务动作或者产品设计。
案例:
下图是某写字楼的自助便利机销售人数在“4-6~4-12”和“4-13~4-19”两周不同日期下的数据对比图,我们可以发现不同日期的销售人数的具体数值有差异,但是在趋势上是具有明显规律的,周六和周日两天销售人数远低于其余5天,这也和我们工作日和休息日的认知所符合,而作为自主便利机的商家也可以根据这个现象制定补货策略:周一进行补货。
两周销售人数对比柱形图
对日维度数据做个简单的总结
- 定义:以日作为颗粒度单位
- 数据格式:日期+每日数据
- 数据意义:反映日不同日期下的数据情况
- 适用场景:针对需要统计或观察一段时间内每一日数据的场景
其次,在了解了时间多样性的几种具体表现形式后,就需要我们根据实际的业务情况来选择“时间”了。合适的时间颗粒度能帮助我们很好的反映业务的真实情况,而不合适的时间颗粒度所提供的数据结果对我们没有意义,甚至会起到误导作用。
某淘宝商家想调整客服排版,这个时候就需要我们选择“分时维度”,观察不同日期相同时间段的客服团队接待人数,是否具有共同的趋势,在普遍接待量多的几个时间段安排较多人手的客服,在接待量少的几个时间段减少客服数量。
如果我们在上面这个业务场景下选择了“日期维度”,得到的数据就无法实现这一目标,而“日期维度”在“什么时候增加临时或者外包客服”这个业务场景下就具有意义,通过复盘一段时间的接待数据,发现大促期间接待量爆方式的现象,从而在大促前提前增加客服资源。
总结
数据对时间是非常敏感的,“时间”也是我们设计产品时的一大武器,选择合理的时间颗粒度,能很好的帮我们展示业务数据,对业务发展起到指导作用。
本文作者@晌午
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!