用数据说话(一)

一、前言

“Claire,我来公司3个月了,你是第一个给我讲清楚这些图表到底是干什么的人。”

“Claire, where do you learn your presentation skills? You did a great job!”

“Your analysis and presentation is very insightful, Claire. I love the way how you presented the findings.”

以上来自我工作中同事、老板对我presentation的评价。在我近三年的数据分析生涯中,数据可视化和presentation一直是工作中的重要部分,present的对象包括但不限于公司内部技术和非技术人员、高管以及客户中的高管。正是这些经验的积累,本文我想针对“用数据说话”这一主题,分享给大家我踩过的坑和有效的用数据沟通的技巧,希望能帮你也在工作中清晰有效的呈现数据。

本文内容受众不只限于数据分析师,因为事实上,不管是金融分析师、产品经理、项目经理、运营专员、市场营销专员或是销售经理,在工作中都或多或少需要向同事、老板、高管、或者客户用数据来展示自己的业绩/项目成果、公司的运行现状或者客户的需求满足。众所周知,数据让你的statement(论据)更具说服力,量化结果也更容易让人留下深刻印象。

但事情没有那么简单,现实是没有良好的沟通表达,对方不一定完全理解你的意思,下面让我们来看看如何“用数据说话”。

作者注:

  • 本文侧重点在于如何用数据更好的表达自己的观点,里面涉及的数据可视化建议与咨询公司的报告图表(更偏静态和需要阅读)有一定区别。
  • 请读者容忍作者中英混杂的文风。
  • 作者的工作经历都是to B(面向企业)的数据分析。
  • 这部分想分享的内容太多,所以会写成一个系列。

二、有效数据化沟通的知识点

1. 上下文的重要性

一次好的数据化沟通要从介绍需求背景/上下文开始,比如本次meeting的目标是什么,谁提出了这个分析的需求,需求方想实现什么效果。再者,不同公司、环境、职级的人对同样事物的认知和熟悉程度是不同的,比如说某公司第二季度revenue是$1M,很多人可能并没有概念这个数字的大小、反映的业绩好坏,但如果你加上与去年同期的对比、有没有达到我们的预期(OKR),就会更容易被人理解。

2. knowing your audience is key(了解你的听众)

通常情况下,对不同audience做的dashboard都是不同的,比如面向公司内部市场和销售团队使用的dashboard,他们希望分析尽量细节(granular),这样他们可以选取对不同客户有效的信息进行pitch(产品推销)或者回答客户关于一些细节指标的提问。

但如果dashboard是面向客户企业的非技术人员和C-level的高管来使用,就要更偏向战略宏观角度的分析,作图尤其要注意简单易懂,不仅一张图不要放太多内容,也切忌堆砌图表。

3. a picture is worth a thousand words(一图胜千言)

有效的图表可以让听众更好的记住你的结论,而一个好的图是不需要使用者思考太多的。下面分享一个技巧和案例:

1)pre-attentive attributes

这是人类大脑对图表处理的一种潜意识表现,比如颜色的不同、深浅,线的长宽大小、方向,形状,2-D散点图等。

正是人类的这种信息处理特质,我们应该在数据可视化的时候利用起来,用这些特点来highlight我们想突出的insights。

颜色最容易被人们观察到,但不要使用过多颜色,会分散人们的注意力;尽量不使用倾斜的axis label,因为人们需要更多的时间来process,必要时使用缩写;去掉图表的边框而选择用空白来划分边界,因为边框会吸引受众的目光,而我们需要受众的注意力在图标的细节里。

用数据说话(一)

2)同样的数据,目标不同,选取的图表也应不同

比如我们有麦当劳不同地区不同月份的销售额,如下表(fake data)。

用数据说话(一)

当我想知道哪个地区哪个月销售额最高,一个好的visualization是直接在上表highlight最大值,如下图:

用数据说话(一)

当我想知道哪些数据达到了每月$100K的销售目标,用不同颜色的柱状条形图+目标水平线来展示。注:这里需要先unpivot上表。

用数据说话(一)

4. 数据的粒度(granularity)

任何人都能给出一个数字化的结果,但是注意你数据的level of details/granularity 是保证你结果正确的重要前提。比如下表:

用数据说话(一)

同一个电影可能有多个类别,这里不同的类别被分在了不同行。如果要算每个制片厂制作电影的的平均票房,就不能只按制片厂group by算票房的avg,因为同一电影的票房数有重复计算,种类越多的电影,票房的加权也越重。

正确的算法是先去重(de-duplicate),保证每个制片厂的每部电影只有一个票房纪录,再按制片厂算票房平均值。另外,这一点在你需要写SQL进行table join的时候也尤为重要!

5. actionable next steps

判断自己数据化沟通的成效之一,是在meeting或者presentation的最后,看audience能否带着你提供的insights进行一定的决策或者有清晰的下一步规划,这才保证我们的沟通是有效并能解决实际的问题。

数据分析师在做dashboard时的好习惯:

1)理解你要解决的问题

先自己想想你需要什么样的数据支持,再看你要从哪些database或者source table 中获取数据。

然后写SQL的时候,对你的结果有一个expectation, run出结果再和自己的expectation比较,起到verify你工作的效果。

2)数据分析师很重要的一个品质我愿称之为skepticism(怀疑精神)

很多时候当你看到一个奇怪的结果时(比如近三个月销售额一直在下降),与其立马投入业务分析,不如先去看看这个结果的生成用了哪些数据,进行了哪些数据转化,可视化的操作对不对等等。

如果是数据源头的问题(例如数据捕捉不完整),那就需要先把data pipeline的处理修正,再进行分析。

有时候你甚至会发现业务部门让你做的分析还没开始就结束了…

3)拿到数据后别急着画图,现实生活中已有的数据很可能不是你直接能用来可视化的数据,你需要进行一定的数据清理和数据转化

比如算消费者随月份的平均订单花费变化趋势,你一方面要保证纳入计算的数据中销售量>0,另一方面可以观察一下消费者平均订单花费的分布,必要时去掉一些极端值,或者用quantile来表现趋势而不是单一的平均值(易受极值影响)。

三、总结

一个好的可视化报表(dashboard)还有很多细节需要注意,数据可视化作为“用数据说话”的重要工具,下一节我们会讲更多的设计细节。

本文作者@一个数据人的自留地 。


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部