怎么更好地进行数据可视化?

你好,我是林骥。

在日常工作中,我们常常需要借助数据可视化的方法,更好地展示自己的洞见,让信息传递变得更加高效。

最近,我看了两本与数据可视化相关的书,分别是《更好的数据可视化指南》和《Excel 数据可视化实操指南》,作者是美国的乔纳森·施瓦比什(Jonathan Schwabish),他是一个经济学家、作家、教师,也是一个数据可视化的专家。

这两本书的译者是易炜老师,他认为要做好数据可视化,需要非常广泛的知识,包括但不限于格式塔心理学、设计原理、色彩规则、图表类型等。

《更好的数据可视化指南》这本书包括 3 个部分,主要介绍了数据可视化的指导原则、图表类型和样式指南,目的是提升图表素养,丰富图表工具箱。

1、数据可视化的指导原则

结合《更好的数据可视化指南》和作者博客中的内容,下面介绍 5 个数据可视化的指导原则:

① 展示数据 ② 减少混乱 ③ 图文结合 ④ 前注意加工 ⑤ 从灰色开始。

这些指导原则能帮我们更好地理解和满足受众的需求,为制作合适的图表奠定基础。

① 展示数据

突出展示与主题相关的数据,而不是所有的数据。例如,下面两张散点图,右边突出显示几个想要强调的数据点,这样更容易阅读。

② 减少混乱

删除不必要的视觉元素,例如:加粗的网格线、纹理填充、渐变等都可以去掉。

③ 图文结合

把图表与文字融合在一起,各自为信息传递做出贡献。例如:在折线图的尾部直接标注相应的文字,而不是用图例。

④ 前注意加工

前注意加工是心理学中的一个概念,指的是在注意力集中之前,大脑会快速自动进行初步处理,帮助我们瞬间筛选出差异比较大的信息。

⑤ 从灰色开始

刚开始把整个图表设置为灰色,然后思考需要强调的地方,再给这些地方设置相应的颜色。

我们在制作数据图表的过程中,不妨试着遵循这些指导原则,提升数据可视化的效果。

2、数据可视化的图表类型

市面上教你怎么制作出漂亮、炫酷、华丽图表的资料比较多,但真正从源头上厘清怎么正确选择图表类型的资料却很少。

我曾在「数据可视化的方法和工具」一文中介绍过一些图表类型,后来 Chart.Guide 又增加了一些新的图表:

在《更好的数据可视化指南》这本书中,作者基于图表的用途,把 80 多张图表分为 8 个大类:比较、时间、分布、地缘、关系、构成、定性和表格,比 Chart.Guide 中多了 2 个分类:定性和表格。

各类图表是如何起作用的?它们的优缺点分别是什么呢?

① 比较

用于比较的图表有很多,包括各种各样的条形图,还有点状图、马赛克图、单元图、同型图、华夫图、热力图仪表图、子弹图、气泡图、桑基图、瀑布图等。

虽然条形图很容易阅读和理解,但是千篇一律的条形图会让人感到无聊,因此有时需要找到更有吸引力的图表。

例如,把桑基图用来展示公司的财务数据指标,可以帮助受众更加清晰地知道公司的主要经营模式。

② 时间

表现时间变化的图表,除了常见的折线图之外,还有斜率图、迷你图、凹凸图、周期图、面积图、流图、地平线图、甘特图、流程图、时间线等。

虽然折线图清晰易读,但当不需要显示时间序列中的所有数据时,斜率图是一个不错的选择。例如,我们可以根据线条的陡峭程度,直观地感受到变化的幅度。

③ 分布

呈现数据分布的图表有直方图、金字塔图、误差条形图、置信区间图、渐变图、扇形图、箱线图、蜡烛图、小提琴图、山脊图、蜂群图、麦穗图、云雨图、茎叶图等。

对大多数普通读者来说,理解这些图表可能会有点困难,因为需要具备一定的统计学知识。例如,小提琴图可以用来显示数据的整体分布情况,其中越厚的区域表示这部分观测值越多,反之则越少。

④ 地缘

数据地图可以让受众从中找到自己与主题的关联,这是其他图表无法比拟的一个优势。然而,地理区域的大小与数据的重要程度可能并不相符,在绘制数据地图之前,要停下来想一想,这是一个正确的选择吗?

我们可以权衡数据可视化的准确性与地图的熟悉度,通过变形地图的方式,来调整数据失真的问题。例如,用六边形表示每个省份,填充的颜色深浅与数值大小相对应。

⑤ 关系

展示变量之间关系的图表,除了散点图之外,还有气泡图、平行坐标图、雷达图、和弦图、弧线图、网络图、树形图等。其中有些图表不常用,读者理解起来比较困难。

这并不是说要刻意复杂化,或者干脆不使用,而是要促进自己思考,从而更好地呈现想要传递的信息。例如,可以使用标签、注释、标题、颜色、图例和提示来让图表更容易被理解。

⑥ 构成

展示整体与部分之间关系的构成类图表,除了最常见的饼图之外,还有圆环图、树图、旭日图、南丁格尔图、维诺图等。在数据可视化领域,大家对饼图的使用存在一些争议。

从感知层面来看,我们难以识别和对比每块饼的面积大小,但作为一种大众熟悉的图表,熟悉度本身就是有用的。如果你的目标是清晰、准确地判断数据的大小,那么饼图通常都不是最好的选择。

但当扇形占比是我们熟悉的 25%、50% 或 75% 时,你可以用饼图轻松引导读者的注意力。假设你要写一份数据分析报告,想要说明某个类别的占比超过 50%,让读者了解显著的差异或关注某个类别,饼图就会很有用。

⑦ 定性

对于非数字信息,我们可以用定性的方法来讲故事。

比如,图标、图像、表情符号等视觉语言,可以吸引读者的注意力,便于读者对定性数据进行分类。

词云图是可视化定性数据的一种流行方式,单词的大小与其出现的频次有关。例如,下面是朋友们描述我的一些词语,其中形容我最多的 3 个词是:自律、专业、严谨。

⑧ 表格

设计良好的表格,可以帮助读者快速找到重要的数值,并从中发现规律。

例如,下表是我 2023 年每天的情绪能量评分,从数据中可以看出,上半年的情绪能量比较高,而下半年的情绪能量比较低,尤其是 2023 年 12 月 24 日这一天,情绪降到低谷。

通过时间记录,我可以找到这一天情绪低落的原因。

3、数据可视化的样式指南

数据可视化的样式指南包括:定义构成要素、规定相应格式以及如何正确使用,例如字体、颜色、线条、样式、网格线、刻度线等元素,都会影响图表的清晰度和吸引力。

样式指南定义了设计图表的规范和策略,有点类似于论文的格式,其中包括数据可视化中构成要素的详细建议。

例如,标题应该放在什么位置?字体的大小、样式和颜色是什么?

下面是美国阳光基金会的图表样式指南:

来源:https://github.com/amycesal/dataviz-style-guide/blob/master/Sunlight-StyleGuide-DataViz.pdf

我们可以根据样式指南,制作相应的数据可视化模版,然后直接套用,这样就能节省自己的时间和精力,让工作变得更加统一和高效,还能形成品牌效应。

图表的配色非常重要,因为颜色能唤起人们的情感并引起注意,人们注意到图表的第一个因素可能就是颜色。

4、最后的话

身处信息时代的我们,很容迷失在信息海洋中,但借助好的数据可视化图表,我们可以拨云见日,从数据中看见有趣的信息,从信息中洞见有用的知识,并从知识中预见行动的智慧。

看完《更好的数据可视化指南》和《Excel 数据可视化实操指南》之后,我把其中的一些知识应用到《数据可视化》流程中,重新设计了一版流程图:

数据可视化需要我们不断提升自己的审美能力,并在科学与艺术之间找到某种平衡。

虽然有些图表看起来不够精确,但是能够有效吸引人的注意,所以,在某些场合下,对图表适当进行修饰还是有必要的。

作者:林骥
《数据化分析》作者

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部