冈比亚

注册

 

发新话题 回复该主题

数据可视化基础知识下篇 [复制链接]

1#
北京什么时候治疗白癜风比较好 https://m-mip.39.net/nk/mip_5052875.html

如何高效、快速的制作一份兼具实用性和美观性的数据可视化图表?下篇的内容主要帮助你解决这个问题。

大纲:图表的通用制作规则柱状图的制作规范折线图的制作规范饼图的制作规范散点图的制作规范面积图的制作规范1.图表的通用制作规则01.图表中的线条

有无刻度线

当数据的数值非常重要时,一定要使用刻度线来让观众更清晰的了解数据。如果你的观众只需要了解A数据大于B数据,那么刻度线是没有必要的,只需在坐标轴上使用小刻度即可。但是如果你的读者要花一些时间在柱状图上并感兴趣A数据是45.65而B数据是37.66,那么使用刻度线将有助于他们理解。

刻度线的颜色

如果确定要使用刻度线,则需要使它们比作为实际数据的点或者线条要层级低。因为这些刻度线也属于背景的一部分。总结来说,不要使用全黑或者全白的线条。如果你的背景颜色是白色或者浅色系,那么你应该让你的线条灰一些。你也同样可以让这些线条变成亮灰色,点状或者虚线。

负空间的刻度线网格

你也可以使用灰色的背景,然后将刻度线反白。这是一种很好的利用负空间做设计的方法。或者刻度线可以用稍微偏黑色一点的灰色,因为很明显这样会让刻度线更融入背景一些。

坐标线

坐标线应该比刻度线,线条更粗,颜色更深,才能让整个图表显得更有主次的区分。02.选择合适的坐标上下限

选择合适的坐标下限

一般来讲,我们应该把我们的坐标下限设置为0。有人会问,这样的话我们的数据就会变得没有那么起伏变化了。那可能是因为你的数据本身就没有那么涨势喜人。但同样,其实很多事情可以反过来思考,之所以有人愿意不把坐标轴设定为0为起点,其实就是为了在视觉上让人形成对比强烈的感觉,从而突出业绩。这种方法的使用因人而异。比如在小米的发布会中,为了对比,小米把数据的下限起点设置为了,从而使小米的跑分数据看似跑赢了友商一倍还多,但其实小米的数据增长,只比友商高出了25%。再举个例子:这张条形图也是经福克斯新闻准许使用的。3月31日目标的值为7,,,比6,,高17.8%,然而第二个柱形几乎是第一个柱形长度的三倍。这也同时提醒我们要注意,在观看别人的图表时,仅仅观看柱状图的高低趋势往往不能得出正确结论,需要注意坐标轴起始位置有没有被人做过虚假处理。同样的,有些人为了汇报业绩,也会使每个刻度的跨度不一致,从而提高柱状图整体的对比度。这种情况也应该多留心观察,不要被表面的内容所迷惑。

选择合适的坐标上限

坐标轴中另一个需要注意的点即为坐标上限。上限界定的方式有两种,可根据需求自行判断。1.如果只是为了比较各个数据的数值,可以用数据的最大值作为坐标轴上限。2.如果是需要将数据与某个最大值比较,则用此最大值作为上限。03.刻度值虽然Y轴的刻度值标签通常放置在刻度线的最左边,但我们也可以把它们放置在其他的地方,比如刻度线的顶部。但此时一定要把握好亲密性原则,稍不注意就会引起观众的困惑,这也是我们经常会在看其他图表时遇到的问题,到底刻度值标记的是哪一条刻度线?刻度线和刻度值相辅相成,这会让图表看起来更加规范。刻度值放置在哪里无所谓好坏,只是需要根据不同的场合加以使用。

间隔均匀

在坐标轴上应该使用均匀的跨度0,5,10,15,20,而非不均匀的跨度0,3,5,16,50。这里即呼应上方“坐标轴下限”中的最后一点,有时图表制作人也会用不均匀的刻度来蒙骗我们对数据产生误解。不要使用非水平和竖直的文字标注,也不要使用转行有时坐标轴上的注释文字会很多,所以很多人为了妥协,在小空间内显示出所有的文字标注内容,而使用倾斜的文本,或者将文本转行处理。不要用过于复杂的设计形式,数据可视化的第一要义是简单易懂,所以在遇到标签文字过长时,可以采用以下方法进行解决。04.数据的处理与排序我们在每次制作前都对数据进行排序,而不是随机排布。这样我们可以在图表中为观众展示更多信息,即某个数据在总的数据库里面的序列。

大小排序

我们还是从一系列国家的数据开始。

目前的排布很随机,或者是按照字母表排序的。接下来我们要按照数值从大到小进行排列。我们随机挑选一组数据,比如玻利维亚(Bolivia),在上图中,我们只能得到玻利维亚的数据值,以及他大概在数据库中排在中游的位置,仅此而已。但是下图中,根据大小排列好的数据,我们不仅可以获得刚才的两个信息,同时还能马上知道玻利维亚在整个图表中的排名(第四名)。同时你还可以看到吉尔吉斯斯坦(Krygyzstan)和越南(Vietnam)居于榜首而美国(America)是倒数第一,这就是好的图表能给我们带来的“更多的信息”。我们再看一遍按照字母表排序的图表,你能轻易的输说出“冈比亚(Gambia)”排名第几吗?

刻意的序列

在发布会中我们常常见到,为了突出自己产品的强悍,往往要与友商的数据做对比,在这种情况下,我们的数据也不是随机排布的,我给这种数据排布方法起了个名字,叫“刻意的序列”。在魅族16th的发布会中,这张旗舰机重量对比的图表很有讲究,可以发现,除了索尼(最重的手机)以及魅族16th(最轻的手机)外,其余所有的手机都是按照降序排列。不看颜色对比,把g的索尼和g的魅族放置在一起进行讲解,以更加突出魅族的轻薄。那么这个图表的数据排序其实经过了三次处理。1.把重量从高到低排序。2.把重量最高的和最低的手机单独放置,并给予特殊颜色单独显示。3.把这两个数据放置在最后,再次突出对比,吸引观众注意。这就是我们学习数据可视化时非常需要注意的细节点,在数据可视化中,细节决定成败。05.关于图例的设计

数字需要四舍五入

我们有时为了保证图表的清晰整洁,并不能完全选择符合数据上限和下限的数字作为刻度,而是选择一些取整的数字。同样的,这不仅仅适用于图例中的数字,同样适用于坐标轴上下限的数字。

标记图例的边界比标记图例的范围更好

在需要用多种颜色做区分的图表中,有时可以通过标记图例边界而不是标记图例范围的方式,来提高观众的阅读效率。

水平或者垂直方向的图例

对于数字的刻度,水平图例往往比垂直图例更加容易阅读,因为这符合我们的阅读习惯。但是,对于有类别区分的图例来说,垂直图例往往效果更好,因为我们可以在图例的右边放置更长的文本(跟坐标轴的注释同样的道理)

删除内部边界

有时我们甚至可以更简约的表示图例,当你只想表达一个渐进的过程,24和55之间的差异并不重要,观众只需要知道后者比前者大即可。在这种情况下,我们可以尝试只标记出图例的最大值和最小值,而不必要标记出每个边界或者颜色,这样可以给观众减少不必要的信息负担。06.图表上的文字信息文字标注的作用,不是来填充空白的,而是用来强调相关信息或拓展额外的背景知识的。

引用消息来源

大多数情况下,我们制作的图表都不会将原数据附在旁边,因此最好在图表中引用你的数据来源。一般来说,引用规则是在左下角防止数据来源信息,往往采用特殊字体。引用消息来源,既可以方便你随时索引数据来源(就像我文章开头的每一个图表都标注出了他的原标题+索引网址),也可以增加数据的可信度。(有趣的事,人人往往不会
分享 转发
TOP
发新话题 回复该主题