E.Tufte说好的数据表现关乎实质,统计和设计。
Tufte的The Visual Display of Quantitative Information是数据视觉化领域的必读之一。以下便是这本书中(我认为)的一些要点。
1.图表的诚实性
Tufte举出的两个违背诚实的例子在实际操作中比比皆是,有的甚至还被误以为成好的设计。
第一个例子是通过操纵坐标轴来操纵人们的视觉印象。比如关于全球变暖,英国每日邮报(The Daily Mail UK)2012年1月的一篇文章《让我们忘记全球变暖吧》有这样一幅图
但是美国杂志Mother Jones给了我们一个更完整的事实。所以数字即使是客观的,印象是可以昧著良心操纵的。
第二个例子是利用视觉特别是3D效果造成夸张的印象。比如美国时代周刊79年时的一幅关于油价飙升的图。从价格牌看,79年的价格是73年的6倍左右,但从桶的体积来看79年至少是73年的16倍。采用的3D视觉效果更使对倍数的判断更不靠谱。不过在这些吐槽之前,更让人困惑的是为什么作者要用桶的体积增大代表油价的上升呢?如果不仔细看图上的小字,会以为是价格便宜了。我随意多想一下就产生了多种解读,对于数据视觉化来说,这就是一个失败的例子了…所以不要轻易玩视觉玩3D
这里引出一个概念叫谎言因子,计算方法是用图像中表现出来的效果大小除以实际数据的效果大小。这样以上油价的例子中,让我们假设作者的本意想用油桶体积增大代表价格上升,那么这幅设计中的谎言因子至少是16/6~2.5
到这里小结一下,Tufte给出了三点建议来确保图像的诚实性
第一,清晰,详细和完整的文字标示能防止设计上的扭曲和模糊 第二,数字的视觉度量应该和数字本身成比例 第三,设计重点体现的是数字的变化,而不是设计的变化
2.其他原则
除了诚实性之外,Tufte也指出了图表设计中其他的一些原则。
(1) 数字-墨水比例最大化
数字墨水比例 = 用在表现数字变化上的笔墨/所有使用笔墨
比如使用3D效果的话,就会在表现立体和阴影时浪费一些笔墨。
(2) 避免图表垃圾,增加数字密度
数字密度 = 数据项目的数量/图表面积
(3) 将信息分层
常见的例子是将表格的奇数行和偶数行用不同的颜色渲染。
Tags: DataVis