
2.5 其他常用的统计图
统计能化繁为简,帮助你让一堆堆令人困惑的数据发挥作用。当你发现数据的真相后,接下来就需要借助可视化的方法表现出来,使之公之于众。
1.饼图
饼图的作用是将数据划分为互有明显区别的几个组、类或者几个系列。饼图为圆形,被分割为几个扇形块,每一个块代表一个组(类)。扇形块的大小表示这类数据占总体的比例。扇形块越大,该组(类)的相对频数越大。如果把每个扇形块的频数加起来,结果应为100%(见图2-4)。

图2-4 各种游戏销量
饼图什么时候用呢?要对基本比例进行比较的时候,饼图有用。通过与其他组进行比较,通常很容易一眼看出哪个组具有较高频数。当然,所有扇形块大小相似时,饼图用处不大,因为这时很难根据扇形块尺寸大小的微小差别进行判别。
2.条形图和柱形图
表中各个组的比例相差无几,很难一眼看出哪一类玩家的满意度最高。体现这类数据更好的办法是使用条形图。条形图能对相对大小进行比较,反映数据的差异,而且条形图还有一个优点:更精确。对于各个序列的大小大致相同的情况,条形图是理想的图形。条形图可以是垂直的(也称柱行图),也可以是水平的。条形图中的每一个长方形代表一个特定类,长方形的长度代表某种数值。长方形越长,数值越大。所有长方形的宽度都相等,这样更容易进行比较。
条形图适用于二维数据集(每个数据点包括两个值X和Y),但只有一个维度需要比较,数据没有必然的连续性。当然,条形图只适合中小规模的数据集。图2-5为七夕出游人数分布的条形图。

图2-5 七夕出游人数分布
3.XY散点图
散点图适用于两维数据需要比较的情况,展示成对的数和它们所代表的趋势之间的关系,类似XY轴,判断两个变量之间是否存在某种关联。另外,散点图可以看出极值的分布情况。对于每一数对,一个数被绘制在X轴上,而另一个被绘制在Y轴上。过两点作轴垂线,相交处在图表上有一个标记。当大量的这种数对被绘制后,出现一个图形(见图2-6)。散点图的重要作用是可以用来绘制函数曲线,从简单的三角函数、指数函数、对数函数到更复杂的混合型函数,都可以利用它快速准确地绘制出曲线,所以在教学、科学计算中会经常用到。

图2-6 正态分布密度函数曲线
4.折线图
折线图适合二维的多数据集合,以及多组二维数据的比较。其一般用来表示趋势的变化,横轴一般为日期(见图2-7)。

图2-7 公众号每日买注数
5.雷达图
雷达图适用于多维数据(四维)。数据点一般在6个左右,太多则辨别起来有困难。雷达图图主要用来了解各项数据指标的变动情形及其好坏趋势,很容易做出可视的对比(见图2-8)。

图2-8 某员工工作胜任力调查
6.面积图
面积图强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。如图2-9就是一个购物平台访客设备分布的面积图。

图2-9 购物平台访客设备分布
7.股价图
股价图是具有三个数据序列的折线图,被用来显示一段给定的时间内一种股标的最高价、最低价和收盘价。股价图多用于金融、商贸等行业,用来描述商品价格、货币兑换率和温度、压力测量等,图2-10即为4月1日至7日的股价图。

图2-10 股价图
8.双轴图
双轴图指的是图表有两个Y坐标轴,每个Y轴有不同的刻度。双轴图可以是柱状图+折线图的结合,属于不同图表的组合使用。双轴图的适用情况很多,比如数量级相差很大的情况、数据同环比分析对比等情况。双轴图能够直观得实现将多组数据统计在一张图表中。如图2-11就是用于描述2018年5月1日至8日发布发送短信的唤醒效果的双轴图。

图2-11 过去一周发布发送短信唤醒效果
步入大数据时代,从数据中获取更多的信息,通过数据反映出更多的问题,是设计数据报表的首要任务,如何展现数据变得尤为重要。