箱形图
(
英文
:Box plot),又称为
盒须图
、
盒式图
、
盒状图
或
箱线图
,是一种用作显示一组数据分散情况资料的
统计图
。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理。不过作法相对较繁琐。
箱形图于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的
最大值
、
最小值
、
中位数
、及上下四分位数。
箱形图提供了一种只用5个点对
数据集
做简单总结的方式。这5个点包括中点、Q
1
、Q
3
、分部状态的高位和低位。箱形图很形象的分为中心、延伸以及分布状态的全部范围。
箱形图中最重要的是对相关统计点的计算,相关统计点都可以通过
百分位
计算方法进行实现。
箱形图的绘制步骤:
[2]
1、画
数轴
,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的
全距
稍长。
2、画一个矩形盒,两端边的位置分别对应数据批的上下
四分位数
(Q
3
和Q
1
)。在矩形盒内部
中位数
(X
m
)位置画一条线段为
中位线
。
3、在Q
3
+1.5IQR和Q
1
-1.5IQR处画两条与中位线一样的线段,这两条线段为
异常值
截断点,称其为内限;在Q
3
+3IQR和Q
1
-3IQR处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(mild outliers),在外限以外的为极端的异常值(extreme outliers)。四分位距IQR=Q
3
-Q
1
。.
4、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间。
5、用“〇”标出温和的异常值,用“*”标出极端的异常值。相同值的数据点并列标出在同一数据线位置上,不同值的数据点标在不同数据线位置上。至此一批数据的箱形图便绘出了。
统计软件
绘制的箱形图一般没有标出内限和外限。
[1] 贾俊平、何晓群、金勇.统计学(第四版).中国人民大学出版社,2009年:66-67
[2] 林丽. 两组独立数据差异性统计检验方法及应用的研究[D]. 上海交通大学, 2007.
[3] 澍, 数理统计. 应用数理统计方法[M]. 中国环境科学出版社, 1994.