安斯库姆四重奏

安斯库姆四重奏(Anscombe’s quartet)是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了 11 个 ($x$,$y$) 点。这四组数据由统计学家弗朗西斯・安斯库姆(Francis Anscombe)于 1973 年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大。
这四组数据的共同统计特性如下:

性质 数值
x 的平均数 9
x 的方差 11
y 的平均数 7.50(精确到小数点后两位)
y 的方差 4.122 或 4.127(精确到小数点后三位)
x 与 y 之间的相关系数 0.816(精确到小数点后三位)
线性回归线 $y=3.00+0.500x$(分别精确到小数点后两位和三位)

参见:Wiki: 安斯库姆四重奏