安斯库姆四重奏
安斯库姆四重奏(Anscombe’s quartet)是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了 11 个 ($x$,$y$) 点。这四组数据由统计学家弗朗西斯・安斯库姆(Francis Anscombe)于 1973 年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大。
这四组数据的共同统计特性如下:
| 性质 | 数值 |
|---|---|
| x 的平均数 | 9 |
| x 的方差 | 11 |
| y 的平均数 | 7.50(精确到小数点后两位) |
| y 的方差 | 4.122 或 4.127(精确到小数点后三位) |
| x 与 y 之间的相关系数 | 0.816(精确到小数点后三位) |
| 线性回归线 | $y=3.00+0.500x$(分别精确到小数点后两位和三位) |