データが正規分布になっているかどうかは、シャピロ・ウィルク検定で簡単に検証できる。
> x <- rnorm(20, mean=5, sd=2) > x [1] 7.3414508 3.4414882 5.4764692 4.7784505 8.0017854 2.8685248 5.2045962 [8] 1.6700683 7.0892245 4.1862463 4.7856539 5.6737798 2.9965587 7.1440601 [15] 0.9903376 6.0238779 6.1670122 7.1271021 5.8264607 6.3503228 > shapiro.test(x) Shapiro-Wilk normality test data: x W = 0.9471, p-value = 0.3251
この場合、p値が大きいのでxは正規分布に従うという帰無仮説は棄却されない。rnormで生成しているので当たり前だけど。