片側検定/両側検定の選択が恣意的な気がする件をRのt検定で確認

こんな例を考えます。

10人の元々のテストの平均点は50点でした。点数をあげる施策を行った後、再度テストをしてみると、

after <- c(44, 47, 48, 51, 54, 56, 59, 62, 63, 65)

という点数が得られました。施策は効果があったかどうかを、有意水準5%で検定しましょう。

【Aさんの検定】

Aさんは施策に懐疑的でした。場合によっては施策の悪影響が出て、点数が下がる可能性もあると考えていますので、両側検定を行います。

> t.test(after, mu=50,  alternative="two.sided")

        One Sample t-test

data:  after
t = 2.1198, df = 9, p-value = 0.06306
alternative hypothesis: true mean is not equal to 50
95 percent confidence interval:
 49.67088 60.12912
sample estimates:
mean of x
     54.9


p値が0.05よりも大きいので、帰無仮説は棄却できず、「施策は効果があるとは言えない」と結論付けました。


【Bさんの検定】

Bさんは施策の効果を確信していました。点数が下がることはありえないと考えていますので、片側検定を行います。

> t.test(after, mu=50,  alternative="greater")

        One Sample t-test

data:  after
t = 2.1198, df = 9, p-value = 0.03153
alternative hypothesis: true mean is greater than 50
95 percent confidence interval:
 50.66264      Inf
sample estimates:
mean of x
     54.9


p値が0.05よりも小さいので、帰無仮説は棄却でき、「施策は効果があると言える」と結論付けました。


う~ん、気持ち悪い。

何が気持ち悪いって、効果に懐疑的だと厳しめの検定になって、効果に確信があると甘めの検定になるという関係です。

Aさんが施策反対派、Bさんが施策推進派だとすると、両者の対立の溝は埋められそうにないですね。

学術的にはこのへんの曖昧さの課題とかってないんでしょうか。統計の専門家に聞いてみたい。

だって、良かれと思ってやったことが悪影響を及ぼす、なんてことはよくあることでしょ。だとすると、片側検定していいケースってあんまりないような気がするんですが、どうなんでしょうか。

コメント

このブログの人気の投稿

Rのグラフで軸の目盛りの刻み幅を変更する方法

Rで繰り返しを含む数列の生成(rep関数、seq関数)

reorderを使ってggplotの棒グラフの並び順を降順にする方法