仮説検定の簡単な例

シェアする

統計的仮説検定は,そんなに難しい話ではないのですが

中途半端な理解だとどうにも混乱する原因となるようで,先を焦るあまり説明をさらっとしか読んでなかった私は,どうも理解できない部分がいくつか出てしまった.

今でも完全に解決してないけど,何問か解いていくうちにわかってくるかなと思ってます.

そんなわけで,今回は統計的仮説検定についてわかったこと.

まず最初に仮説を立てる.そして,その仮説に沿って平均と標準偏差の値を用いて,実際の推定値について

「こんなの滅多に出ないよね」

という値だったら仮説を棄却,

「十分ありえるわ」

という値だったら仮説を棄却しない.要はそういう考え方.

実際に例で示してみたい.

問題 (佐藤の確率統計 p.243 例,山梨医大)
1枚の硬貨を800回投げたら,表が430回出た,有意水準5%で考えるとき,この硬貨は正しく作られているといえるか.また,危険率1%ではどうか.ただし,正しい硬貨を投げたとき,表の出る確率は0.5とする.

先ずは仮説をたてる.

この硬貨が「正しく作られたもの」という仮説を立てる.

正しく作られたものは表の出る確率が0.5であるから,理論的には\(800×0.5=400\)回表が出るはずだ.

でも,あくまで確率現象なので,ぴったり400回出るとは限らない.405回のときもあれば392回の場合もあるだろう.では,どのくらいバラつくのかという「バラつきの平均」が標準偏差であるから,それを求めてみる.

表の出る確率が\(p=0.5\)であるから,裏の出る確率も\(1-p = 0.5\).800回硬貨を投げて,そのうち表の出る回数\(X\)は\(n=800, p=0.5\)の二項分布にしたがうので\(P(X)=B(800,0.5)\)となる.二項分布の平均\(m\)と標準偏差\(\sigma \)は,

\[
m = np
\] \[
\sigma = \sqrt{np(1-p)}
\]

であるから,\(m=800\times 0.5=400\),\(\sigma = \sqrt{800\times 0.5\times 0.5} = 14.14\).

つまり,ばらつきの平均は14.14なので,\(400\pm 14.14\)くらいは普通に起こりうるという話になる.

ただ,「滅多に起こらない」と判断するには,どの程度のばらつきまで許容するのかということだ.

有意水準5%の場合

ここで有意水準5%という考え方で決める.つまり,確率0.05以下という非常に稀な場合を滅多に起こらないと判断する.

\(n\)が十分大きいと二項分布は正規分布で近似できるので,正規分布表をみる.正負で対称なので,正の場合(右半分)だけを考える.右半分なので,確率が0.025(=0.05/2)になるちょうど境目となる横軸の値は1.96になる.

ただし,これは標準偏差が1の場合の正規分布表なので,標準偏差が\(\sigma \)の場合は,\(1.96\sigma \)で考えないといけない.

そうすると,右半面だけで考えると,確率が0.025以下の「ほとんど起こり得ない」と考えられるちょうど境目となる値は,\(1.96\times \sigma = 1.96\times 14.14 = 27.7\).

左右対称なので,\(400\pm 27.7\)の範囲であれば,たとえ正しい硬貨であっても十分起こり得る値と判断できる.逆にこの範囲を超えた場合は「滅多に起こらない」と判断できる.

ここで問題に戻ると,表が出る回数が430回と書いてあるので,この範囲を超えている.

したがって,仮説は棄却されて「有意水準5%では,正しく作られていない」と判断できる.

有意水準1%の場合

同様に正規分布表を見る.確率が0.005以下となる境目は,2.58なので,\(2.58\sigma =36.48\)が境目となる値.

すなわち,\(400\pm 36.48\)の範囲であれば,正しい硬貨であっても起こりうる値と判断できる.

問題では,430回表が出たとのことでこれは範囲内である.

そのため,仮説は棄却されず「有意水準1%では,正しく作られている」と判断できる.

とまぁ,考え方としては難しくないけど

なぜか少し苦手なんですよねぇ.もっと基礎からきちんと勉強しないとダメなのかな.