統計検定の試験日が近づいてきました。
今回の記事も、統計検定2級でよく出題されるテーマを整理します。

本日は、「適合度の検定」です。

理論から計算された期待度数と、実際のデータの度数を比べ、
適合しているかどうかを検定する方法です。


統計量は、下記のように計算できます。

X = { (O1 - E1)^2 / E1 } + { (O2 - E2)^2 / E2 } + ・・・

Oは実際のデータの度数、Eは期待度数です。


実際の度数が期待度数からどれだけ離れているかを計算し、全部足したものが統計量ですね。
自由度は、カテゴリーの数から1を引いた数(k-1)です。

実際の問題を解くには、上記の式は覚えておかなければなりません。
1元配置分散分析よりは簡単だと思い、がんばって覚えます( -д-)ノ


さて、「適合度の検定」を覚えたら、「独立性の検定」もセットで覚えると便利です。
適合度の検定ではカテゴリーが1種類であったのに対し、
独立性の検定ではカテゴリーが2種類あることが違いです。

例えば、カテゴリーAが性別(男性・女性)。
カテゴリーBが年代(10代、20代、30代)。

カテゴリーの組み合わせは、2×3=6種類あります。
そのため、期待度数も6個、実際のデータの度数も6個あります。


統計量は、「適合度の検定」と同じように計算できます。

X = { (O1 - E1)^2 / E1 } + { (O2 - E2)^2 / E2 } + ・・・

Oは実際のデータの度数、Eは期待度数です。


「適合度の検定」と同じく、実際の度数が期待度数からどれだけ離れているかを計算し、全部足したものが統計量ですね。

自由度の計算だけが、注意が必要です。
「適合度の検定」の場合は、カテゴリーが1種類でしたので、カテゴリーの数から1を引いた数(k-1)でした。
しかし、「独立性の検定」の場合は、カテゴリーが2種類あるので、それぞれのカテゴリーの数から1を引いた数を掛け合わせます。(k-1)×(r-1)

上の、性別と年代の例でいうと、
(2-1)×(3-1)=2
となります。


「適合度の検定」と「独立性の検定」は同時に覚えたほうが効率的ですね( ´∀`)つ




スポンサーリンク