Question 1

適合度検定と独立性検定はどう使い分けますか?

Accepted Answer

観測度数のあるカテゴリ変数 1 つに対して、既知または予測された分布と比較したいときは適合度検定。行と列に置いた 2 つのカテゴリ変数が連動しているか知りたいときは独立性検定です。

Question 2

p 値で足りないものを Cramer's V は何を補いますか?

Accepted Answer

p 値は関連が統計的に有意かを示し、Cramer's V は 0〜1 でその関連の強さを示します。大標本では実用上意味のないほど弱い関連にも極小の p 値が出てしまいます。V が 0.1 未満は無視できる、0.1〜0.3 小、0.3〜0.5 中、0.5 超で大です。

Question 3

期待度数が 5 未満のセルがあっても結果は信頼できますか?

Accepted Answer

期待度数が 5 を下回るとカイ二乗近似は不安定になります。教科書では「セルの 80% 以上が期待度数 5 超、かつどのセルも 1 未満ではないこと」が一般的な条件です。違反するならスパースなカテゴリを統合するか、フィッシャー正確検定に切り替えてください。

Question 4

有意水準はどれを選べばよいですか?

Accepted Answer

社会科学やマーケティングでは 0.05 が標準。偽陽性のコストが大きい(医療・規制)場面では 0.01。0.10 は探索的なパイロットで、真の効果を見逃すより追加調査を優先したいときに使います。

Question 5

なぜ自由度は (行-1) × (列-1) になりますか?

Accepted Answer

クロス集計表では行合計と列合計が決まると、(r-1)(c-1) 個のセルしか自由に動けず、残りは合計から決まります。この自由なパラメータの数がカイ二乗分布を支える自由度です。

カイ二乗検定計算ツール

カイ二乗検定計算ツールとは？

#	1	2	3	4
観測値
期待値

#	1	2	3	4
観測値
期待値