カイ二乗検定計算ツールとは?
カイ二乗検定計算ツールは、適合度検定と独立性検定を完全な統計出力付きで実行できるツールです。観測度数と期待度数を入力すると、カイ二乗統計量、自由度、p値、クラメールのV効果量が算出されます。結果を示すカイ二乗分布曲線のグラフも表示されます。
ツールは同じ画面で 2 種類の検定を実行します。1 つのカテゴリ変数に予想頻度がある場合は適合度検定、2 変数のクロス集計表がある場合は独立性検定です。出力にはカイ二乗統計量、自由度、p 値、α=0.01/0.05/0.10 での臨界値、独立性検定での Cramer's V 効果量が含まれます。分布曲線は統計量を臨界域と並べて描くので、棄却域に入っているか一目でわかります。
使い方
- 検定タイプを選択します:適合度検定(1変数と期待分布の比較)または独立性検定(分割表での2つのカテゴリ変数の分析)。
- 表のセルに観測度数を入力します。適合度検定では期待度数も入力します。独立性検定では期待値が自動計算されます。
- 「計算」をクリックすると、カイ二乗統計量、自由度、p値、および選択した有意水準(0.01、0.05、0.10)で帰無仮説を棄却するかどうかが表示されます。
使用するタイミング
- サイコロや無作為標本が一様分布に従っているかを確認する。
- 2 つのカテゴリ変数(例:性別と商品選好)に関連があるか検定する。
- t 検定が使えない 3 つ以上の A/B テスト案を比較する。
結果
マーケターが4種類の広告バリアントの効果に差があるか検定。観測クリック数:A=142、B=186、C=121、D=151。期待値:各150。カイ二乗検定の結果X²=14.2、df=3、p=0.0026で有意差あり。バリアントBが最も効果的でした。
よくある質問
- 適合度検定と独立性検定はどう使い分けますか?
- 観測度数のあるカテゴリ変数 1 つに対して、既知または予測された分布と比較したいときは適合度検定。行と列に置いた 2 つのカテゴリ変数が連動しているか知りたいときは独立性検定です。
- p 値で足りないものを Cramer's V は何を補いますか?
- p 値は関連が統計的に有意かを示し、Cramer's V は 0〜1 でその関連の強さを示します。大標本では実用上意味のないほど弱い関連にも極小の p 値が出てしまいます。V が 0.1 未満は無視できる、0.1〜0.3 小、0.3〜0.5 中、0.5 超で大です。
- 期待度数が 5 未満のセルがあっても結果は信頼できますか?
- 期待度数が 5 を下回るとカイ二乗近似は不安定になります。教科書では「セルの 80% 以上が期待度数 5 超、かつどのセルも 1 未満ではないこと」が一般的な条件です。違反するならスパースなカテゴリを統合するか、フィッシャー正確検定に切り替えてください。
- 有意水準はどれを選べばよいですか?
- 社会科学やマーケティングでは 0.05 が標準。偽陽性のコストが大きい(医療・規制)場面では 0.01。0.10 は探索的なパイロットで、真の効果を見逃すより追加調査を優先したいときに使います。
- なぜ自由度は (行-1) × (列-1) になりますか?
- クロス集計表では行合計と列合計が決まると、(r-1)(c-1) 個のセルしか自由に動けず、残りは合計から決まります。この自由なパラメータの数がカイ二乗分布を支える自由度です。