Kruskal-Wallis検定とは?¶
Kruskal-Wallis検定は、3つ以上の独立したグループ間のデータの分布が異なるかどうかを調べるためのノンパラメトリック検定です。
これは、データが正規分布していない場合や分散が等しくない場合にも使用でき、グループ間の中央値を比較する際に有効です。
Kruskal-Wallis検定は、2つのグループを比較するMann–Whitney U検定の拡張版ともいえます。
たとえば、3つ以上の薬の効果を比較する際や異なる教育方法の効果を調べる際などに用いられます。
具体例:3つのダイエット法の効果比較¶
例の設定¶
ある研究で、3つの異なるダイエット法を試した被験者の体重減少量を比較するとします。
- グループA:従来のダイエット法を行った10人
- グループB:新しいダイエット法を行った10人
- グループC:さらに別の新しいダイエット法を行った10人
それぞれのグループの体重減少量(kg)は以下の通りです。
- グループA(従来法):1.2, 0.8, 1.0, 1.5, 0.9, 1.1, 1.3, 1.0, 1.4, 1.2
- グループB(新しい法1):1.5, 1.7, 2.0, 1.6, 1.8, 1.9, 2.1, 1.5, 1.4, 1.6
- グループC(新しい法2):0.5, 0.6, 0.9, 0.7, 0.8, 1.0, 0.7, 0.9, 0.8, 0.6
目的¶
このデータを基に、3つのダイエット法の体重減少量に有意な差があるかどうかを調べます。
Kruskal-Wallis検定のステップ¶
- データのランク付け
まず、全グループのデータを一緒にして昇順に並べ、各データに順位(ランク)を割り当てます。同じ値がある場合には、平均ランクを使用します。昇順に並べると次のようになります。0.5, 0.6, 0.6, 0.7, 0.7, 0.8, 0.8, 0.8, 0.9, 0.9, 0.9, 1.0, 1.0, 1.0, 1.1, 1.2, 1.2, 1.3, 1.4, 1.4, 1.5, 1.5, 1.5, 1.6, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1
次に、各データポイントにランクを割り当てます。
- グループAのランク:16.5, 6, 12.5, 19, 9.5, 14, 18, 12.5, 20.5, 16.5
- グループBのランク:20.5, 26, 29, 23.5, 27, 28, 30, 20.5, 18, 23.5
- グループCのランク:1, 3.5, 9.5, 5, 6, 12.5, 5, 9.5, 6, 3.5
- 各グループのランク合計を計算
各グループのランク合計(R)を求めます。- グループAのランク合計:16.5 + 6 + 12.5 + 19 + 9.5 + 14 + 18 + 12.5 + 20.5 + 16.5 = 144
- グループBのランク合計:20.5 + 26 + 29 + 23.5 + 27 + 28 + 30 + 20.5 + 18 + 23.5 = 245
- グループCのランク合計:1 + 3.5 + 9.5 + 5 + 6 + 12.5 + 5 + 9.5 + 6 + 3.5 = 61
- H統計量の計算
H統計量は次の公式で計算されます。$$
H = \frac{12}{N(N+1)} \sum \frac{R_i^2}{n_i} – 3(N+1)
$$ここで、Nは全データポイントの総数(この例では30)、n₁, n₂, n₃は各グループのサンプルサイズ(すべて10)、R₁, R₂, R₃は各グループのランク合計です。
計算を進めます。
$$
H = \frac{12}{30(31)} \left( \frac{144^2}{10} + \frac{245^2}{10} + \frac{61^2}{10} \right) – 3(31)
$$$$
H = \frac{12}{930} \left( 20736 + 60025 + 3721 \right) – 93
$$$$
H = \frac{12}{930} \times 84482 – 93
$$$$
H ≈ 1089.9 / 930 – 93 = 1.72
$$ - 有意水準と臨界値の比較
H統計量はカイ二乗分布に従います。自由度はグループ数(k)-1なので、この場合は2です。
通常、有意水準を0.05(5%)とした場合のカイ二乗分布の臨界値は約5.99です。計算されたH値が1.72であり、これは臨界値5.99よりも小さいため、3つのグループ間に有意な差はないと結論づけられます。
結果の解釈¶
このKruskal-Wallis検定の結果、3つのダイエット法の体重減少量に統計的に有意な差は見られないことが示されました。
つまり、どのダイエット法も同程度の効果を持つ可能性があると考えられます。
まとめ¶
Kruskal-Wallis検定は、3つ以上のグループ間のデータ分布の差を調べるための強力な手法で、データが正規分布に従わない場合や、分散が等しくない場合にも利用できるのが特徴です。
グループ間に有意差があるかを確認したいが、データが厳密に正規分布していない場合には、非常に有用な検定です。
コメント