Mann–Whitney U検定とは?¶
Mann–Whitney U検定は、2つの独立したグループ間のデータの分布が異なるかどうかを判断するための統計的手法です。
これは、母集団が正規分布に従わない場合にも使えるノンパラメトリック検定の一つです。
特に、順序データや中央値の比較に適しており、例えば新しい薬と従来の薬の効果を比較する場合などに利用されます。
では、具体例を通じてMann–Whitney U検定の使い方を説明しましょう。
具体例:新しいダイエット法の効果比較¶
例の設定¶
新しいダイエット法の効果を検証するために、2つのグループに分けた被験者の体重減少量を比較したいとします。
- グループA:従来のダイエット法を行った10人
- グループB:新しいダイエット法を行った10人
それぞれのグループの体重減少量(kg)は以下の通りです。
- グループA(従来法):1.2, 0.8, 1.0, 1.5, 0.9, 1.1, 1.3, 1.0, 1.4, 1.2
- グループB(新しい法):1.5, 1.7, 2.0, 1.6, 1.8, 1.9, 2.1, 1.5, 1.4, 1.6
目的¶
このデータを基に、新しいダイエット法が従来の方法と比べて体重減少量に統計的に有意な差があるかどうかを調べます。
Mann–Whitney U検定のステップ¶
- データのランク付け
Mann–Whitney U検定では、全データを昇順に並べて、それぞれのデータポイントに順位(ランク)を割り当てます。例の場合、グループAとグループBのすべての体重減少量を一緒にして昇順に並べます。
昇順に並べると、次のようになります。
0.8, 0.9, 1.0, 1.0, 1.1, 1.2, 1.2, 1.3, 1.4, 1.4, 1.5, 1.5, 1.5, 1.6, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1
このリストで、同じ数値があった場合は、平均ランクを使用します。例えば、体重減少量1.0は2つあるので、そのランクは平均を取って「3位」となります。
結果的に、各データポイントに対してランクが次のように割り当てられます。
- グループAのランク:5.5, 2, 3, 9, 3.5, 4, 7, 5.5, 8, 6
- グループBのランク:10.5, 14, 18, 12.5, 16, 17, 19, 10.5, 8, 12.5
- 各グループのランクの合計を計算
グループAとグループBのランクの合計をそれぞれ求めます。- グループAのランク合計:5.5 + 2 + 3 + 9 + 3.5 + 4 + 7 + 5.5 + 8 + 6 = 53.5
- グループBのランク合計:10.5 + 14 + 18 + 12.5 + 16 + 17 + 19 + 10.5 + 8 + 12.5 = 138.5
- U値の計算
各グループのU値を計算します。Uの計算式は次の通りです。- グループAのU値:U₁ = n₁n₂ + (n₁(n₁+1))/2 – R₁
- グループBのU値:U₂ = n₁n₂ + (n₂(n₂+1))/2 – R₂
ここで、n₁とn₂はそれぞれのグループのサンプルサイズ、R₁とR₂はランク合計です。
- グループAのU値:U₁ = 10×10 + (10×11)/2 – 53.5 = 100 + 55 – 53.5 = 101.5
- グループBのU値:U₂ = 10×10 + (10×11)/2 – 138.5 = 100 + 55 – 138.5 = 16.5
U値は小さい方を選びます。つまり、この例ではU₂ = 16.5が選ばれます。
- 有意水準と臨界値の比較
次に、U値を標準的な臨界値と比較します。例えば、有意水準を0.05(5%)に設定し、Uの臨界値を表から確認します。
この例では、n₁ = n₂ = 10のとき、5%の臨界値は23です。これより、計算されたU値16.5は23より小さいため、有意差があると判断されます。
結果の解釈¶
このMann–Whitney U検定の結果、新しいダイエット法による体重減少量は、従来の方法と比較して統計的に有意に高いと結論づけることができます。
つまり、新しいダイエット法はより効果的である可能性が高いと示唆されます。
まとめ¶
Mann–Whitney U検定は、2つのグループのデータ分布に差があるかどうかを調べるノンパラメトリック検定です。
母集団が正規分布していなくても利用できるため、特にデータが偏っている場合や順序データを扱うときに非常に役立ちます。
コメント