01คำจำกัดความและที่มา
นิยาม
Mann-Whitney U Test (เรียกอีกชื่อว่า Wilcoxon Rank-Sum Test) เป็น
สถิติทดสอบแบบไม่ใช้พารามิเตอร์ (Non-parametric Test) ที่ใช้เปรียบเทียบ
การแจกแจงของประชากรสองกลุ่มอิสระ โดยอาศัยลำดับอันดับ (Rank)
แทนค่าดิบ ทำให้ไม่จำเป็นต้องสมมติว่าข้อมูลมีการแจกแจงแบบปกติ
Mann & Whitney (1947) | Wilcoxon (1945)
ประวัติ
Frank Wilcoxon เสนอ Rank-Sum Test ในปี ค.ศ. 1945 จากนั้น Henry B. Mann และ
Donald R. Whitney พัฒนาสูตร U statistic ในปี ค.ศ. 1947 ให้รองรับกลุ่มตัวอย่าง
ขนาดไม่เท่ากัน และพิสูจน์ความเทียบเท่ากันของสองแนวทาง
Hollander & Wolfe (1999, §4.1)
02เมื่อใดควรใช้ Mann-Whitney U Test
ใช้ได้เมื่อ
- ข้อมูลเป็น อิสระ ทั้งสองกลุ่ม
- ตัวแปรตามอยู่ในระดับอันดับขึ้นไป (Ordinal, Interval, Ratio)
- ข้อมูลไม่เป็นโค้งปกติ หรือ n น้อย
- มีค่าผิดปกติ (Outlier) ที่ไม่ต้องการให้กระทบผล
- ข้อมูลเป็นมาตรวัดลิเคิร์ต (Likert scale)
- ข้อมูลมีการแจกแจงแบบเบ้ (Skewed distribution)
ไม่ควรใช้เมื่อ
- ข้อมูลเป็นกลุ่มเดียวกัน หรือจับคู่ (ใช้ Wilcoxon Signed-Rank แทน)
- มีมากกว่า 2 กลุ่ม (ใช้ Kruskal-Wallis แทน)
- ตัวแปรตามเป็นระดับนามบัญญัติ (Nominal)
- ต้องการเปรียบเทียบค่าเฉลี่ยโดยตรง (ใช้ Independent t-test)
03สมมติฐานทางสถิติ
H₀ (Null Hypothesis)
การแจกแจงของประชากรทั้งสองกลุ่มไม่แตกต่างกัน
F₁(x) = F₂(x) สำหรับทุกค่า x
ถ้ารูปร่างการแจกแจงเหมือนกัน ≡ มัธยฐานไม่แตกต่างกัน
H₁ (Alternative Hypothesis)
การแจกแจงของประชากรทั้งสองกลุ่มแตกต่างกัน
F₁(x) ≠ F₂(x) สำหรับบางค่า x
two-tailed | α = .05 (ค่านิยม)
05ขั้นตอนการคำนวณและการจัดอันดับ
1
รวมข้อมูลทั้งสองกลุ่ม
นำข้อมูลทั้งหมด N = n₁ + n₂ มารวมกัน แล้วเรียงลำดับจากน้อยไปมาก
2
กำหนดอันดับ (Rank)
ให้อันดับ 1 แก่ค่าน้อยที่สุด — หากมีค่าซ้ำ (Tie) ให้ใช้ Average Rank (ค่าเฉลี่ยของอันดับในกลุ่มซ้ำ) ตามมาตรฐาน Hollander & Wolfe (1999)
3
คำนวณผลรวม Rank (R₁, R₂)
หาผลรวมอันดับของแต่ละกลุ่ม ตรวจสอบ: R₁ + R₂ = N(N+1)/2
4
คำนวณ U₁, U₂ และ Z
นำค่า U_min แปลงเป็น Z-score เพื่อใช้ตารางการแจกแจงปกติ (แนะนำเมื่อ n ≥ 10)
5
แปลผลและรายงาน
เปรียบเทียบ p-value กับระดับนัยสำคัญ α = .05 รายงานตามรูปแบบ APA 7th ได้แก่ U, Z, p, r
06ข้อตกลงเบื้องต้น (Assumptions)
Independence
การสังเกตทุกตัวต้องเป็นอิสระต่อกัน — ข้อมูลในกลุ่ม 1 ต้องไม่เกี่ยวข้องกับกลุ่ม 2
Ordinal Scale ขึ้นไป
ตัวแปรต้องสามารถจัดอันดับได้ — เหมาะกับระดับอันดับ (Ordinal), ช่วง (Interval) และสัดส่วน (Ratio)
Similar Distribution Shape
หากรูปร่างการแจกแจงทั้งสองกลุ่มคล้ายกัน — แปลผลได้ว่า "มัธยฐานต่างกัน" มิฉะนั้นแปลว่า "การแจกแจงต่างกัน"
Continuous Variable (แนะนำ)
แม้จะใช้กับข้อมูลอันดับได้ แต่ตัวแปรต่อเนื่องจะลด Ties และเพิ่มกำลังสถิติ (Statistical Power)
07เปรียบเทียบกับสถิติอื่น
| สถิติ |
จำนวนกลุ่ม |
ลักษณะข้อมูล |
ข้อตกลงเบื้องต้น |
กำลังสถิติ |
| Mann-Whitney U Test ใช้งานอยู่ |
2 กลุ่ม (อิสระ) |
Ordinal ขึ้นไป |
ไม่ต้องการ Normality |
~95% ของ t-test |
| Independent Samples t-test |
2 กลุ่ม (อิสระ) |
Interval / Ratio |
Normality + Homogeneity |
สูงสุด |
| Wilcoxon Signed-Rank Test |
2 กลุ่ม (จับคู่) |
Ordinal ขึ้นไป |
ไม่ต้องการ Normality |
~95% ของ paired t |
| Kruskal-Wallis Test |
≥ 3 กลุ่ม |
Ordinal ขึ้นไป |
ไม่ต้องการ Normality |
Moderate |
| One-Way ANOVA |
≥ 3 กลุ่ม |
Interval / Ratio |
Normality + Homogeneity |
สูง |
รูปแบบการรายงานผล APA 7th Edition
A Mann-Whitney U test was conducted to compare [ตัวแปรตาม] between [กลุ่ม 1]
and [กลุ่ม 2]. The results indicated a [significant / non-significant] difference,
U = [ค่า U], Z = [ค่า Z], p [< .001 / = .xxx],
r = [ค่า r] (effect size = [Small/Medium/Large]).
หมายเหตุ: ระบบจะสร้างประโยครายงานอัตโนมัติสำหรับบทที่ 4 พร้อมตาราง APA ในขั้นตอนที่ 4
เอกสารอ้างอิง
- Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum.
- Fritz, C. O., Morris, P. E., & Richler, J. J. (2012). Effect size estimates. Journal of Experimental Psychology: General, 141(1), 2–18.
- Hollander, M., & Wolfe, D. A. (1999). Nonparametric statistical methods (2nd ed.). Wiley.
- Mann, H. B., & Whitney, D. R. (1947). On a test of whether one of two random variables is stochastically larger. The Annals of Mathematical Statistics, 18(1), 50–60.
- Wilcoxon, F. (1945). Individual comparisons by ranking methods. Biometrics Bulletin, 1(6), 80–83.