1
ตั้งค่า
2
ข้อมูล
3
ตรวจสอบ
4
ผลลัพธ์
ขั้นตอนที่ 1 : ตั้งค่าพื้นฐาน
ต้องมีอย่างน้อย 3 คู่ ขึ้นไปสูงสุด 1,000 คู่
คำแนะนำในการตั้งค่าพื้นฐาน
ป้อนชื่อสำหรับการเปรียบเทียบระหว่างสองกลุ่มคู่สัมพันธ์ เช่น "คะแนนก่อนเรียน" และ "คะแนนหลังเรียน" หรือ "เวลาที่ 1" และ "เวลาที่ 2"
รีเซ็ต
คำอธิบายวิชาการและทฤษฎี Wilcoxon Signed-Rank Test
บทนำและนิยาม

Wilcoxon Signed-Rank Test (การทดสอบสัญลักษณ์-อันดับของวิลคอกสัน) เป็นการทดสอบสถิติแบบไม่ใช้พารามิเตอร์ (Non-parametric Test) ที่ใช้สำหรับเปรียบเทียบค่ากลางของข้อมูลสองกลุ่มที่มีความสัมพันธ์กัน (Paired Data) หรือหนึ่งกลุ่มเทียบกับค่ากลางที่กำหนด (One-sample test) โดยไม่ต้องสมมติว่าข้อมูลมีการแจกแจงแบบปกติ (Normal Distribution) ซึ่งแตกต่างจากการทดสอบ Paired t-test ที่ต้องถือว่าข้อมูลมีการแจกแจงแบบปกติ

เมื่อใดควรใช้ Wilcoxon Signed-Rank Test

ใช้ได้เมื่อ

  • ข้อมูลเป็นคู่สัมพันธ์ (Paired Data) เช่น วัดคะแนนก่อนเรียน-คะแนนหลังเรียน จากคนเดียวกัน
  • ข้อมูลมีมาตราวัดแบบลำดับที่ (Ordinal Scale) ขึ้นไป เช่น ช่วงน้อย-ปานกลาง-มาก (Likert Scale) หรือข้อมูลอัตราส่วน
  • ข้อมูลไม่มีการแจกแจงแบบปกติ (Non-normal Distribution) ตามการทดสอบ Shapiro-Wilk หรือ Kolmogorov-Smirnov
  • มีค่าผิดปกติ (Outliers) หรือข้อมูลมีความเบ้ (Skewed)
  • ขนาดตัวอย่างมีขนาดเล็ก (n < 30) และไม่สามารถถือว่าข้อมูลมีการแจกแจงแบบปกติ

ไม่ใช้เมื่อ

  • ข้อมูลอิสระต่อกัน (Independent Data) ควรใช้ Mann-Whitney U Test แทน
  • ตัวอย่างมากกว่าสองกลุ่ม ควรใช้ Friedman Test แทน
  • ต้องการทราบปริมาณความแตกต่างที่แน่นอน (ควรใช้ Paired t-test หากสมมติฐานเป็นจริง)
สมมติฐานและข้อตกลงเบื้องต้น
  1. ข้อมูลเป็นคู่สัมพันธ์ : การสังเกตในสองกลุ่มต้องมีความเกี่ยวข้องกัน เช่น ข้อมูลมาจากการวัดซ้ำครั้งเดียวกัน
  2. ตัวแปรตามต้องต่อเนื่อง : ความแตกต่างของตัวแปรต้องมีมาตราวัดอย่างน้อยลำดับที่ขึ้นไป
  3. ความแตกต่างมีการแจกแจงสมมาตร : การแจกแจงของความแตกต่าง (D = X₂ - X₁) ต้องมีความสมมาตรรอบศูนย์ (สมมติฐานนี้ยังอ่อนแอกว่าการแจกแจงปกติ)
  4. ไม่ต้องถือว่าเป็นการแจกแจงปกติ : นี่คือข้อดีหลักของการทดสอบไม่ใช้พารามิเตอร์นี้
ข้อดีเมื่อเทียบกับ Paired t-test
  • ไม่ต้องสมมติการแจกแจงปกติ : เหมาะสำหรับข้อมูลที่มีการแจกแจงไม่ปกติ
  • ทำงานได้ดีกับค่าผิดปกติ : ใช้อันดับ (ranks) แทนค่าจริง ทำให้ค่าผิดปกติมีผลน้อยลง
  • สามารถใช้กับข้อมูลลำดับที่ : สามารถวิเคราะห์ข้อมูล Likert Scale ได้โดยตรง
  • ตัวอย่างขนาดเล็ก : มีประสิทธิภาพดีสำหรับตัวอย่างขนาดเล็ก (n < 30)
  • ประสิทธิภาพ : สำหรับข้อมูลไม่ปกติ ประสิทธิภาพจะสูงกว่า Paired t-test (ARE ≈ 95% หรือมากกว่า)
ขั้นตอนการวิเคราะห์
  1. คำนวณความแตกต่าง (D): D = X₂ - X₁ สำหรับแต่ละคู่
  2. ลบศูนย์ออก : ตัดค่า D = 0 ออกจากการวิเคราะห์ (n จะลดลง)
  3. คำนวณค่าสัมบูรณ์ : |D| = |X₂ - X₁|
  4. จัดลำดับ : เรียงลำดับ |D| จากน้อยไปมาก และให้อันดับ (rank) ตั้งแต่ 1 ไป n
  5. ให้เครื่องหมายอันดับ : กำหนดเครื่องหมาย + หรือ - ให้กับแต่ละอันดับตามเครื่องหมายของ D เดิม
  6. คำนวณ T statistic : W⁺ = ผลรวมอันดับบวก, W⁻ = ผลรวมอันดับลบ, T = min(W⁺, W⁻)
  7. คำนวณค่า Z : สำหรับตัวอย่างขนาดใหญ่ (n ≥ 15) ใช้การประมาณการแจกแจงปกติ
  8. หาค่า p-value : เปรียบเทียบกับระดับนัยสำคัญ α (ปกติ α = 0.05)
การตีความผลลัพธ์

เกี่ยวกับค่า p-value:

  • p < 0.05 : ปฏิเสธสมมติฐานว่าง (H₀) มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างสองกลุ่ม
  • p ≥ 0.05 : ยอมรับสมมติฐานว่าง (H₀) ไม่มีหลักฐานเพียงพอว่ามีความแตกต่าง
  • p < 0.01 : ความแตกต่างมีนัยสำคัญสูงมาก
  • p < 0.001 : ความแตกต่างมีนัยสำคัญสูงสุด

เกี่ยวกับขนาดอิทธิพล (Effect Size):

  • r < 0.30 : ไม่มีนัยสำคัญปกติ (negligible)
  • r = 0.30-0.50 : มีอิทธิพลเล็กน้อย (small)
  • r = 0.50-0.80 : มีอิทธิพลปานกลาง (medium)
  • r ≥ 0.80 : มีอิทธิพลมาก (large)
หลักการวิจัยและการรายงานผลลัพธ์

ในการรายงานผลลัพธ์ตามมาตรฐาน APA ควรระบุ

  • จำนวนกลุ่มตัวอย่าง (n) และจำนวนการสังเกต
  • ค่า T statistic (W หรือ T) และค่า p-value พร้อมสัญลักษณ์นัยสำคัญ (*)
  • ขนาดอิทธิพล (r) และช่วงความเชื่อมั่น (95% CI หรือ 99% CI)
  • ค่าสถิติพรรณนา (Mean, Median, SD) ของสองกลุ่ม
  • ตัวอย่างการรายงาน : "ผลการวิเคราะห์ Wilcoxon Signed-Rank Test พบความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าก่อนและหลัง (T = 45, n = 25, p = 0.0023, r = 0.58, 95% CI = [0.25, 0.85])"

จริยธรรมในการวิจัย

  • ต้องระบุสมมติฐาน (H₀ และ H₁) ก่อนเริ่มการวิเคราะห์
  • ไม่ควรเลือกการทดสอบหลังจากดูข้อมูล (p-hacking) เพื่อให้ได้ผลลัพธ์ที่มีนัยสำคัญ
  • ควรรายงานขนาดอิทธิพลด้วย ไม่ใช่เพียง p-value ที่อาจมีขนาดอิทธิพลเล็ก
  • ควรระบุระดับนัยสำคัญ (α) ก่อนการวิเคราะห์ (ปกติ α = 0.05)
อ้างอิงทางวิชาการ
  • Wilcoxon, F. (1945). Individual Comparisons by Ranking Methods. Biometrics, 1(6), 80-83.
  • Hollander, M., & Wolfe, D. A. (1999). Nonparametric Statistical Methods (2nd ed.). New York: Wiley.
  • Siegel, S., & Castellan, N. J. (1988). Nonparametric Statistics for the Behavioral Sciences (2nd ed.). New York: McGraw-Hill.
  • Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum.
  • Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics (4th ed.). London: Sage Publications.
  • Gibbons, J. D., & Chakraborti, S. (2010). Nonparametric Statistical Inference (5th ed.). Boca Raton: CRC Press.