Wilcoxon Signed-Rank Test

ขั้นตอนที่ 1 : ตั้งค่าพื้นฐาน

จำนวนคู่ข้อมูล ต้องมีอย่างน้อย 3 คู่ ขึ้นไปสูงสุด 1,000 คู่

ชื่อกลุ่มที่ 1

ชื่อกลุ่มที่ 2

คำแนะนำในการตั้งค่าพื้นฐาน
ป้อนชื่อสำหรับการเปรียบเทียบระหว่างสองกลุ่มคู่สัมพันธ์ เช่น "คะแนนก่อนเรียน" และ "คะแนนหลังเรียน" หรือ "เวลาที่ 1" และ "เวลาที่ 2"

รีเซ็ต

คำอธิบายวิชาการและทฤษฎี Wilcoxon Signed-Rank Test

บทนำและนิยาม

Wilcoxon Signed-Rank Test (การทดสอบสัญลักษณ์-อันดับของวิลคอกสัน) เป็นการทดสอบสถิติแบบไม่ใช้พารามิเตอร์ (Non-parametric Test) ที่ใช้สำหรับเปรียบเทียบค่ากลางของข้อมูลสองกลุ่มที่มีความสัมพันธ์กัน (Paired Data) หรือหนึ่งกลุ่มเทียบกับค่ากลางที่กำหนด (One-sample test) โดยไม่ต้องสมมติว่าข้อมูลมีการแจกแจงแบบปกติ (Normal Distribution) ซึ่งแตกต่างจากการทดสอบ Paired t-test ที่ต้องถือว่าข้อมูลมีการแจกแจงแบบปกติ

เมื่อใดควรใช้ Wilcoxon Signed-Rank Test

ใช้ได้เมื่อ

ข้อมูลเป็นคู่สัมพันธ์ (Paired Data) เช่น วัดคะแนนก่อนเรียน-คะแนนหลังเรียน จากคนเดียวกัน
ข้อมูลมีมาตราวัดแบบลำดับที่ (Ordinal Scale) ขึ้นไป เช่น ช่วงน้อย-ปานกลาง-มาก (Likert Scale) หรือข้อมูลอัตราส่วน
ข้อมูลไม่มีการแจกแจงแบบปกติ (Non-normal Distribution) ตามการทดสอบ Shapiro-Wilk หรือ Kolmogorov-Smirnov
มีค่าผิดปกติ (Outliers) หรือข้อมูลมีความเบ้ (Skewed)
ขนาดตัวอย่างมีขนาดเล็ก (n < 30) และไม่สามารถถือว่าข้อมูลมีการแจกแจงแบบปกติ

ไม่ใช้เมื่อ

ข้อมูลอิสระต่อกัน (Independent Data) ควรใช้ Mann-Whitney U Test แทน
ตัวอย่างมากกว่าสองกลุ่ม ควรใช้ Friedman Test แทน
ต้องการทราบปริมาณความแตกต่างที่แน่นอน (ควรใช้ Paired t-test หากสมมติฐานเป็นจริง)

สมมติฐานและข้อตกลงเบื้องต้น

ข้อมูลเป็นคู่สัมพันธ์ : การสังเกตในสองกลุ่มต้องมีความเกี่ยวข้องกัน เช่น ข้อมูลมาจากการวัดซ้ำครั้งเดียวกัน
ตัวแปรตามต้องต่อเนื่อง : ความแตกต่างของตัวแปรต้องมีมาตราวัดอย่างน้อยลำดับที่ขึ้นไป
ความแตกต่างมีการแจกแจงสมมาตร : การแจกแจงของความแตกต่าง (D = X₂ - X₁) ต้องมีความสมมาตรรอบศูนย์ (สมมติฐานนี้ยังอ่อนแอกว่าการแจกแจงปกติ)
ไม่ต้องถือว่าเป็นการแจกแจงปกติ : นี่คือข้อดีหลักของการทดสอบไม่ใช้พารามิเตอร์นี้

ข้อดีเมื่อเทียบกับ Paired t-test

ไม่ต้องสมมติการแจกแจงปกติ : เหมาะสำหรับข้อมูลที่มีการแจกแจงไม่ปกติ
ทำงานได้ดีกับค่าผิดปกติ : ใช้อันดับ (ranks) แทนค่าจริง ทำให้ค่าผิดปกติมีผลน้อยลง
สามารถใช้กับข้อมูลลำดับที่ : สามารถวิเคราะห์ข้อมูล Likert Scale ได้โดยตรง
ตัวอย่างขนาดเล็ก : มีประสิทธิภาพดีสำหรับตัวอย่างขนาดเล็ก (n < 30)
ประสิทธิภาพ : สำหรับข้อมูลไม่ปกติ ประสิทธิภาพจะสูงกว่า Paired t-test (ARE ≈ 95% หรือมากกว่า)

ขั้นตอนการวิเคราะห์

คำนวณความแตกต่าง (D): D = X₂ - X₁ สำหรับแต่ละคู่
ลบศูนย์ออก : ตัดค่า D = 0 ออกจากการวิเคราะห์ (n จะลดลง)
คำนวณค่าสัมบูรณ์ : |D| = |X₂ - X₁|
จัดลำดับ : เรียงลำดับ |D| จากน้อยไปมาก และให้อันดับ (rank) ตั้งแต่ 1 ไป n
ให้เครื่องหมายอันดับ : กำหนดเครื่องหมาย + หรือ - ให้กับแต่ละอันดับตามเครื่องหมายของ D เดิม
คำนวณ T statistic : W⁺ = ผลรวมอันดับบวก, W⁻ = ผลรวมอันดับลบ, T = min(W⁺, W⁻)
คำนวณค่า Z : สำหรับตัวอย่างขนาดใหญ่ (n ≥ 15) ใช้การประมาณการแจกแจงปกติ
หาค่า p-value : เปรียบเทียบกับระดับนัยสำคัญ α (ปกติ α = 0.05)

การตีความผลลัพธ์

เกี่ยวกับค่า p-value:

p < 0.05 : ปฏิเสธสมมติฐานว่าง (H₀) มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างสองกลุ่ม
p ≥ 0.05 : ยอมรับสมมติฐานว่าง (H₀) ไม่มีหลักฐานเพียงพอว่ามีความแตกต่าง
p < 0.01 : ความแตกต่างมีนัยสำคัญสูงมาก
p < 0.001 : ความแตกต่างมีนัยสำคัญสูงสุด

เกี่ยวกับขนาดอิทธิพล (Effect Size):

r < 0.30 : ไม่มีนัยสำคัญปกติ (negligible)
r = 0.30-0.50 : มีอิทธิพลเล็กน้อย (small)
r = 0.50-0.80 : มีอิทธิพลปานกลาง (medium)
r ≥ 0.80 : มีอิทธิพลมาก (large)

หลักการวิจัยและการรายงานผลลัพธ์

ในการรายงานผลลัพธ์ตามมาตรฐาน APA ควรระบุ

จำนวนกลุ่มตัวอย่าง (n) และจำนวนการสังเกต
ค่า T statistic (W หรือ T) และค่า p-value พร้อมสัญลักษณ์นัยสำคัญ (*)
ขนาดอิทธิพล (r) และช่วงความเชื่อมั่น (95% CI หรือ 99% CI)
ค่าสถิติพรรณนา (Mean, Median, SD) ของสองกลุ่ม
ตัวอย่างการรายงาน : "ผลการวิเคราะห์ Wilcoxon Signed-Rank Test พบความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างค่าก่อนและหลัง (T = 45, n = 25, p = 0.0023, r = 0.58, 95% CI = [0.25, 0.85])"

จริยธรรมในการวิจัย

ต้องระบุสมมติฐาน (H₀ และ H₁) ก่อนเริ่มการวิเคราะห์
ไม่ควรเลือกการทดสอบหลังจากดูข้อมูล (p-hacking) เพื่อให้ได้ผลลัพธ์ที่มีนัยสำคัญ
ควรรายงานขนาดอิทธิพลด้วย ไม่ใช่เพียง p-value ที่อาจมีขนาดอิทธิพลเล็ก
ควรระบุระดับนัยสำคัญ (α) ก่อนการวิเคราะห์ (ปกติ α = 0.05)

อ้างอิงทางวิชาการ

Wilcoxon, F. (1945). Individual Comparisons by Ranking Methods. Biometrics, 1(6), 80-83.
Hollander, M., & Wolfe, D. A. (1999). Nonparametric Statistical Methods (2nd ed.). New York: Wiley.
Siegel, S., & Castellan, N. J. (1988). Nonparametric Statistics for the Behavioral Sciences (2nd ed.). New York: McGraw-Hill.
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum.
Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics (4th ed.). London: Sage Publications.
Gibbons, J. D., & Chakraborti, S. (2010). Nonparametric Statistical Inference (5th ed.). Boca Raton: CRC Press.