ภาพรวมระบบ Wilcoxon Signed-Rank Test
01โปรแกรม Wilcoxon Signed-Rank Test Academic v1.0 เป็นระบบวิเคราะห์สถิติออนไลน์ที่พัฒนาสำหรับ นักวิจัย นักวิชาการ และนักศึกษา เพื่อทดสอบความแตกต่างระหว่าง ข้อมูลสองกลุ่มที่มีความสัมพันธ์กัน (Paired Data) โดยไม่ต้องสมมติว่าข้อมูลมีการแจกแจงแบบปกติ (Non-parametric)
ความสามารถหลักของระบบ
การวิเคราะห์สถิติ
- คำนวณ T Statistic, Z Score, p-value
- Tie Correction & Continuity Correction
- Effect Size (r) ตามมาตรฐาน Cohen
- Confidence Interval (95% & 99%)
- Descriptive Statistics ครบชุด
การแสดงผลและส่งออก
- รายงาน APA 7th Edition อัตโนมัติ
- ตาราง Rank รายคู่แบบละเอียด
- Chart แสดงการกระจายผลต่าง
- ป้อนข้อมูลได้ 3 รูปแบบ (กรอกเอง / วาง / Excel)
- พิมพ์ผลลัพธ์ได้ทันที
ทฤษฎีและหลักการทางสถิติ
02Wilcoxon Signed-Rank Test คืออะไร?
เสนอโดย Frank Wilcoxon (1945) เป็นการทดสอบสถิติแบบ Non-parametric ที่ใช้อันดับ (Ranks) ของขนาดความแตกต่างแทนค่าจริง จึงทนทานต่อข้อมูลที่ไม่ปกติและค่าผิดปกติ (Outliers)
สมมติฐานการทดสอบ
| สมมติฐาน | ความหมาย |
|---|---|
| H₀ | การแจกแจงของความแตกต่าง (D = X₂ − X₁) มีความสมมาตรรอบศูนย์ (ไม่มีความแตกต่าง) |
| H₁ | การแจกแจงของความแตกต่างไม่สมมาตรรอบศูนย์ (มีความแตกต่าง) – ทดสอบสองด้าน |
เงื่อนไขการใช้งาน (Assumptions)
- ข้อมูลเป็นคู่สัมพันธ์ — วัดจากหน่วยเดิม 2 ครั้ง หรือจับคู่กันอย่างมีความหมาย
- ตัวแปรมีมาตราวัดอย่างน้อยลำดับที่ขึ้นไป — เช่น Likert Scale, คะแนน, น้ำหนัก ฯลฯ
- การแจกแจงของ D มีความสมมาตร — ข้อตกลงที่อ่อนกว่าการแจกแจงปกติ
- ไม่ต้องการ Normal Distribution — ข้อดีหลักเมื่อเทียบกับ Paired t-test
เมื่อใดควรเลือก Wilcoxon แทน Paired t-test
ใช้ Wilcoxon เมื่อ
- ข้อมูลไม่มีการแจกแจงปกติ (Shapiro-Wilk, p < 0.05)
- มีค่าผิดปกติ (Outliers) ในข้อมูล
- ข้อมูลเป็น Likert Scale หรือ Ordinal
- n < 30 และไม่มั่นใจในการแจกแจง
- ต้องการความทนทาน (Robustness)
ใช้ Paired t-test เมื่อ
- ข้อมูลมีการแจกแจงปกติ (หรือ n ≥ 30)
- ไม่มีค่าผิดปกติที่รุนแรง
- ข้อมูลเป็น Ratio หรือ Interval Scale
- ต้องการ Power สูงสุดเมื่อสมมติฐานเป็นจริง
สูตรการคำนวณหลัก
Di = X₂ᵢ − X₁ᵢ (ความแตกต่างรายคู่)
จัดอันดับ |Dᵢ| → ให้เครื่องหมาย → W⁺ = Σ(อันดับบวก), W⁻ = Σ(อันดับลบ)
T = min(W⁺, W⁻)
μT = n(n+1)/4 · σT = √[n(n+1)(2n+1)/24 − Σ(t³−t)/48]
Z = (T − μT ± 0.5) / σT (Continuity Correction)
p-value = 2 × [1 − Φ(|Z|)] (Two-tailed)
การประยุกต์ใช้แทน One-Sample t-test
03หลักการ: แปลง One-Sample → Paired Sample
One-Sample t-test ทดสอบ: H₀: μ = μ₀
Wilcoxon ไม่มีโหมด One-Sample โดยตรง แต่เราแปลงได้โดยสร้าง "กลุ่มเปรียบเทียบ" ที่มีค่าเท่ากับ μ₀ ทุกตัว แล้วนำมาเปรียบเทียบกับข้อมูลจริงในรูปแบบ Paired
กลุ่ม 1 (Group 1) = ค่าคงที่ μ₀ ซ้ำ n ครั้ง เช่น μ₀ = 75 → [75, 75, 75, ..., 75]
กลุ่ม 2 (Group 2) = ข้อมูลจริงของกลุ่มตัวอย่าง เช่น [78, 82, 69, 91, ...]
D = Group2 − Group1 = X − μ₀ (ความแตกต่างจากค่าอ้างอิง)
ตัวอย่างการใช้งานจริง
สถานการณ์: กระทรวงศึกษาธิการกำหนดมาตรฐานคะแนนเฉลี่ยวิชาคณิตศาสตร์ = 70 คะแนน
ผู้วิจัยต้องการทราบว่านักเรียน 12 คน ที่ใช้โปรแกรมสอนเสริม มีคะแนนแตกต่างจากมาตรฐานหรือไม่
คะแนนนักเรียน: 68, 74, 81, 65, 79, 83, 72, 77, 70, 88, 61, 75
| นักเรียน | Group 1 (μ₀ = 70) | Group 2 (คะแนนจริง) |
|---|---|---|
| 1 | 70 | 68 |
| 2 | 70 | 74 |
| 3 | 70 | 81 |
| 4 | 70 | 65 |
| 5 | 70 | 79 |
| 6 | 70 | 83 |
| 7 | 70 | 72 |
| 8 | 70 | 77 |
| 9 | 70 | 70 |
| 10 | 70 | 88 |
| 11 | 70 | 61 |
| 12 | 70 | 75 |
วิธีใส่ข้อมูล: ป้อนคอลัมน์ Group 1 = ค่า 70 ทั้ง 12 ช่อง และ Group 2 = คะแนนจริงแต่ละคน
สถานการณ์: WHO กำหนดค่า BMI ปกติ = 22.5 นักโภชนาการต้องการทดสอบว่า BMI ของกลุ่มตัวอย่าง 8 คน
แตกต่างจากค่ามาตรฐานหรือไม่ โดย BMI ของกลุ่มตัวอย่าง: 24.1, 21.3, 27.8, 19.5, 23.6, 25.2, 20.8, 22.1
ตั้งค่า: Group 1 = [22.5, 22.5, 22.5, 22.5, 22.5, 22.5, 22.5, 22.5], Group 2 = [24.1, 21.3, 27.8, 19.5, 23.6, 25.2, 20.8, 22.1]
สถานการณ์: เกณฑ์ระดับความพึงพอใจที่ยอมรับได้ = 3.5 จาก 5 ผู้บริหารต้องการทราบว่าคะแนนความพึงพอใจของพนักงาน
15 คน สูงกว่าเกณฑ์หรือไม่ โดยข้อมูลเป็น Likert Scale ซึ่ง ไม่ควรใช้ One-Sample t-test
ตั้งค่า: Group 1 = [3.5 × 15 ครั้ง], Group 2 = คะแนนความพึงพอใจจริงของพนักงาน 15 คน
เปรียบเทียบ: One-Sample t-test vs Wilcoxon (แบบแทน)
| หัวข้อ | One-Sample t-test | Wilcoxon (ใช้แทน) |
|---|---|---|
| สมมติฐานการแจกแจง | ต้องมีการแจกแจงปกติ | ไม่จำเป็น |
| ความทนทานต่อ Outliers | ต่ำ | สูง |
| เหมาะกับ Likert Scale | ไม่เหมาะ | เหมาะ |
| n ที่แนะนำ | ≥ 30 (หรือรู้ว่า Normal) | ≥ 3 (แต่แนะนำ ≥ 10) |
| Efficiency เมื่อข้อมูล Normal | 100% | ~95.5% (ARE) |
| ผลลัพธ์หลัก | t statistic, df, p | T statistic, Z, p |
| Effect Size | Cohen's d | r = |Z|/√n |
สรุปขั้นตอนการประยุกต์ใช้ (3 ขั้นตอน)
ขั้นตอนการใช้งานระบบ (Step by Step)
04ขั้นตอนที่ 1 ตั้งค่าพื้นฐาน
ขั้นตอนที่ 2 ป้อนข้อมูล
มีตัวเลือก 3 วิธี (ดูรายละเอียดในหัวข้อ วิธีป้อนข้อมูล 3 แบบ)
ขั้นตอนที่ 3 ตรวจสอบข้อมูล
ขั้นตอนที่ 4 ผลลัพธ์และรายงาน
วิธีป้อนข้อมูล 3 แบบ
05แบบที่ 1 กรอกเอง (Manual)
เหมาะสำหรับข้อมูลจำนวนน้อย หรือต้องการป้อนแบบระมัดระวัง
- คลิก Tab "กรอกเอง"
- ตารางจะแสดง n แถว มี 2 คอลัมน์ (Group 1 และ Group 2)
- กรอกตัวเลขทีละช่อง กด Tab เพื่อย้ายไปช่องถัดไป
- รองรับทศนิยม เช่น 3.14, -2.5, 100.00
แบบที่ 2 วางข้อมูล (Paste)
เหมาะเมื่อคัดลอกมาจากโปรแกรมอื่น เช่น Excel, Notepad, Google Sheets
- คลิก Tab "วางข้อมูล"
- มีช่องวางข้อมูล 2 ช่อง: ด้านซ้าย = Group 1, ด้านขวา = Group 2
- วางข้อมูลโดย ตัวเลข 1 ค่า ต่อ 1 บรรทัด (ห้ามมีตัวอักษรหรือสัญลักษณ์พิเศษ)
- ตัวอย่างรูปแบบที่ถูกต้อง:
70 68
70 74
70 81
...
แบบที่ 3 อัปโหลด Excel (.xlsx)
เหมาะสำหรับข้อมูลจำนวนมาก หรือมีไฟล์ข้อมูลพร้อมแล้ว
- คลิก Tab "อัปโหลด Excel"
- ลากไฟล์มาวาง หรือคลิกเพื่อเลือกไฟล์ (.xlsx หรือ .xls)
- รูปแบบไฟล์ที่ถูกต้อง: คอลัมน์ A = Group 1, คอลัมน์ B = Group 2, แถวที่ 1 = หัวตาราง (ไม่ต้องใส่ข้อมูล)
| A (Group 1) | B (Group 2) |
|---|---|
| Group 1 | Group 2 |
| 70 | 68 |
| 70 | 74 |
| 70 | 81 |
การอ่านและตีความผลลัพธ์
06ค่าสถิติหลักที่ควรทำความเข้าใจ
| ค่าสถิติ | ความหมาย | ช่วงค่า |
|---|---|---|
| n (pairs) | จำนวนคู่ที่ใช้วิเคราะห์จริง (หลังตัดคู่ที่ D = 0 ออก) | ≥ 3 |
| W⁺ / W⁻ | ผลรวมอันดับบวก / ลบ | 0 ถึง n(n+1)/2 |
| T (Statistic) | ค่าต่ำสุดระหว่าง W⁺ และ W⁻ ยิ่งน้อยยิ่งมีนัยสำคัญ | 0 ถึง n(n+1)/4 |
| Z Score | ค่า Z สำหรับ Normal Approximation (พร้อม Continuity Correction) | −∞ ถึง +∞ |
| p-value | ความน่าจะเป็นที่จะได้ผลเช่นนี้ภายใต้ H₀ (Two-tailed) | 0 ถึง 1 |
| r (Effect Size) | r = |Z| / √n แสดงขนาดของความแตกต่าง | 0 ถึง 1 |
เกณฑ์การตัดสินใจ
| ผล p-value | สัญลักษณ์ | การตัดสิน |
|---|---|---|
| p < 0.001 | *** | ปฏิเสธ H₀ · นัยสำคัญสูงมาก |
| p < 0.01 | ** | ปฏิเสธ H₀ · นัยสำคัญสูง |
| p < 0.05 | * | ปฏิเสธ H₀ · มีนัยสำคัญ |
| p ≥ 0.05 | ns | ไม่ปฏิเสธ H₀ · ไม่มีนัยสำคัญ |
ขนาดอิทธิพล (Effect Size r)
| ค่า r | ระดับ | ความหมาย |
|---|---|---|
| r < 0.30 | Negligible | อิทธิพลน้อยมาก / ไม่มีนัยสำคัญปกติ |
| 0.30 – 0.50 | Small | อิทธิพลเล็กน้อย |
| 0.50 – 0.80 | Medium | อิทธิพลปานกลาง |
| r ≥ 0.80 | Large | อิทธิพลมาก |
ช่วงความเชื่อมั่น (Confidence Interval)
- 95% CI: หากค่า 0 ไม่อยู่ในช่วง → มีความแตกต่างที่ p < 0.05
- 99% CI: หากค่า 0 ไม่อยู่ในช่วง → มีความแตกต่างที่ p < 0.01
- CI จะแสดงผลก็ต่อเมื่อ n ≥ 15 เท่านั้น (Normal Approximation)
การรายงานผลแบบ APA 7th Edition
07ระบบสร้างข้อความรายงานอัตโนมัติ 3 รูปแบบ:
| รูปแบบ | ตัวอย่างข้อความ | ใช้เมื่อ |
|---|---|---|
| Inline Citation | T(25) = 45.00, Z = 2.543, p < .05, r = 0.508 * | ใส่ในวงเล็บในเนื้อหา |
| Narrative | A Wilcoxon signed-rank test indicated that the two groups did significantly differ ... | เขียนเป็นประโยคในผลการวิเคราะห์ |
| Publication Style | Wilcoxon signed-rank test (n = 25): T = 45.00, Z = 2.543, ... | ลงวารสารหรือรายงานวิชาการ |
องค์ประกอบที่ควรรายงานในงานวิจัย
- จำนวนตัวอย่าง (n) ที่ใช้วิเคราะห์จริง
- ค่า T statistic และ Z score
- p-value พร้อมสัญลักษณ์ (*, **, ***, ns)
- Effect Size (r) และระดับ (small/medium/large)
- Confidence Interval 95% (ถ้า n ≥ 15)
- ค่าสถิติพรรณนา (Median, Mean, SD) ของแต่ละกลุ่ม
คำถามที่พบบ่อย (FAQ)
08Q: จำเป็นต้องทดสอบความปกติก่อนหรือไม่?
แนะนำให้ทดสอบ (เช่น Shapiro-Wilk) เสมอ หากข้อมูลปกติ Paired t-test ให้ Power สูงกว่า แต่หากไม่ปกติหรือไม่แน่ใจ ให้ใช้ Wilcoxon เป็นทางเลือกที่ปลอดภัยกว่า
Q: ทำไม n ในผลลัพธ์น้อยกว่าที่ป้อน?
คู่ข้อมูลที่มีค่าความแตกต่าง D = 0 (Group 2 − Group 1 = 0) จะถูกตัดออกจากการวิเคราะห์ตามมาตรฐาน Wilcoxon ซึ่งเป็นพฤติกรรมปกติและถูกต้องทางสถิติ
Q: Ties คืออะไร มีผลอย่างไร?
Ties หมายถึงค่า |D| ของหลายคู่ที่เท่ากัน ระบบจะใช้ Tie Correction ในสูตรคำนวณ Variance เพื่อให้ค่า Z และ p-value แม่นยำขึ้น ระบบนี้ใช้สูตรแบบ Cureton/Pratt-Gibbons
Q: ผลต่างจาก SPSS เล็กน้อย เป็นเพราะอะไร?
SPSS มักรายงาน Z "Based on negative ranks" ซึ่งอาจมีเครื่องหมายต่างกัน แต่ค่า |Z| และ p-value ควรใกล้เคียงกันมาก ความต่างเล็กน้อยอาจเกิดจาก Continuity Correction ที่ใช้ต่างกันเล็กน้อย
Q: n < 15 ควรทำอย่างไร?
สำหรับ n < 15 ระบบยังสามารถคำนวณได้ แต่จะไม่แสดง Confidence Interval เนื่องจาก Normal Approximation ไม่แม่นยำพอ แนะนำให้ใช้ Exact Test จากโปรแกรม R หรือ SPSS ควบคู่กัน
Q: ใช้กับข้อมูล Likert Scale ได้หรือไม่?
ได้ Wilcoxon เหมาะกับข้อมูล Ordinal Scale รวมถึง Likert Scale เพราะใช้อันดับแทนค่าจริง ซึ่งหมายความว่าช่วงระหว่างระดับไม่จำเป็นต้องเท่ากัน
Q: ข้อมูลสูงสุดกี่คู่ที่รองรับ?
ระบบรองรับสูงสุด 1,000 คู่ สำหรับข้อมูลที่มากกว่านี้แนะนำให้ใช้ R หรือ Python
อ้างอิงทางวิชาการ
09- Wilcoxon, F. (1945). Individual comparisons by ranking methods. Biometrics Bulletin, 1(6), 80–83.
- Hollander, M., & Wolfe, D. A. (1999). Nonparametric statistical methods (2nd ed.). Wiley.
- Siegel, S., & Castellan, N. J. (1988). Nonparametric statistics for the behavioral sciences (2nd ed.). McGraw-Hill.
- Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum.
- Field, A. (2013). Discovering statistics using IBM SPSS statistics (4th ed.). Sage.
- Gibbons, J. D., & Chakraborti, S. (2010). Nonparametric statistical inference (5th ed.). CRC Press.
- วุฒิไกร ป้อมมะรัง. (2569). โปรแกรมทดสอบวิลคอกซันแบบจับคู่ (Wilcoxon Signed-Rank Test) Academic v1.0. https://statsmartly.com/statistical/Wilcoxon.php