Statistical Tool

คำนวณขนาดกลุ่มตัวอย่าง

ด้วยสูตรของ Hsieh, Bloch & Larsen (1998) — สำหรับการวิจัยเชิงสหสัมพันธ์และการถดถอย

H₀ : ρ = 0  |  H₁ : ρ ≠ 0 (two-tailed)  /  H₁ : ρ > 0 หรือ ρ < 0 (one-tailed)
เครื่องมือคำนวณ
Two-tailed : ใช้ Zα/2  |  One-tailed : ใช้ Zα
ค่าที่นิยม : 0.05 (95% confidence) หรือ 0.01 (99% confidence)
ค่าแนะนำ : 0.80 (Cohen 1988) — งานคลินิก ใช้ 0.90 หรือสูงกว่า
ค่าระหว่าง −1 ถึง 1 (ยกเว้น 0) — ประมาณจากวรรณกรรมหรือ Pilot Study
ใส่ 0 หากไม่มีตัวแปรควบคุม  |  nadj = n / (1 − R²XZ) ตาม Hsieh et al. (1998) สมการ 5
คำอธิบายสูตรและหลักการทางสถิติ
สมมติฐานและขอบเขตการใช้งาน
ข้อสำคัญ — สูตรนี้ทดสอบเฉพาะ H₀ : ρ = 0
  • ใช้ได้เฉพาะเมื่อต้องการทดสอบว่า ρ แตกต่างจากศูนย์
  • หากต้องการทดสอบ H₀ : ρ = ρ₀ (ρ₀ ≠ 0) ต้องใช้สูตรที่ต่างออกไป
  • ข้อสมมติ : ข้อมูลเป็น Bivariate Normal Distribution
สูตรหลัก (Hsieh et al. 1998, Equation 1)
n = [ (Zα/2 + Zβ) / ζ ]² + 3
ζ = 0.5 · ln((1+ρ)/(1−ρ)) = arctanh(ρ)  [Fisher's Z transform]
² ยกกำลังทั้งเศษส่วน — +3 คือการแก้ไขตาม Fisher (1921)
สูตรปรับแก้สำหรับตัวแปรควบคุม (Equation 5)
nadj = nbase / (1 − R²XZ)
XZ = Squared Multiple Correlation ระหว่างตัวแปรหลัก X กับ covariates Z₁, Z₂, ...
ζ (zeta)
Fisher's Z transform ของ ρ
Zα/2 หรือ Zα
Quantile ของ N(0,1)
qnorm(1−power)
XZ
ส่วนแปรปรวน X ที่ Z อธิบายได้
คำแนะนำการใช้งาน
  • ใช้ Two-tailed เป็นค่าเริ่มต้น เว้นแต่มีทิศทางสมมติฐานชัดเจน
  • ค่า α ที่นิยม : 0.05 (ทั่วไป), 0.01 (งานคลินิกสำคัญ)
  • Power ≥ 0.80 (Cohen 1988) — งานคลินิก ≥ 0.90
  • ประมาณ ρ จากวรรณกรรมหรือ Pilot Study (n ≥ 30)
  • ใส่ R²XZ = 0 หากไม่มีตัวแปรควบคุม
  • ดู Sensitivity Analysis เสมอ เพื่อเลือก n ที่ Conservative

อ้างอิงหลัก
Hsieh, F. Y., Bloch, D. A., & Larsen, M. D. (1998). A simple method of sample size calculation for linear and logistic regression. Statistics in Medicine, 17(14), 1623–1634.

Fisher, R. A. (1915). Frequency distribution of the values of the correlation coefficient in samples from an indefinitely large population. Biometrika, 10(4), 507–521.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum.
คำถามที่พบบ่อย

Two-tailed (H₁ : ρ ≠ 0) — แนะนำเป็นค่าเริ่มต้น
  • ไม่ทราบทิศทางความสัมพันธ์ล่วงหน้า
  • ใช้ Zα/2 → ต้องการตัวอย่างมากกว่า one-tailed
  • เป็นมาตรฐานที่วารสารส่วนใหญ่ยอมรับ
One-tailed (H₁ : ρ > 0 หรือ ρ < 0)
  • มีทิศทางสมมติฐานชัดเจนจากทฤษฎีหรือวรรณกรรม
  • ใช้ Zα → ต้องการตัวอย่างน้อยกว่า แต่มีความเสี่ยงสูงกว่า
ตัวอย่างเปรียบเทียบ (α=0.05, Power=0.80, ρ=0.30)
  • Two-tailed → n ≈ 84 คน
  • One-tailed → n ≈ 67 คน

XZ คือ Squared Multiple Correlation ระหว่างตัวแปรหลัก X กับตัวแปรควบคุม Z (Hsieh et al. 1998, eq.5) บอกว่า covariates อธิบาย X ได้สัดส่วนเท่าใด

วิธีหาค่า R²_XZ
  • ไม่มีตัวแปรควบคุม : ใส่ R²XZ = 0
  • มีตัวแปรควบคุม : ทำ regression X ~ Z₁ + Z₂ + ... จาก Pilot Study หรือวรรณกรรม แล้วดูค่า R²
ข้อควรระวัง
  • XZ = 0.50 จะเพิ่ม n เป็น 2 เท่า
  • ไม่ควรเดาค่า — ควรอ้างอิงจากข้อมูลจริงเสมอ

ระดับρบริบท
น้อย (Small)0.10การสำรวจ / ไม่มีหลักฐานล่วงหน้า
ปานกลาง (Medium)0.30พฤติกรรมศาสตร์ / สังคมศาสตร์ทั่วไป
มาก (Large)0.50มีทฤษฎีรองรับและหลักฐานเชิงประจักษ์
แนวทางเลือกค่า ρ
  1. ใช้ค่า Conservative เพื่อหลีกเลี่ยงขนาดตัวอย่างน้อยเกินไป
  2. ดูจาก Meta-analysis หรืองานวิจัยที่ใกล้เคียง
  3. ทำ Pilot Study (n ≥ 30) เพื่อประมาณค่าเบื้องต้น
  4. ใช้ Sensitivity Analysis เพื่อดูช่วงของ n

ขนาดตัวอย่าง (n) ที่คำนวณจากสูตร Hsieh เป็น ค่าตัวเดียวที่กำหนด (deterministic) ตามพารามิเตอร์ที่ระบุ — ไม่ใช่การประมาณค่าจากข้อมูล จึงไม่มี "ช่วงความเชื่อมั่น" ในทางสถิติ

วิธีที่ถูกต้องในการสื่อความไม่แน่นอน
  • Sensitivity Analysis — ดูตารางด้านซ้ายที่แสดง n สำหรับ ρ ต่างๆ
  • Conservative approach — เลือก n สูงสุดจาก Sensitivity Analysis
  • เพิ่ม buffer 10–20% — เผื่อ dropout หรือ missing data