คู่มือการใช้งานระบบ

User Manual — Criterion-Referenced Test Analysis

Academic 1.0 | ฉบับสมบูรณ์
ส่วนที่ 1

ภาพรวมระบบ

ระบบนี้คืออะไร?

โปรแกรมวิเคราะห์คุณภาพแบบทดสอบแบบอิงเกณฑ์ (Criterion-Referenced Test Analysis) เป็นเครื่องมือออนไลน์ที่ช่วยให้ครู อาจารย์ และนักวัดผลสามารถวิเคราะห์คุณภาพข้อสอบแบบอิงเกณฑ์ได้อย่างถูกต้องตามหลักวิชาการ โดยไม่ต้องใช้โปรแกรมสถิติที่ซับซ้อน

ระบบทำอะไรได้บ้าง?
  • คำนวณค่าอำนาจจำแนก (B) รายข้อ
  • จำแนกกลุ่มผ่านเกณฑ์ / ไม่ผ่านเกณฑ์ อัตโนมัติ
  • คำนวณความเชื่อมั่นสูตร Lovett (ρ_c)
  • สร้างรายงานผลวิจัยพร้อมคัดลอกและพิมพ์
  • นำเข้าข้อมูลจากExcel / CSV
  • แสดงผลกราฟแท่งค่าอำนาจจำแนกแบบ Interactive
เหมาะสำหรับใคร?
  • ครู / อาจารย์ ที่ต้องการตรวจสอบคุณภาพข้อสอบ
  • นักวิจัย ด้านการวัดและประเมินผลทางการศึกษา
  • นักศึกษา ที่เรียนวิชาการวัดผลและวิจัยทางการศึกษา
  • นักวัดผล ในหน่วยงานสถาบันต่าง ๆ
  • ผู้ออกข้อสอบ มาตรฐานวิชาชีพและใบอนุญาต
ข้อแตกต่างที่สำคัญ : การวิเคราะห์แบบอิงเกณฑ์ (Criterion-Referenced) แตกต่างจากแบบอิงกลุ่ม (Norm-Referenced) ตรงที่ไม่ใช้ค่าความยาก (p) และไม่แบ่งกลุ่มสูง–ต่ำ 27% แต่แบ่งตามคะแนนเกณฑ์ที่กำหนดไว้ล่วงหน้า
ส่วนที่ 2

ขั้นตอนการใช้งานทั้งหมด

ระบบแบ่งการทำงานออกเป็น 5 ขั้นตอน ตามลำดับ ดังนี้

1
กำหนดรายละเอียดแบบทดสอบ
ป้อนข้อมูลพื้นฐานของแบบทดสอบ ได้แก่ จำนวนข้อสอบ จำนวนตัวเลือก จำนวนผู้สอบ และ คะแนนเกณฑ์ผ่าน (Cut Score)
2
ป้อนข้อมูลคำตอบและเฉลย
ป้อนคำตอบของผู้สอบแต่ละคนและเฉลยถูกต้อง รองรับทั้งการพิมพ์มือ วาง (Paste) จากตาราง Excel และนำเข้าไฟล์
3
ดูผลการวิเคราะห์รายข้อ
ระบบแสดงผลค่าอำนาจจำแนก (B) และระดับคุณภาพ พร้อมจำนวนผู้ตอบถูกในแต่ละกลุ่ม ในรูปแบบตารางที่ชัดเจน
4
เลือกข้อสอบที่ต้องการคำนวณ Lovett
เลือกข้อสอบที่ต้องการรวมในการคำนวณค่าความเชื่อมั่น Lovett ระบบช่วยทำเครื่องหมายข้อที่ผ่านเกณฑ์ไว้แล้ว
5
ดูค่าความเชื่อมั่น Lovett (ρ_c)
ระบบคำนวณค่าความเชื่อมั่น Lovett พร้อมรายงานผลวิชาการที่สมบูรณ์ สามารถคัดลอกหรือพิมพ์เพื่อใส่ในงานวิจัยได้ทันที
ขั้นตอนที่ 1

กำหนดรายละเอียดแบบทดสอบ

ช่องข้อมูลคำอธิบายตัวอย่าง
จำนวนข้อสอบจำนวนข้อทั้งหมดในแบบทดสอบ (≥ 2)30
จำนวนตัวเลือกต่อข้อจำนวนตัวเลือก A, B, C, D... (≥ 2)4
จำนวนผู้สอบจำนวนนักเรียน/ผู้สอบทั้งหมด (≥ 4)35
เกณฑ์ผ่าน (%)ร้อยละของคะแนนเต็มที่กำหนดเป็นจุดผ่าน70
สำคัญ — เกณฑ์ผ่าน (Cut Score): ต้องกำหนดก่อนทำการสอบ ไม่ควรปรับเปลี่ยนภายหลัง เช่น กำหนดที่ 70% หมายความว่าผู้ที่ได้คะแนน ≥ 70% ของคะแนนเต็มจัดเป็น กลุ่มผ่านเกณฑ์ (Mastery Group)
ระบบจะคำนวณ Cut Score จริง = เกณฑ์ (%) × จำนวนข้อสอบ ÷ 100 โดยอัตโนมัติ เช่น เกณฑ์ 70% ใน 30 ข้อ = Cut Score 21 คะแนน
ขั้นตอนที่ 2

ป้อนข้อมูลคำตอบและเฉลย

มี 3 วิธี ในการป้อนข้อมูล สามารถเลือกวิธีที่สะดวกที่สุด

วิธีที่ 1 — พิมพ์มือ

คลิกที่แต่ละช่องในตารางและพิมพ์หมายเลขคำตอบ (1, 2, 3, 4...) ทีละช่อง เหมาะสำหรับข้อมูลจำนวนน้อย

วิธีที่ 2 — วางจาก Excel

คัดลอกข้อมูลจาก Excel แล้ววางในพื้นที่ Paste ระบบจะแปลงข้อมูลให้อัตโนมัติ รองรับทั้ง Tab-delimited และ CSV

วิธีที่ 3 — นำเข้าไฟล์

ลากและวางไฟล์ .xlsx หรือ .csv ลงในพื้นที่ที่กำหนด ระบบจะอ่านและโหลดข้อมูลทันที

รูปแบบข้อมูลที่ถูกต้อง : แต่ละแถวคือผู้สอบ 1 คน แต่ละคอลัมน์คือข้อสอบ 1 ข้อ ค่าในแต่ละช่องคือหมายเลขตัวเลือกที่เลือก (1, 2, 3, 4) โดย แถวสุดท้าย ต้องเป็นเฉลย เสมอ
ข้อควรระวัง : ตรวจสอบให้แน่ใจว่าจำนวนคอลัมน์ตรงกับจำนวนข้อสอบที่กำหนดในขั้นที่ 1 และจำนวนแถวตรงกับจำนวนผู้สอบ (ไม่นับแถวเฉลย)
ขั้นตอนที่ 3

ผลการวิเคราะห์รายข้อ

หน้านี้แสดงค่าอำนาจจำแนก (B) ของทุกข้อสอบในรูปแบบตาราง พร้อมรายละเอียด ดังนี้

คอลัมน์ความหมาย
ข้อที่หมายเลขข้อสอบ
การกระจายตัวเลือกจำนวนผู้เลือกตอบแต่ละตัวเลือก (ตัวเลือกถูกแสดงสีทอง)
M (กลุ่มผ่านเกณฑ์)จำนวนผู้ตอบถูกในกลุ่มที่ผ่านเกณฑ์
NM (กลุ่มไม่ผ่านเกณฑ์)จำนวนผู้ตอบถูกในกลุ่มที่ไม่ผ่านเกณฑ์
P_Mสัดส่วนผู้ตอบถูกในกลุ่ม Mastery
P_NMสัดส่วนผู้ตอบถูกในกลุ่ม Non-mastery
B (ค่าอำนาจจำแนก)= P_M − P_NM ยิ่งสูงยิ่งดี (ช่วง −1 ถึง +1)
ระดับการแปลความหมายของค่า B
คุณภาพผ่าน (B ≥ 0.20) / ไม่ผ่าน (B < 0.20)
แถวที่ผ่านเกณฑ์จะมีเส้นสีเขียวทางซ้ายของแถว แถวที่ไม่ผ่านเกณฑ์จะมีเส้นสีแดง ทำให้มองเห็นได้ง่าย
ขั้นตอนที่ 4

เลือกข้อสอบเพื่อคำนวณ Lovett

ขั้นตอนนี้ให้เลือกข้อสอบที่ต้องการนำมาคำนวณค่าความเชื่อมั่น Lovett (ρ_c)

วิธีเลือกข้อสอบ
  • ข้อที่ กรอบสีเขียว = ข้อที่ผ่านเกณฑ์ (B ≥ 0.20) ถูกเลือกไว้ล่วงหน้าแล้ว
  • สามารถ คลิกเพื่อเลือก/ยกเลิก แต่ละข้อได้อิสระ
  • ต้องเลือก อย่างน้อย 2 ข้อ จึงจะคำนวณ Lovett ได้
  • โดยทั่วไปนิยมเลือก เฉพาะข้อที่ผ่านเกณฑ์ เพื่อให้ได้แบบทดสอบที่มีคุณภาพ
เคล็ดลับ : หากต้องการเปรียบเทียบค่าความเชื่อมั่นระหว่างชุดข้อสอบต่าง ๆ ให้บันทึกผลหลังการเลือกแต่ละชุด แล้วเปรียบเทียบค่า ρ_c ที่ได้
ขั้นตอนที่ 5

ค่าความเชื่อมั่น Lovett (ρ_c)

หน้าสุดท้ายแสดงผลลัพธ์ครบถ้วน ประกอบด้วย

ผลลัพธ์หลัก
  • ค่า ρ_c (Lovett Reliability) พร้อมระดับคุณภาพ
  • จำนวนกลุ่มผ่านเกณฑ์ / ไม่ผ่านเกณฑ์
  • สถิติสรุป: Mean, Variance, Cut Score จริง
  • กราฟแท่งค่า B รายข้อของข้อที่เลือก
  • สรุปคุณภาพรายข้อ
รายงานผลวิจัย
  • รายงานผลฉบับสมบูรณ์พร้อมนำเสนอในงานวิจัย
  • ปุ่ม "คัดลอกข้อความ" — คัดลอกข้อความทั้งหมดรวมตาราง
  • ปุ่ม "พิมพ์รายงาน" — พิมพ์รายงานในรูปแบบเอกสาร
  • เอกสารอ้างอิง APA ครบถ้วน
สามารถเริ่มการวิเคราะห์ใหม่ได้โดยคลิกปุ่ม "เริ่มการวิเคราะห์ใหม่" ที่ด้านล่างของหน้า ระบบจะล้างข้อมูลทั้งหมดและกลับไปขั้นตอนที่ 1
ส่วนที่ 3

สูตรและทฤษฎีที่ใช้

สูตรค่าอำนาจจำแนก (B) — Berk (1980); Cox & Vargas (1966)
B = P_M − P_NM
P_M = สัดส่วนผู้ตอบถูกในกลุ่มผ่านเกณฑ์ (Mastery Group)
P_NM = สัดส่วนผู้ตอบถูกในกลุ่มไม่ผ่านเกณฑ์ (Non-mastery Group)
ช่วงค่า: −1 ≤ B ≤ 1 (ยิ่งสูงใกล้ +1 ยิ่งดี)
สูตรความเชื่อมั่น Lovett (ρ_c) — Livingston (1972)
ρ_c = K/(K−1) × [1 − Σ(p_i·q_i) / (S² + (X̄ − C)²)]
K = จำนวนข้อสอบที่เลือก
p_i = สัดส่วนผู้ตอบถูกข้อที่ i (คำนวณจากผู้สอบทั้งหมด)
q_i = 1 − p_i
S² = Population Variance ของคะแนนรวม (หารด้วย N)
X̄ = ค่าเฉลี่ยคะแนนรวม
C = คะแนนเกณฑ์ที่ปรับตามจำนวนข้อที่เลือก
ทำไมต้องใช้ Lovett แทน KR-20? KR-20 ใช้ S² เพียงอย่างเดียวเป็นตัวหาร เหมาะกับแบบทดสอบอิงกลุ่ม ส่วน Lovett ใช้ S² + (X̄ − C)² ซึ่งคำนึงถึงระยะห่างระหว่างค่าเฉลี่ยกับคะแนนเกณฑ์ด้วย จึงเหมาะกับแบบทดสอบอิงเกณฑ์โดยเฉพาะ
ส่วนที่ 4

เกณฑ์การตัดสินคุณภาพ

เกณฑ์ค่าอำนาจจำแนก (B)
≥ 0.40
จำแนกได้ดีมาก
0.30–0.39
จำแนกได้ดี
0.20–0.29
จำแนกได้พอใช้
< 0.20
จำแนกได้ไม่ดี
(ควรปรับปรุงหรือตัดออก)
เกณฑ์ค่าความเชื่อมั่น Lovett (ρ_c)
ค่า ρ_cระดับคุณภาพคำแนะนำ
≥ 0.90ดีมากแบบทดสอบมีความเชื่อมั่นสูงมาก เหมาะสำหรับการตัดสินใจที่สำคัญ
0.80–0.89ดีมีความเชื่อมั่นดี เหมาะสำหรับการใช้งานทั่วไป
0.70–0.79พอใช้ยังพอใช้ได้ แต่ควรพิจารณาปรับปรุงข้อสอบ
< 0.70ต้องปรับปรุงความเชื่อมั่นต่ำ ควรตรวจสอบและแก้ไขข้อสอบ
ส่วนที่ 5

รูปแบบข้อมูลนำเข้า

โครงสร้างข้อมูล (ตัวอย่าง 3 ผู้สอบ, 5 ข้อ)

แถวที่ 1–N = คำตอบผู้สอบ (1 แถว/คน) | แถวสุดท้าย = เฉลย

ผู้สอบ 1:  1  2  3  4  1
ผู้สอบ 2:  2  2  1  4  3
ผู้สอบ 3:  1  3  3  2  1
เฉลย:     1  2  3  4  1
นำเข้าจาก Excel
  1. เปิดไฟล์ Excel ของคุณ
  2. ตรวจสอบว่าไม่มีหัวคอลัมน์
  3. คัดลอก (Ctrl+C) ทุกเซลล์ที่ต้องการ
  4. คลิกแท็บ "วาง (Paste) จากตาราง"
  5. วาง (Ctrl+V) ในช่องข้อความ
  6. คลิก "ประมวลผลข้อมูล"
นำเข้าจากไฟล์ CSV
  1. เตรียมไฟล์ .csv โดยไม่มีหัวคอลัมน์
  2. คลิกแท็บ "นำเข้าไฟล์ Excel/CSV"
  3. ลากไฟล์มาวางในพื้นที่ที่กำหนด หรือ
  4. คลิกเพื่อเปิด File Browser
  5. ระบบจะโหลดข้อมูลอัตโนมัติ
ส่วนที่ 6

การอ่านและตีความผลลัพธ์

ตัวอย่างการตีความผล

สมมติผลการวิเคราะห์ข้อที่ 5: B = 0.35, P_M = 0.85, P_NM = 0.50

  • กลุ่มผ่านเกณฑ์ตอบถูก 85% (P_M = 0.85)
  • กลุ่มไม่ผ่านเกณฑ์ตอบถูก 50% (P_NM = 0.50)
  • ค่า B = 0.85 − 0.50 = 0.35จำแนกได้ดีผ่าน
  • ความหมาย: ข้อนี้สามารถแยกผู้ที่รู้จากผู้ที่ไม่รู้ได้ดี ควรเก็บไว้ใช้
ข้อควรระวังในการตีความ :
  • ค่า B ที่เป็นลบ หมายความว่ากลุ่มไม่ผ่านเกณฑ์ตอบถูกมากกว่า → ข้อสอบมีปัญหาร้ายแรง ควรตรวจสอบเฉลย
  • ค่า B ที่เป็นศูนย์ หมายความว่าทั้งสองกลุ่มตอบถูกเท่ากัน → ไม่มีอำนาจจำแนก
  • หากกลุ่มใดกลุ่มหนึ่งมีขนาดเล็กมาก (เช่น < 5 คน) ค่า B อาจไม่เสถียร ควรตีความด้วยความระมัดระวัง
ส่วนที่ 7

คำถามที่พบบ่อย (FAQ)

ต้องใช้ผู้สอบขั้นต่ำกี่คน?
ระบบกำหนดขั้นต่ำ 4 คน แต่ในทางวิชาการแนะนำ 30 คนขึ้นไป เพื่อให้ผลการวิเคราะห์มีความเสถียรและน่าเชื่อถือ หากมีผู้สอบน้อยกว่า 20 คน ค่า B และ ρ_c อาจมีความแปรปรวนสูง
หากไม่มีกลุ่มผ่านเกณฑ์หรือกลุ่มไม่ผ่านเกณฑ์เลยจะเกิดอะไรขึ้น?
หากผู้สอบทุกคนผ่านเกณฑ์หรือทุกคนไม่ผ่านเกณฑ์ ค่า B จะคำนวณไม่ได้ (กลุ่มขนาด 0) ระบบจะแสดงค่า 0.000 ซึ่งหมายความว่าไม่มีอำนาจจำแนก ในกรณีนี้ควรทบทวนความเหมาะสมของคะแนนเกณฑ์
ทำไม Lovett แตกต่างจาก KR-20?
KR-20 วัดความสอดคล้องภายในโดยใช้ Variance เพียงอย่างเดียว เหมาะกับแบบทดสอบอิงกลุ่ม Lovett ปรับปรุงโดยเพิ่มระยะห่างระหว่างค่าเฉลี่ยกับคะแนนเกณฑ์ (X̄ − C)² ในตัวหาร ทำให้เหมาะกับแบบทดสอบอิงเกณฑ์มากกว่า เมื่อ X̄ ห่างจาก C มาก ค่า Lovett จะสูงกว่า KR-20
ควรกำหนด Cut Score เท่าไหร่?
ขึ้นอยู่กับวัตถุประสงค์ของการทดสอบ ในทางปฏิบัตินิยมใช้ 60–80% ของคะแนนเต็ม เช่น 60% สำหรับการเรียนทั่วไป 70% สำหรับการวัดความรู้พื้นฐาน และ 80% สำหรับมาตรฐานวิชาชีพ ที่สำคัญคือต้องกำหนดก่อนทำการสอบ ไม่ใช่ปรับหลังดูผล
ข้อสอบที่ B < 0.20 ควรทำอะไร?
มี 3 ทางเลือก: (1) ตัดออก จากแบบทดสอบ (2) ปรับปรุงข้อสอบ โดยตรวจสอบความตรงของเนื้อหา ความชัดเจนของภาษา และความเหมาะสมของตัวเลือก (3) เก็บไว้ หากจำเป็นต้องวัดเนื้อหานั้น แต่ไม่นำมาคำนวณ Lovett
ข้อมูลจะถูกบันทึกไว้นานแค่ไหน?
ข้อมูลถูกเก็บใน Session ของเบราว์เซอร์ชั่วคราว เมื่อปิดเบราว์เซอร์หรือ Session หมดอายุ ข้อมูลจะถูกล้าง ไม่มีการบันทึกข้อมูลลงในฐานข้อมูลถาวร ทำให้มีความเป็นส่วนตัวสูง
สามารถใช้กับข้อสอบอัตนัยได้หรือไม่?
ระบบนี้ออกแบบมาเพื่อข้อสอบปรนัย (Multiple Choice) โดยเฉพาะ สำหรับข้อสอบอัตนัย จะต้องแปลงเป็นคะแนน 0/1 (ผ่าน/ไม่ผ่าน) ก่อน แต่วิธีนี้อาจทำให้ข้อมูลสูญเสียความละเอียด
ส่วนที่ 8

เคล็ดลับการใช้งาน

เพื่อประสิทธิภาพสูงสุด
  • เตรียมข้อมูลใน Excel ก่อนแล้วค่อย Paste เพื่อความรวดเร็ว
  • ตรวจสอบเฉลยให้ถูกต้องก่อนวิเคราะห์เสมอ
  • ใช้เบราว์เซอร์ Chrome หรือ Firefox เพื่อผลลัพธ์ที่ดีที่สุด
  • หน้าจอกว้างจะเห็นตารางได้ครบถ้วนกว่า
เพื่อความน่าเชื่อถือของผล
  • ควรมีผู้สอบอย่างน้อย 30 คน ขึ้นไป
  • กำหนด Cut Score ก่อนสอบ ไม่ปรับหลังดูผล
  • ทดสอบซ้ำด้วยกลุ่มตัวอย่างใหม่เพื่อยืนยันผล
  • อ้างอิงเอกสารวิชาการที่ระบบแสดงให้ครบถ้วน
สำหรับงานวิจัย
  • ใช้ปุ่ม "คัดลอกข้อความ" เพื่อนำผลไปใส่ในบทที่ 3
  • ระบบสร้างรายงานผลครบตามรูปแบบงานวิจัย
  • ใช้การอ้างอิง APA ที่ระบบจัดให้ได้ทันที
  • บันทึกหน้าจอ (Screenshot) กราฟเพื่อใส่ในรายงาน
ข้อผิดพลาดที่พบบ่อย
  • ลืมใส่แถวเฉลย (แถวสุดท้ายของข้อมูล)
  • จำนวนคอลัมน์ไม่ตรงกับจำนวนข้อสอบที่กำหนด
  • ใส่ตัวอักษรแทนตัวเลข (A, B แทน 1, 2)
  • มีเซลล์ว่างในข้อมูล ควรใส่ 0 แทน
การอ้างอิง APA สำหรับโปรแกรมนี้
วุฒิไกร ป้อมมะรัง. (2569). โปรแกรมวิเคราะห์คุณภาพแบบทดสอบแบบอิงเกณฑ์ Academic 1.0 [โปรแกรมคอมพิวเตอร์]. https://statsmartly.com/statistical/TestCriterion.php