คู่มือการใช้งาน — โปรแกรมวิเคราะห์คุณภาพแบบทดสอบแบบอิงเกณฑ์

ส่วนที่ 1

ภาพรวมระบบ

ระบบนี้คืออะไร?

โปรแกรมวิเคราะห์คุณภาพแบบทดสอบแบบอิงเกณฑ์ (Criterion-Referenced Test Analysis) เป็นเครื่องมือออนไลน์ที่ช่วยให้ครู อาจารย์ และนักวัดผลสามารถวิเคราะห์คุณภาพข้อสอบแบบอิงเกณฑ์ได้อย่างถูกต้องตามหลักวิชาการ โดยไม่ต้องใช้โปรแกรมสถิติที่ซับซ้อน

ระบบทำอะไรได้บ้าง?

คำนวณค่าอำนาจจำแนก (B) รายข้อ
จำแนกกลุ่มผ่านเกณฑ์ / ไม่ผ่านเกณฑ์ อัตโนมัติ
คำนวณความเชื่อมั่นสูตร Lovett (ρ_c)
สร้างรายงานผลวิจัยพร้อมคัดลอกและพิมพ์
นำเข้าข้อมูลจากExcel / CSV
แสดงผลกราฟแท่งค่าอำนาจจำแนกแบบ Interactive

เหมาะสำหรับใคร?

ครู / อาจารย์ ที่ต้องการตรวจสอบคุณภาพข้อสอบ
นักวิจัย ด้านการวัดและประเมินผลทางการศึกษา
นักศึกษา ที่เรียนวิชาการวัดผลและวิจัยทางการศึกษา
นักวัดผล ในหน่วยงานสถาบันต่าง ๆ
ผู้ออกข้อสอบ มาตรฐานวิชาชีพและใบอนุญาต

ข้อแตกต่างที่สำคัญ : การวิเคราะห์แบบอิงเกณฑ์ (Criterion-Referenced) แตกต่างจากแบบอิงกลุ่ม (Norm-Referenced) ตรงที่ไม่ใช้ค่าความยาก (p) และไม่แบ่งกลุ่มสูง–ต่ำ 27% แต่แบ่งตามคะแนนเกณฑ์ที่กำหนดไว้ล่วงหน้า

ส่วนที่ 2

ขั้นตอนการใช้งานทั้งหมด

ระบบแบ่งการทำงานออกเป็น 5 ขั้นตอน ตามลำดับ ดังนี้

1

กำหนดรายละเอียดแบบทดสอบ

ป้อนข้อมูลพื้นฐานของแบบทดสอบ ได้แก่ จำนวนข้อสอบ จำนวนตัวเลือก จำนวนผู้สอบ และ คะแนนเกณฑ์ผ่าน (Cut Score)

2

ป้อนข้อมูลคำตอบและเฉลย

ป้อนคำตอบของผู้สอบแต่ละคนและเฉลยถูกต้อง รองรับทั้งการพิมพ์มือ วาง (Paste) จากตาราง Excel และนำเข้าไฟล์

3

ดูผลการวิเคราะห์รายข้อ

ระบบแสดงผลค่าอำนาจจำแนก (B) และระดับคุณภาพ พร้อมจำนวนผู้ตอบถูกในแต่ละกลุ่ม ในรูปแบบตารางที่ชัดเจน

4

เลือกข้อสอบที่ต้องการคำนวณ Lovett

เลือกข้อสอบที่ต้องการรวมในการคำนวณค่าความเชื่อมั่น Lovett ระบบช่วยทำเครื่องหมายข้อที่ผ่านเกณฑ์ไว้แล้ว

5

ดูค่าความเชื่อมั่น Lovett (ρ_c)

ระบบคำนวณค่าความเชื่อมั่น Lovett พร้อมรายงานผลวิชาการที่สมบูรณ์ สามารถคัดลอกหรือพิมพ์เพื่อใส่ในงานวิจัยได้ทันที

ขั้นตอนที่ 1

กำหนดรายละเอียดแบบทดสอบ

ช่องข้อมูล	คำอธิบาย	ตัวอย่าง
จำนวนข้อสอบ	จำนวนข้อทั้งหมดในแบบทดสอบ (≥ 2)	30
จำนวนตัวเลือกต่อข้อ	จำนวนตัวเลือก A, B, C, D... (≥ 2)	4
จำนวนผู้สอบ	จำนวนนักเรียน/ผู้สอบทั้งหมด (≥ 4)	35
เกณฑ์ผ่าน (%)	ร้อยละของคะแนนเต็มที่กำหนดเป็นจุดผ่าน	70

สำคัญ — เกณฑ์ผ่าน (Cut Score): ต้องกำหนดก่อนทำการสอบ ไม่ควรปรับเปลี่ยนภายหลัง เช่น กำหนดที่ 70% หมายความว่าผู้ที่ได้คะแนน ≥ 70% ของคะแนนเต็มจัดเป็น กลุ่มผ่านเกณฑ์ (Mastery Group)

ระบบจะคำนวณ Cut Score จริง = เกณฑ์ (%) × จำนวนข้อสอบ ÷ 100 โดยอัตโนมัติ เช่น เกณฑ์ 70% ใน 30 ข้อ = Cut Score 21 คะแนน

ขั้นตอนที่ 2

ป้อนข้อมูลคำตอบและเฉลย

มี 3 วิธี ในการป้อนข้อมูล สามารถเลือกวิธีที่สะดวกที่สุด

วิธีที่ 1 — พิมพ์มือ

คลิกที่แต่ละช่องในตารางและพิมพ์หมายเลขคำตอบ (1, 2, 3, 4...) ทีละช่อง เหมาะสำหรับข้อมูลจำนวนน้อย

วิธีที่ 2 — วางจาก Excel

คัดลอกข้อมูลจาก Excel แล้ววางในพื้นที่ Paste ระบบจะแปลงข้อมูลให้อัตโนมัติ รองรับทั้ง Tab-delimited และ CSV

วิธีที่ 3 — นำเข้าไฟล์

ลากและวางไฟล์ .xlsx หรือ .csv ลงในพื้นที่ที่กำหนด ระบบจะอ่านและโหลดข้อมูลทันที

รูปแบบข้อมูลที่ถูกต้อง : แต่ละแถวคือผู้สอบ 1 คน แต่ละคอลัมน์คือข้อสอบ 1 ข้อ ค่าในแต่ละช่องคือหมายเลขตัวเลือกที่เลือก (1, 2, 3, 4) โดย แถวสุดท้าย ต้องเป็นเฉลย เสมอ

ข้อควรระวัง : ตรวจสอบให้แน่ใจว่าจำนวนคอลัมน์ตรงกับจำนวนข้อสอบที่กำหนดในขั้นที่ 1 และจำนวนแถวตรงกับจำนวนผู้สอบ (ไม่นับแถวเฉลย)

ขั้นตอนที่ 3

ผลการวิเคราะห์รายข้อ

หน้านี้แสดงค่าอำนาจจำแนก (B) ของทุกข้อสอบในรูปแบบตาราง พร้อมรายละเอียด ดังนี้

คอลัมน์	ความหมาย
ข้อที่	หมายเลขข้อสอบ
การกระจายตัวเลือก	จำนวนผู้เลือกตอบแต่ละตัวเลือก (ตัวเลือกถูกแสดงสีทอง)
M (กลุ่มผ่านเกณฑ์)	จำนวนผู้ตอบถูกในกลุ่มที่ผ่านเกณฑ์
NM (กลุ่มไม่ผ่านเกณฑ์)	จำนวนผู้ตอบถูกในกลุ่มที่ไม่ผ่านเกณฑ์
P_M	สัดส่วนผู้ตอบถูกในกลุ่ม Mastery
P_NM	สัดส่วนผู้ตอบถูกในกลุ่ม Non-mastery
B (ค่าอำนาจจำแนก)	= P_M − P_NM ยิ่งสูงยิ่งดี (ช่วง −1 ถึง +1)
ระดับ	การแปลความหมายของค่า B
คุณภาพ	ผ่าน (B ≥ 0.20) / ไม่ผ่าน (B < 0.20)

แถวที่ผ่านเกณฑ์จะมีเส้นสีเขียวทางซ้ายของแถว แถวที่ไม่ผ่านเกณฑ์จะมีเส้นสีแดง ทำให้มองเห็นได้ง่าย

ขั้นตอนที่ 4

เลือกข้อสอบเพื่อคำนวณ Lovett

ขั้นตอนนี้ให้เลือกข้อสอบที่ต้องการนำมาคำนวณค่าความเชื่อมั่น Lovett (ρ_c)

วิธีเลือกข้อสอบ

ข้อที่ กรอบสีเขียว = ข้อที่ผ่านเกณฑ์ (B ≥ 0.20) ถูกเลือกไว้ล่วงหน้าแล้ว
สามารถ คลิกเพื่อเลือก/ยกเลิก แต่ละข้อได้อิสระ
ต้องเลือก อย่างน้อย 2 ข้อ จึงจะคำนวณ Lovett ได้
โดยทั่วไปนิยมเลือก เฉพาะข้อที่ผ่านเกณฑ์ เพื่อให้ได้แบบทดสอบที่มีคุณภาพ

เคล็ดลับ : หากต้องการเปรียบเทียบค่าความเชื่อมั่นระหว่างชุดข้อสอบต่าง ๆ ให้บันทึกผลหลังการเลือกแต่ละชุด แล้วเปรียบเทียบค่า ρ_c ที่ได้

ขั้นตอนที่ 5

ค่าความเชื่อมั่น Lovett (ρ_c)

หน้าสุดท้ายแสดงผลลัพธ์ครบถ้วน ประกอบด้วย

ผลลัพธ์หลัก

ค่า ρ_c (Lovett Reliability) พร้อมระดับคุณภาพ
จำนวนกลุ่มผ่านเกณฑ์ / ไม่ผ่านเกณฑ์
สถิติสรุป: Mean, Variance, Cut Score จริง
กราฟแท่งค่า B รายข้อของข้อที่เลือก
สรุปคุณภาพรายข้อ

รายงานผลวิจัย

รายงานผลฉบับสมบูรณ์พร้อมนำเสนอในงานวิจัย
ปุ่ม "คัดลอกข้อความ" — คัดลอกข้อความทั้งหมดรวมตาราง
ปุ่ม "พิมพ์รายงาน" — พิมพ์รายงานในรูปแบบเอกสาร
เอกสารอ้างอิง APA ครบถ้วน

สามารถเริ่มการวิเคราะห์ใหม่ได้โดยคลิกปุ่ม "เริ่มการวิเคราะห์ใหม่" ที่ด้านล่างของหน้า ระบบจะล้างข้อมูลทั้งหมดและกลับไปขั้นตอนที่ 1

ส่วนที่ 3

สูตรและทฤษฎีที่ใช้

สูตรค่าอำนาจจำแนก (B) — Berk (1980); Cox & Vargas (1966)

B = P_M − P_NM

P_M = สัดส่วนผู้ตอบถูกในกลุ่มผ่านเกณฑ์ (Mastery Group)
P_NM = สัดส่วนผู้ตอบถูกในกลุ่มไม่ผ่านเกณฑ์ (Non-mastery Group)
ช่วงค่า: −1 ≤ B ≤ 1 (ยิ่งสูงใกล้ +1 ยิ่งดี)

สูตรความเชื่อมั่น Lovett (ρ_c) — Livingston (1972)

ρ_c = K/(K−1) × [1 − Σ(p_i·q_i) / (S² + (X̄ − C)²)]

K = จำนวนข้อสอบที่เลือก
p_i = สัดส่วนผู้ตอบถูกข้อที่ i (คำนวณจากผู้สอบทั้งหมด)
q_i = 1 − p_i
S² = Population Variance ของคะแนนรวม (หารด้วย N)
X̄ = ค่าเฉลี่ยคะแนนรวม
C = คะแนนเกณฑ์ที่ปรับตามจำนวนข้อที่เลือก

ทำไมต้องใช้ Lovett แทน KR-20? KR-20 ใช้ S² เพียงอย่างเดียวเป็นตัวหาร เหมาะกับแบบทดสอบอิงกลุ่ม ส่วน Lovett ใช้ S² + (X̄ − C)² ซึ่งคำนึงถึงระยะห่างระหว่างค่าเฉลี่ยกับคะแนนเกณฑ์ด้วย จึงเหมาะกับแบบทดสอบอิงเกณฑ์โดยเฉพาะ

ส่วนที่ 4

เกณฑ์การตัดสินคุณภาพ

เกณฑ์ค่าอำนาจจำแนก (B)

≥ 0.40

จำแนกได้ดีมาก

0.30–0.39

จำแนกได้ดี

0.20–0.29

จำแนกได้พอใช้

< 0.20

จำแนกได้ไม่ดี
(ควรปรับปรุงหรือตัดออก)

เกณฑ์ค่าความเชื่อมั่น Lovett (ρ_c)

ค่า ρ_c	ระดับคุณภาพ	คำแนะนำ
≥ 0.90	ดีมาก	แบบทดสอบมีความเชื่อมั่นสูงมาก เหมาะสำหรับการตัดสินใจที่สำคัญ
0.80–0.89	ดี	มีความเชื่อมั่นดี เหมาะสำหรับการใช้งานทั่วไป
0.70–0.79	พอใช้	ยังพอใช้ได้ แต่ควรพิจารณาปรับปรุงข้อสอบ
< 0.70	ต้องปรับปรุง	ความเชื่อมั่นต่ำ ควรตรวจสอบและแก้ไขข้อสอบ

ส่วนที่ 5

รูปแบบข้อมูลนำเข้า

โครงสร้างข้อมูล (ตัวอย่าง 3 ผู้สอบ, 5 ข้อ)

แถวที่ 1–N = คำตอบผู้สอบ (1 แถว/คน) | แถวสุดท้าย = เฉลย

            ผู้สอบ 1:  1  2  3  4  1

            ผู้สอบ 2:  2  2  1  4  3

            ผู้สอบ 3:  1  3  3  2  1

            เฉลย:     1  2  3  4  1

นำเข้าจาก Excel

เปิดไฟล์ Excel ของคุณ
ตรวจสอบว่าไม่มีหัวคอลัมน์
คัดลอก (Ctrl+C) ทุกเซลล์ที่ต้องการ
คลิกแท็บ "วาง (Paste) จากตาราง"
วาง (Ctrl+V) ในช่องข้อความ
คลิก "ประมวลผลข้อมูล"

นำเข้าจากไฟล์ CSV

เตรียมไฟล์ .csv โดยไม่มีหัวคอลัมน์
คลิกแท็บ "นำเข้าไฟล์ Excel/CSV"
ลากไฟล์มาวางในพื้นที่ที่กำหนด หรือ
คลิกเพื่อเปิด File Browser
ระบบจะโหลดข้อมูลอัตโนมัติ

ส่วนที่ 6

การอ่านและตีความผลลัพธ์

ตัวอย่างการตีความผล

สมมติผลการวิเคราะห์ข้อที่ 5: B = 0.35, P_M = 0.85, P_NM = 0.50

กลุ่มผ่านเกณฑ์ตอบถูก 85% (P_M = 0.85)
กลุ่มไม่ผ่านเกณฑ์ตอบถูก 50% (P_NM = 0.50)
ค่า B = 0.85 − 0.50 = 0.35 → จำแนกได้ดี → ผ่าน
ความหมาย: ข้อนี้สามารถแยกผู้ที่รู้จากผู้ที่ไม่รู้ได้ดี ควรเก็บไว้ใช้

ข้อควรระวังในการตีความ :

ค่า B ที่เป็นลบ หมายความว่ากลุ่มไม่ผ่านเกณฑ์ตอบถูกมากกว่า → ข้อสอบมีปัญหาร้ายแรง ควรตรวจสอบเฉลย
ค่า B ที่เป็นศูนย์ หมายความว่าทั้งสองกลุ่มตอบถูกเท่ากัน → ไม่มีอำนาจจำแนก
หากกลุ่มใดกลุ่มหนึ่งมีขนาดเล็กมาก (เช่น < 5 คน) ค่า B อาจไม่เสถียร ควรตีความด้วยความระมัดระวัง

ส่วนที่ 7

คำถามที่พบบ่อย (FAQ)

ต้องใช้ผู้สอบขั้นต่ำกี่คน?

ระบบกำหนดขั้นต่ำ 4 คน แต่ในทางวิชาการแนะนำ 30 คนขึ้นไป เพื่อให้ผลการวิเคราะห์มีความเสถียรและน่าเชื่อถือ หากมีผู้สอบน้อยกว่า 20 คน ค่า B และ ρ_c อาจมีความแปรปรวนสูง

หากไม่มีกลุ่มผ่านเกณฑ์หรือกลุ่มไม่ผ่านเกณฑ์เลยจะเกิดอะไรขึ้น?

หากผู้สอบทุกคนผ่านเกณฑ์หรือทุกคนไม่ผ่านเกณฑ์ ค่า B จะคำนวณไม่ได้ (กลุ่มขนาด 0) ระบบจะแสดงค่า 0.000 ซึ่งหมายความว่าไม่มีอำนาจจำแนก ในกรณีนี้ควรทบทวนความเหมาะสมของคะแนนเกณฑ์

ทำไม Lovett แตกต่างจาก KR-20?

KR-20 วัดความสอดคล้องภายในโดยใช้ Variance เพียงอย่างเดียว เหมาะกับแบบทดสอบอิงกลุ่ม Lovett ปรับปรุงโดยเพิ่มระยะห่างระหว่างค่าเฉลี่ยกับคะแนนเกณฑ์ (X̄ − C)² ในตัวหาร ทำให้เหมาะกับแบบทดสอบอิงเกณฑ์มากกว่า เมื่อ X̄ ห่างจาก C มาก ค่า Lovett จะสูงกว่า KR-20

ควรกำหนด Cut Score เท่าไหร่?

ขึ้นอยู่กับวัตถุประสงค์ของการทดสอบ ในทางปฏิบัตินิยมใช้ 60–80% ของคะแนนเต็ม เช่น 60% สำหรับการเรียนทั่วไป 70% สำหรับการวัดความรู้พื้นฐาน และ 80% สำหรับมาตรฐานวิชาชีพ ที่สำคัญคือต้องกำหนดก่อนทำการสอบ ไม่ใช่ปรับหลังดูผล

ข้อสอบที่ B < 0.20 ควรทำอะไร?

มี 3 ทางเลือก: (1) ตัดออก จากแบบทดสอบ (2) ปรับปรุงข้อสอบ โดยตรวจสอบความตรงของเนื้อหา ความชัดเจนของภาษา และความเหมาะสมของตัวเลือก (3) เก็บไว้ หากจำเป็นต้องวัดเนื้อหานั้น แต่ไม่นำมาคำนวณ Lovett

ข้อมูลจะถูกบันทึกไว้นานแค่ไหน?

ข้อมูลถูกเก็บใน Session ของเบราว์เซอร์ชั่วคราว เมื่อปิดเบราว์เซอร์หรือ Session หมดอายุ ข้อมูลจะถูกล้าง ไม่มีการบันทึกข้อมูลลงในฐานข้อมูลถาวร ทำให้มีความเป็นส่วนตัวสูง

สามารถใช้กับข้อสอบอัตนัยได้หรือไม่?

ระบบนี้ออกแบบมาเพื่อข้อสอบปรนัย (Multiple Choice) โดยเฉพาะ สำหรับข้อสอบอัตนัย จะต้องแปลงเป็นคะแนน 0/1 (ผ่าน/ไม่ผ่าน) ก่อน แต่วิธีนี้อาจทำให้ข้อมูลสูญเสียความละเอียด

ส่วนที่ 8

เคล็ดลับการใช้งาน

เพื่อประสิทธิภาพสูงสุด

เตรียมข้อมูลใน Excel ก่อนแล้วค่อย Paste เพื่อความรวดเร็ว
ตรวจสอบเฉลยให้ถูกต้องก่อนวิเคราะห์เสมอ
ใช้เบราว์เซอร์ Chrome หรือ Firefox เพื่อผลลัพธ์ที่ดีที่สุด
หน้าจอกว้างจะเห็นตารางได้ครบถ้วนกว่า

เพื่อความน่าเชื่อถือของผล

ควรมีผู้สอบอย่างน้อย 30 คน ขึ้นไป
กำหนด Cut Score ก่อนสอบ ไม่ปรับหลังดูผล
ทดสอบซ้ำด้วยกลุ่มตัวอย่างใหม่เพื่อยืนยันผล
อ้างอิงเอกสารวิชาการที่ระบบแสดงให้ครบถ้วน

สำหรับงานวิจัย

ใช้ปุ่ม "คัดลอกข้อความ" เพื่อนำผลไปใส่ในบทที่ 3
ระบบสร้างรายงานผลครบตามรูปแบบงานวิจัย
ใช้การอ้างอิง APA ที่ระบบจัดให้ได้ทันที
บันทึกหน้าจอ (Screenshot) กราฟเพื่อใส่ในรายงาน

ข้อผิดพลาดที่พบบ่อย

ลืมใส่แถวเฉลย (แถวสุดท้ายของข้อมูล)
จำนวนคอลัมน์ไม่ตรงกับจำนวนข้อสอบที่กำหนด
ใส่ตัวอักษรแทนตัวเลข (A, B แทน 1, 2)
มีเซลล์ว่างในข้อมูล ควรใส่ 0 แทน

การอ้างอิง APA สำหรับโปรแกรมนี้
วุฒิไกร ป้อมมะรัง. (2569). โปรแกรมวิเคราะห์คุณภาพแบบทดสอบแบบอิงเกณฑ์ Academic 1.0 [โปรแกรมคอมพิวเตอร์]. https://statsmartly.com/statistical/TestCriterion.php