การสอบแทบทุกครั้ง เรากำลังฝากความหวัง ฝากอนาคตของเราไว้กับรอยดินสอสีดำที่เราค่อยๆ ฝนมันจนเต็ม
เราน่าจะพอจำความรู้สึกตอนรับกระดาษขาวๆ เราคงพอจำกลิ่นใหม่ๆ ผิวกระดาษเรียบลื่นรับมาเสร็จก็ต้องรีบนึกว่าดินสอสองบีของเราเหลามาเรียบร้อยรึยังนะ ยางลบพร้อมมั้ย เราฝนดีแล้วรึยังนะ ฝนรายละเอียดส่วนตัว เรื่อยไปจนกระทั่งทำข้อสอบเสร็จ เรากำลังถูกทดสอบด้วยรอยสีดำเหล่านี้แหละ ก่อนส่งก็กวาดสายตาว่าเราฝนดีแล้วรึยัง ในใจก็แอบคิดว่า เจ้าเครื่องตรวจมันจะได้เรื่องได้ราวไหมนะ อนาคตของเราขึ้นอยู่กับเจ้าเครื่องจักรนี่พอสมควรนะเนี่ย
ข้อสอบแบบช้อยส์ (multiple choice test) ดูจะเป็นวิธีการทดสอบที่เด็กไทยคุ้นเคย ถ้าเป็นโรงเรียนเล็กๆ เราก็จะคุ้นกับแผ่นคำตอบที่เต็มไปด้วยตาราง เรากากบาทลงไป และคุณครูก็จะตรวจด้วยกระดาษที่ถูกเจาะเป็นรู—สะดวก รวดเร็ว—ในโรงเรียนที่ใหญ่ขึ้น การสอบระดับมหาวิทยาลัยไปจนถึงการทดสอบระดับชาติ ในการวัดผลคนจำนวนมหาศาล สถาบันการศึกษาและหน่วยงานด้านการวัดผลทั้งหลายก็เลยต้องพึ่งเทคโนโลยี พึ่งเครื่องตรวจและประมวลคะแนนอัตโนมัติ เป็นระบบการฝนข้อสอบด้วยดินสอสองบีอย่างที่เราคุ้นเคยกัน
เจ้าข้อสอบกากบาทที่เรารักและคุ้นเคยถือเป็นอีกหนึ่งนวัตกรรมเมื่อโลกของการศึกษากลายเป็นเรื่องของมวลชน เมื่อนักการศึกษาต้องการข้อสอบที่ ‘เป็นมาตรฐาน’ ต้องการข้อสอบวัดผลโดยที่ ‘ไม่มีอคติ’ อยู่ในนั้น ในช่วงทศวรรษ 1900s ข้อสอบช้อยส์เป็นผลผลิตที่พอดีกับปริมาณนักเรียนที่เพิ่มขึ้น สงครามโลกครั้งที่ 1 และการเกิดขึ้นของเครื่องจักรเทคโนโลยี
ข้อสอบที่ไม่มี ‘ความรู้สึก’?
แต่ดั้งเดิมการวัดผลทางการศึกษา—การทดสอบ—มักทำด้วยการเขียนข้อความ จนกระทั่งในปี 1914 คุณ Frederick J. Kelly ชายที่ถือกันว่าเป็นบิดาของข้อสอบแบบตัวเลือก ในปีนั้นเอง แกเพิ่งจบปริญญาเอกจาก Kansas State Teacher’s College ด้วยความที่เรียนทางการศึกษา แกพบว่า ในการทดสอบ คุณครูแต่ละคนดูจะมีการให้คะแนนหรือประเมินผลที่ค่อนข้างแตกต่างกันไป ในตอนนั้นอคติทางเพศก็ยังมีมากอยู่เนอะ แกมองว่า เช่นในครูผู้หญิงอาจจะมีความเอนเอียง มีอคติบางอย่างอยู่ในนั้น เพื่อเป็นการวัดผลที่ไม่มีอารมณ์ เที่ยงตรง แกเลยออกแบบข้อสอบที่ ‘มีชุดคำตอบ’ ที่ถูกต้องไว้ก่อนแล้ว
ตัวข้อสอบช้อยส์ชุดแรกที่แกออกแบบก็ดูจะเป็นต้นแบบข้อสอบแบบที่เราคุ้นเคยกันดีในปัจจุบัน คือเป็นคำถาม เช่น โจทย์บอกว่า จงวงกลมรอบสัตว์ที่มีประโยชน์ในฟาร์ม ตัวคำตอบก็มีวัว เสือ หนู หมาป่า การทดสอบแบบนี้สามารถทดสอบความเข้าใจโจทย์ว่าเออ ให้วงกลมนะ แล้วก็ทดสอบความรู้จากสิ่งที่โจทย์กำลังถาม เด็กต้องทำตามทั้งสองอย่างถึงถือว่าสัมฤทธิ์ คือวงกลมไปที่วัวเลยจ้า ผลคือการออกแบบข้อสอบแบบนี้ได้ประสิทธิภาพสูง แจกโจทย์ไปได้เป็นสิบเป็นร้อยแผ่น เด็กก็นั่งทำเงียบๆ ไป ตอนตรวจก็ง่าย ให้คะแนนรวดเร็ว แถมตอบโจทย์ที่คุณ Frederick ตั้งไว้คือเป็นมาตรฐานเดียวกันหมด ไม่มีแกว่งไปตามผู้สอน
ประจวบเหมาะกับช่วงปี 1917-1918 สหรัฐกำลังเผชิญกับสงครามโลก ในช่วงนั้นทางการต้องการคนจำนวนมากเพื่อเข้าไปรบในสนามรบคุณหมอ Robert Yerkes ประธานสมาคมจิตแพทย์เลยได้รับมอบหมายให้ออกแบบชุดการทดสอบเพื่อใช้ทดสอบวัดผลคัดเลือกคนเข้าไปยังส่วนต่างๆ ชุดทดสอบนั้นถือว่าเป็นการทดสอบ IQ ชุดแรก (ที่ถือกันว่าเป็นบททดสอบที่อาจจะไม่แฟร์เท่าไหร่ เช่นคนผิวดำอาจจะทำคะแนนได้แย่กว่าแล้วถูกส่งไปแนวหน้าโลด) ในสมัยนั้นทางการใช้แบบทดสอบดังกล่าวคัดคนเข้ากองทัพไป 1.7 ล้านคน
หลังจากนั้นการทดสอบแบบตัวเลือกก็ได้รับความนิยมและขยายตัวกลับเข้าสู่โลกของการศึกษา
คำตอบ 4 ข้อ กับข้อจำกัดของเครื่องจักร
ส่วนหนึ่งที่ข้อสอบช้อยส์มักจะมี 4 หรือสูงสุดที่ 5 ตัวเลือก เกิดข้อจำกัดทางเทคโนโลยีและนวัตกรรม ‘เครื่องตรวจข้อสอบ’ เจ้าเครื่องต้นแบบที่สามารถตรวจข้อสอบได้จาก ‘รอยดินสอ’ แบบที่เราคุ้นเคยที่ถูกประดิษฐ์ขึ้นตั้งแต่ปี 1937 ถือเป็นอีกหนึ่งนวัตกรรมที่คงเค้าเดิมและใช้กันอย่างแพร่หลายยาวนาน
เครื่องตรวจข้อสอบเครื่องแรกได้รับการจดสิทธิบัตรโดย Reynold Johnson ในนาม “scoring apparatus.” จักรกลแห่งการให้คะแนน คุณ Reynold Johnson คือครูสอนวิชาฟิสิกส์ที่ทดลองออกแบบเครื่องจักรเพื่อใช้ตรวจคะแนนเด็กๆ แบบอัตโนมัติ ตัวเครื่องจักรที่ว่าทำงานด้วยการเทียบรอยดินสอเข้ากับชุดคำตอบ (key) ที่ถูกวางเอาไว้ ตัวเครื่องนี้กลายเป็นต้นแบบเครื่องตรวจข้อสอบของ IBM รุ่น 805 Test Scoring Machine ออกวางจำหน่ายในปี 1937 เครื่องจักรที่มากับคำโฆษณาว่า “รวดเร็ว แม่นยำ มีประสิทธิภาพ ประหยัดเวลา และประหยัดแรงงาน”
เจ้าเครื่องตรวจข้อสอบก็ได้รับการพัฒนามาเรื่อยๆ ในปี 1955 ศาสตราจารย์ Everett F. Lindquist เสนอและจดสิทธิบัตรวิธีการตรวจจำคำตอบที่ถูกต้องด้วยการใช้ ‘การฝน’ โดยที่วัดประจุไฟฟ้า คือเครื่องจะตรวจจับและให้คะแนนจากรอยคาร์บอนจากดินสอ วิธีการตรวจข้อคาร์บอนนี้นำมาสู่เครื่องจักรทันสมัยในปัจจุบันที่ใช้หลักการเดียวกัน หนึ่งในการออกแบบนี้นำไปสู่การออกแบบกระดาษคำตอบที่มีพื้นที่จำกัดและเพื่อประสิทธิภาพตามที่เครื่องจะสามารถตรวจได้ ช้อยส์ที่วางไว้มักจะสิ้นสุดที่ 5-6 คำตอบ
สำหรับบ้านเราเอง เครื่องตรวจข้อสอบยุคแรกก็ใช้หลักการเดียวกัน ส่งผลให้เราคุ้นกับการพก 2 B ในวันสอบ ในขณะที่เทคโนโลยีตรวจข้อสอบในยุคหลังเป็นการใช้การวัดจากแสงสะท้อน คือใช้การฉายแสงลงไปที่กระดาษและตรวจจับจากสีที่ถูกระบายไว้
ทีนี้ จากประวัติศาสตร์ที่ไม่ยาวนานนักของการออกแบบข้อสอบตัวเลือกและเครื่องจักรแห่งการให้คะแนน สิ่งที่ส่งผลกับเราอย่างแท้จริงคือ เวลาที่เราเลือกคำตอบ เราเชื่อคำตอบ ‘แวบแรก’ ได้จริงไหม เรามักรู้สึกว่าเวลาที่เราเลือก แล้วลบ ทุกครั้งที่เราเปลี่ยนคำตอบมักเป็นการเปลี่ยนจากคำตอบที่ถูกแล้วเป็นผิดเสมอ
มีงานศึกษาหลายชุดเห็นตรงกันว่า ‘ไม่จริง’ เราแค่จำได้แต่การเปลี่ยนจากคำตอบที่ถูกเป็นผิดเท่านั้น หนึ่งในงานทดลองพบว่าการเปลี่ยนคำตอบที่เราเปลี่ยนจากถูกเป็นผิดอยู่ที่ 20.2% ในขณะที่จากผิดเป็นถูกอยู่ที่ 57.8% แต่การเปลี่ยนแบบแรก แบบที่เรารู้สึกว่า ‘ตูว่าแล้ว’ เป็นสิ่งที่มักจะตราตรึงอยู่ในใจมากกว่าอย่างหลังนั่นเอง
อ้างอิงข้อมูลจาก