เมื่อซัก 1-2 เดือนที่ผ่านมา มีข่าวเล็กๆ ข่าวหนึ่งที่ดูเหมือนว่าจะไม่ค่อยมีใครสนใจนัก ข่าวที่ว่าเป็นเรื่องเกี่ยวกับกระบวนการยุติธรรมของไทย รายละเอียดคร่าวๆ คือศาลไทยเริ่มใช้โมเดลทางสถิติในการประเมินการประกันตัวผู้ต้องหา[1] ผมคิดว่าข่าวนี้น่าสนใจ และพอจะบอกอะไรเกี่ยวกับแนวโน้มการใช้ Big Data ในสังคมไทยได้
โครงการดังกล่าวได้นำคดีอาญาประมาณ 1,000 คดีมาวิเคราะห์ด้วยวิธีการทางสถิติ เพื่อวิเคราะห์หาว่าผู้ที่กระผิดในคดีเหล่านี้มีลักษณะอะไรร่วมกัน เมื่อสามารถระบุลักษณะดังกล่าวได้แล้ว ก็นำลักษณะที่พบไปใช้ประเมินผู้ต้องหาในคดีอื่นๆ ในอนาคตต่อไป เช่น สมมติถ้าวิเคราะห์ออกมาได้ว่า จากฐานข้อมูล 1,000 คดีที่ว่า ผู้กระทำผิดล้วนมีรายได้น้อยและมีรอยสัก ในคดีต่อๆ ไป เมื่อศาลต้องพิจารณาว่าจะให้ประกันตัวผู้ต้องหาหรือไม่ ถ้าผู้ต้องหาคนนั้นมีรายได้น้อยและมีรอยสัก โอกาสที่จะได้รับการประกันตัวก็น้อยลง เพราะมีลักษณะ ‘เสี่ยง’ ที่อาจจะหลบหนีการจับกุมหรือก่อเหตุซ้ำอีกในอนาคต
เรื่องนี้ไม่ใช่เรื่องใหม่ ในต่างประเทศโดยเฉพาะอย่างยิ่งในสหรัฐอเมริกา มีการใช้เทคนิคคล้ายกันนี้ วงการตำรวจสหรัฐฯ มีสิ่งที่เรียกว่า ‘การออกตรวจพื้นที่โดยมีการคาดการณ์ล่วงหน้า’ (predictive policing) โดยตำรวจจะใช้โมเดลทางสถิติมาวิเคราะห์ข้อมูลการเกิดอาชญากรรมในพื้นที่ในอดีต เพื่อที่จะคาดการณ์ไปในอนาคตว่า ในพื้นที่ไหนและในช่วงเวลาใดที่มีความเสี่ยงสูงที่จะเกิดเหตุอาชญากรรม เมื่อได้ข้อมูลดังกล่าว ตำรวจก็จะจัดแจงกำลังและตรวจตราพื้นที่นั้นๆ เข้มงวดขึ้นกว่าพื้นที่อื่นๆ โดยหวังว่ามันจะช่วยลดอาชญากรรมในพื้นที่นั้นๆ ลงได้
ตำรวจในเมืองเรดดิ้ง ในมลรัฐเพนซิลเวเนีย ซึ่งใช้โปรแกรมการคาดการณ์อาชญากรรมเช่นนี้ที่ชื่อ PredPol เคลมว่า หลังจากมีการใช้โปรแกรมดังกล่าวในการปรับเปลี่ยนวิธีการออกตรวจตราพื้นที่ เหตุปล้นทรัพย์ในเมืองลดลงกว่า 23% ในช่วงระยะเวลาเพียง 1 ปี
นี่ถือเป็นรูปแบบหนึ่งของการใช้ประโยชน์จาก Big Data ตำรวจสหรัฐฯ ใช้ประโยชน์จากฐานข้อมูลการก่ออาชญากรรมขนาดใหญ่ที่มีอยู่ เพื่อวิเคราะห์หา ‘ความสัมพันธ์’ (correlation) ว่าบุคคลลักษณะไหนมีความเสี่ยงจะก่อเหตุมากกว่าคนอื่น หรือพื้นที่ไหนมีความเสี่ยงจะเกิดอาชญากรรมมากกว่าพื้นที่อื่นๆ
ดูผิวเผินก็เหมือนว่าโครงการลักษณะเช่นนี้เป็นนิมิตรหมายอันดี
ไม่ดีหรอกหรือหากเราสามารถป้องกันเหตุอาชญากรรม หรือระบุตัวอาชญากรได้ก่อนที่เขาหรือเธอจะก่อเหตุเสียอีก ฟังดูก็ไม่ต่างจากโลกอนาคตในภาพยนตร์เรื่อง Monority Report ที่พระเอกขาสั้นอย่าง Tom Cruise สวมบทบาทเป็นตำรวจปราบอาชญากรรมอนาคตในหน่วยงานชื่อ ‘หน่วยปราบอาชญากรรมล่วงหน้า’ (Precrime Division)
“ด้วยอำนาจของหน่วยปราบอาชญากรรมล่วงหน้าแห่งกรุงวอชิงตัน ดี.ซี. ผมขอจับกุมคุณในข้อหาฆาตกรรมในอนาคตที่กำลังจะเกิดขึ้นในวันนี้” Tom Cruise ตะโกนบอกผู้ต้องหาเช่นนั้น ในขณะที่ชายหนุ่มผู้โชคร้ายตะโกนตอบกลับไปว่า “ผมยังไม่ได้ทำอะไรเลย!”
แม้ในปัจจุบัน Big Data จะถูกนำมาใช้ในหลายมิติ โดยเฉพาะอย่างยิ่งในเชิงธุรกิจ และก็ล้วนทำให้ชีวิตของเราในฐานะผู้บริโภคดีขึ้นทั้งสิ้น ตั้งแต่ Amazon ที่นำเอาข้อมูลการเลือกซื้อหนังสือของทุกคนมาใช้สร้างระบบการแนะนำหนังสือที่ตรงกับความต้องการของคนอ่านที่สุด Google ที่นำเอาพฤติกรรมการเสิร์ชของทุกคนมาใช้เพื่อทำให้สามารถแสดงผลลัพธ์ที่ดียิ่งขึ้นสำหรับการค้นหาครั้งต่อๆ ไป หรือแม้แต่ในแวดวงการแพทย์ที่มีการนำข้อมูลรหัสพันธุกรรมทั้งหมดของคนๆ นั้นมาวิเคราะห์เพื่อให้สามารถให้ยาที่ได้ผลดีที่สุดแก่คนไข้ อย่างเช่นที่เคยเกิดขึ้นจริงแล้วเมื่อหลายปีก่อนในกรณีของ Steve Jobs
แต่สำหรับนอกโลกธุรกิจ ผมคิดว่าการนำเทคโนโลยี Big Data มาใช้ไม่น่าจะเหมาะสมนัก โดยเฉพาะกับเรื่องที่เกี่ยวข้องกับความเป็นความตายและอิสรภาพของผู้คน เพราะการใช้ข้อมูลมาช่วยตัดสินใจเช่นนี้ไม่ใช่ว่าไม่มีจุดอ่อน อีกทั้งยังมีความบกพร่องและความลำเอียงไม่ต่างไปจากระบบเดิมที่ใช้เงินประกันเป็นตัวตัดสิน มิหนำซ้ำเมื่อนำมาใช้ในบริบทแบบไทยๆ ก็ยิ่งทำให้ความไม่สมบูรณ์แบบของ Big Data เด่นชัดขึ้นไปอีก
จุดอ่อนอย่างแรกคือการทำเช่นนี้ขัดกับหลักการเรื่องความรับผิดรับชอบ (accountability) โดยพื้นฐาน กล่าวคือโดยปกติแล้ว มนุษย์ต้องรับผิดชอบในสิ่งที่ตนเองได้ ‘กระทำ’ ลงไป
แต่การใช้ Big Data มาช่วยทำนายและตัดสินเท่ากับว่าเราอาจกำลังลงโทษคนบางคนหรือบางกลุ่มจากสิ่งที่เราคิดว่าเขา ‘จะทำ’ ไม่ใช่จากสิ่งที่เขาได้ทำลงไปแล้ว มิหนำซ้ำ นี่ยังเป็นการปฏิเสธแนวคิดเรื่องเจตจำนงเสรีของมนุษย์ (Free will) เพราะเราไม่เชื่อว่าคนที่โมเดลทางคณิตศาสตร์ทำนายว่ามีโอกาส 95% ที่จะก่ออาชญากรรมซ้ำ จะกลับตัวและเดินไปบนเส้นทางที่ดีกว่าที่มีโอกาสเกิดเพียง 5% ตามที่โมเดลได้ทำนายไว้
สองคือการใช้คณิตศาสตร์ไม่ได้ขจัดความลำเอียง แต่ยิ่งเป็นการตอกย้ำถึงความลำเอียงที่มีอยู่แล้วให้ชัดขึ้นอีก ลองนึกถึงกรณีที่โมเดลทำนายว่าเหตุอาชญากรรมจะเกิดขึ้นมากในสลัม เมื่อตำรวจยิ่งเข้าไปตรวจตราในพื้นที่ดังกล่าวมากขึ้น ผลลัพธ์ก็คือมีคนยากจนในสลัมถูกจับกุมมากขึ้น และตัวเลขสถิติก็จะยิ่งกลับไปสะท้อนว่าในพื้นที่สลัมมีเหตุก่ออาชญากรรมเกิดขึ้นมากจริงๆ จึงยิ่งเป็นการตอกย้ำความลำเอียงเดิมที่มีอยู่แล้วในฐานข้อมูลชุดแรกให้เด่นชัดขึ้นไปอีก
ข้อบกพร่องอย่างสุดท้ายคือ ด้วยวิธีการบริหารจัดการและจัดเก็บข้อมูลแบบไทยๆ ไม่มีทางที่เราจะมี Big Data หรืออะไรก็ตามที่ดีพอจะเอาไปใช้ประเมินผู้ต้อหาได้จริง กลุ่มตัวอย่างแค่ประมาณ 1,000 ตัวอย่างที่กระทรวงยุติธรรมใช้ไม่ใหญ่พอที่จะทำให้เรียกว่าเป็น Big Data ได้
การจะใช้ประโยชน์จาก Big Data ได้จริงต้องอยู่บนพื้นฐานของการเข้าถึงข้อมูล ‘ทั้งหมด’ ได้ แต่ศาลในประเทศไทยน่ะเหรอ เอาแค่ข้อมูลว่าผู้ต้องหาคนนี้เคยโดนโทษจำคุกที่ไหนมาก่อนหรือเปล่าก็ไม่มีฐานข้อมูลกลางให้เช็กแล้ว
ผมคิดว่าก่อนที่จะคิดทำอะไรที่ใหญ่เกินตัวกับเทคโนโลยีที่ยังพิสูจน์ไม่ได้ว่าดีจริงและเป็นกลาง เอาแค่เรื่องง่ายๆ อย่างการเชื่อมฐานข้อมูลคดีทั่วประเทศเข้ากันให้ได้ก่อน คนตัวเล็กตัวน้อยจะได้ไม่ต้องเอาอิสรภาพมาจ่ายให้กับความอยากทดลองของคนในระบบราชการไทย
อ้างอิงข้อมูลจาก