ไม่ใช่แค่ในระดับอาเซียน หากแต่ประเทศไทยยังเคยถูกจัดอันดับว่า มีถนนที่อันตรายมากที่สุดในอันดับต้นๆ ของโลก
บทวิเคราะห์จาก The New York Times อธิบายสภาพปัญหาเอาไว้ด้วยว่า ถึงแม้อัตราการเสียชีวิตบนท้องถนนของไทยตั้งแต่ปี พ.ศ.2558 แต่ว่ามันก็การลดลงที่เพียงเล็กน้อยเท่านั้น ขณะเดียวกัน ภาครัฐไทยก็ยังมีกฎหมายและมาตรการต่างๆ ออกมาเพื่อทำให้ถนนปลอดภัยมากยิ่งขึ้น
กลายเป็นคำถามที่น่าสนใจว่า ท่ามกลางมาตรการและกฎหมายที่ออกมา ตลอดจนโครงการรณรงค์ต่างๆ เพื่อลดการสูญเสียบนท้องถนนนั้น สิ่งเหล่านี้ที่มันตอบปัญหาตรงจุดหรือไม่ หรือพูดให้ถึงที่สุดคือ มาตรการเหล่านั้นมีประสิทธิภาพแค่ไหนบ้าง?
คำถามในลักษณะเดียวกันนี้ ตรงกับความสงสัยของ ดร.ณภัทร จาตุศรีพิทักษ์ นักเศรษฐศาสตร์จุลภาคประยุกต์ และผู้ก่อตั้ง บริษัท Siametrics Consulting จำกัด ที่ทำงานด้านกลยุทธ์ข้อมูลปัญญาประดิษฐ์
เขาและทีมงานสนใจปัญหาความสูญเสียบนท้องถนนและอยากจะสร้างทางเลือกในการแก้ไขปัญหา บนพื้นฐานของข้อมูล จึงกลายเป็นโปรเจ็กต์ชื่อว่า ‘Big Data and Ai for Safer Roads’ ที่จับมือกับมูลนิธิศูนย์ข้อมูลจราจรอัจฉริยะ เพื่อสร้างฐานข้อมูลกลาง ที่จะเป็นประโยชน์ต่อการจัดการปัญหาความสูญเสียบนท้องถนนในอนาคต
ทำไมถึงสนใจเรื่อง data อุบัติเหตุ
จริงๆ ผมสนใจเรื่อง data อุบัติเหตุมาตั้งแต่ก่อนตั้งบริษัท Siametrics Consulting อีก ผมอยากเขียนวิทยานิพน์เรื่องนโยบายแก้การแก้ไขปัญหาอุบัติเหตุในไทยตั้งแต่ตอนเรียนปริญญาเอกแล้ว เพื่อสำรวจว่ามันมีประสิทธิภาพมากแค่ไหน ซึ่งตอนนั้นผมพยายามขอข้อมูลมาใช้ แต่พบว่ายากมาก เลยไม่เขียนเรื่องนั้น เพราะไม่อย่างนั้นตอนนี้ก็ยังคงทำวิทยานิพนธ์ไม่จบ
พอกลับมาขี่มอเตอร์ไซค์ที่เมืองไทย ผมก็รู้สึกเลยว่าถ้าไม่ชนจะแปลกมาก มันจะไม่ชนได้ยังไง เวลารถหนาแน่นมาก มันต้องมีอะไรที่ดีกว่านี้ และตอนนี้เราอยู่อันดับ 2 ของโลก มันคือปัญหาระดับโลกไปแล้ว ไม่ใช่แค่ปัญหาในประเทศไทย
เรามีมาตรการออกมาเยอะมากเลย อาจจะขาดบ้างเล็กน้อยเช่นเรื่องการจำกัดความเร็ว แต่เรากลับมีสถิติการตายค่อนข้างเยอะ มันเลยแปลกตรงนี้ และเป็นปริศนาที่น่าสนใจในเชิงวิชาการ
ผมคิดว่ามันน่าเสียดายมากนะ ที่คนตายไปปีนึงอย่างน้อยสองหมื่นกว่าคนเพราะอุบัติเหตุ ญี่ปุ่นประชากรเยอะกว่าเรา แต่ตายน้อยกว่าเราสี่เท่า มันคือเรื่องใหญ่นะ ทุกคนก็แคร์ปัญหา แต่ไม่รู้จะทำยังไง
TDRI เคยทำงานวิจัยว่า ชีวิตคนไทยหนึ่งมีมูลค่าทางเศรษฐกิจกว่าสิบล้านบาท ถ้าเราคูณสถิติการตายไปมันก็เป็นตัวเลขที่เยอะมาก แค่ในปี 2554-2556 รวม ๆ กันแล้วความเสียหายกว่า 5 แสนล้านบาทหรือประมาณ 6 เปอร์เซ็นต์ของ GDP เลย
จากสถิติยังบอกด้วยว่า คนที่ตายเพราะอุบัติเหตุส่วนใหญ่ยังเป็นคนวัยเด็กจนถึงวัยก่อนสามสิบ ซึ่งเราก็มีคนวัยนี้น้อยอยู่แล้ว อย่างที่รู้กันว่าเรากำลังเป็นสังคมสูงวัย ยังไม่รวมเรื่องค่าเสียหายของรถยนต์ หรือการบาดเจ็บด้วยนะ
ถ้าลองไปเช็คกับรายงานของ คปภ. (สำนักงานคณะกรรมการกำกับและส่งเสริมการประกอบธุรกิจประกันภัย) ซึ่งเป็น regulator ของบริษัทประกัน ก็จะพบว่ารถจะชนกันถี่ผิดปกติกว่าประเทศอื่น แล้วมันก็เป็นสิ่งที่ทำให้รถติดขึ้น ทุกวันในกรุงเทพฯ ตอนเย็นๆ มันมีรถชนอยู่แล้ว คนก็เสียเวลาเดินทางไปอีก คือการเกิดอุบัติเหตุที่เยอะมากบนท้องถนน มันส่งผลกระทบต่อหลายเรื่องมาก ทั้งชีวิตและต้นทุนทางเศรษฐกิจและสังคม
พอพูดถึงเรื่องผลกระทบที่ตามมา อยากรู้ว่ามันส่งผลต่อเศรษฐกิจยังไงบ้าง
ระดับมหภาคคือมีคนตาย อย่างเด็กรุ่นน้องกว่าผม เขาฉลาดกว่าผม เขาเก่งมาก เราไม่ควรให้คนต้องมาเจอความเสี่ยง ถ้าเป็นเด็กรุ่นใหม่ๆ อายุขัยในการดำรงชีวิตเขามีมากกว่าเราอีก
ในระดับจุลภาคมันคือเรื่องรถติด มันไม่ใช่ชนเสร็จก็จบ มันต้องเรียกประกัน แม้มันดูเหมือนน้อย แต่ data ที่พบคือเยอะมาก เราสามารถพล็อตจุดเกิดเหตุได้ว่า มันเกิดอุบัติเหตุทั้งประเทศเลย บางทีข้อมูลจุดเกิดเหตุก็ไปปรากฎบนท้องทะเลบ้าง เพราะเจ้าหน้าที่บันทึกข้อมูลผิด
ระหว่างที่ทำโปรเจ็กต์นี้ไป ผมก็พบด้วยว่า นี่มันเป็นปัญหาที่คนที่แคร์เริ่มท้อแล้ว เวลาเราไปคุยกับเจ้าหน้าที่ภาครัฐ หรือกรมทางหลวง บางคนเขาก็หมดกำลังใจแล้ว เพราะทำโครงการกันทุกปี แต่ก็มีคนตายทุกปี เวลาผมไปคุยกับเขา เขาก็บอกว่าดีใจมากที่มีคนหามุมมองใหม่ๆ เข้ามาช่วย
แล้วมุมใหม่ๆ จากงานวิจัยที่คุณพูดถึงมันคืออะไร
มันคือมุมที่ใช้ data มากางดูว่า เราทำอะไรได้ ไม่งั้นมันจะมืดแปดด้านต่อไป เราอยากทำให้ถนนประเทศไทยปลอดภัยขึ้น เราอยากใช้ data มาช่วยลดอุบัติเหตุบนท้องถนน เป้าหมายหลักคือลดจำนวนผู้เสียชีวิต ในส่วนของผม ผมคิดว่าสองเรื่องนี้ผูกกันอยู่แล้ว บางทีข้อมูลผู้เสียชีวิตมันมีความไม่สมบูรณ์อยู่ ในเชิงที่ว่า เราจะรู้ลึกมากในเรื่องสภาพการเสียชีวิต เช่น สมองได้รับความเสียหาย หรือม้ามแตก แต่เรากลับไม่รู้เลยว่า มันไปเกิดที่ตรงไหน
หมายถึงว่า รู้สาเหตุการเสียชีวิต แต่ไม่ค่อยรู้ว่าเกิดที่ไหน
รู้น้อยมาก มันเป็นต้นตอว่าทำไมเราถึงมืดหลายด้าน เพราะข้อมูลแต่ละถังมันถูกเก็บโดยหน่วยงานที่แตกต่างกัน แต่ละคนก็มีข้อมูลเด่นๆ ของตัวเอง ไม่มีการเชื่อมโยงกัน ตอนผมเริ่มทำโปรเจ็กต์ต้องใช้เวลาหลายเดือนในการคุยกับหน่วยงานนับสิบหน่วยงาน ซึ่งผมก็เข้าใจนะ เพราะจะให้กรมทางหลวงไปเก็บข้อมูลของทางธรรมดา มันก็ไม่ใช่
เป้าหมายรองลงมาก็คือ ผมอยากให้สังคมรู้ว่า จริงๆ แล้วมันมีคุณค่ามากเลย ในการเอา data จากหลายถึงมารวมกันแล้วใช้ประโยชน์จากส่วนนี้ ผมอยากให้คนเห็นประโยชน์ว่า มันรวมกันแล้วเราจะได้อะไร เพราะบางที บางหน่วยงานอาจจะไม่ได้รู้ว่า การแชร์ data กันแล้วจะได้อะไรรึเปล่า
หรือที่ปัญหาเป็นแบบนี้เพราะไม่มีคนกลางเอาข้อมูลมาวิเคราะห์ร่วมกัน
เป็นไปได้ อาจจะไม่มีเจ้าภาพ ถ้าถามว่าจะมีกี่หน่วยงานที่รวม data แล้ววิเคราะห์ออกมา ผมว่ามีน้อยมาก หรือบางหน่วยงานก็ไม่อยากแชร์ data เท่าไหร่ อาจจะเป็นเพราะว่าเขากลัวข้อมูลของตัวเองไม่สมบูรณ์
ปัญหาแรกที่เราเจอในการทำวิจัยครั้งนี้คือ ข้อมูลมีหลายถังมากเกินไป แล้วแต่ละถังก็ไม่สมบูรณ์ บางถังสมบูรณ์มากในเชิงนับจำนวนคนตายกับสาเหตุการตาย แต่ไม่มีจุดโลเคชั่นว่าตายที่ไหน บางทีไม่รู้เวลาเกิดเหตุด้วย ส่วนบางถังแม่นยำเรื่องโลเคชั่น แต่ไม่รู้ว่าความเสียหายเป็นยังไง
หรือบางทีเราก็พบว่า สถิติในบางพื้นที่มันไปกระจุกตัวอยู่ตรงสุสานรถยนต์ เราก็สงสัยว่าทำไมถึงเป็นอย่างนั้น พอวิเคราะห์ลงไปก็พบว่า อ๋อ เพราะเจ้าหน้าที่เขาลืมบันทึกที่จุดเกิดเหตุ เขาเลยไปบันทึกตรงจุดที่เขานึกได้ หรือจุดที่เขารู้ๆ กัน
ผมคิดว่าการเชื่อมโยงข้อมูลแต่ละถังเข้าด้วยกันนี้มันคืองานที่โหดมาก ถ้าเชื่อมข้อมูลเข้าด้วยกันไม่ได้ เราก็ต้องมานั่งวิเคราะห์แยกกันเป็นกรณีไป คือ big data มันจะดีได้ถ้าข้อมูลมันดี และเราเข้าใจสถิติดีแค่ไหน ตรงนี้คือความยาก
มันดูเป็นเรื่องที่ยากมากเลย
ยากมาก มีทั้งปัญหา human error หรือบางที่ระบบของผิดพลาดด้วย คนที่สร้างระบบเก็บข้อมูลในตอนแรก เขาไม่ได้สร้างด้วยเป้าหมายว่า ในวันหนึ่งจะมีทีม data scientist เข้ามาวิเคราะห์ข้อมูลเหล่านั้น ซึ่งมันไม่ใช่ความผิดเขาเลยนะ มันแค่ว่า คนที่จ้างมาในตอนแรกไม่ได้มองเห็นถึงประเด็นนี้
พอวิเคราะห์ data ที่หามาได้แล้ว ค้นพบอะไรบ้าง
ตอนแรกทีมเราจะทำในระดับทั้งประเทศ หรือในจังหวัดที่อัตราเสียชีวิตต่อประชากรสูงที่สุด แต่พบว่า ข้อมูลอุบัติเหตุที่เราได้มามันคือข้อมูลดีและเชื่อถือได้จริงๆ แค่ในบริเวณกรุงเทพฯ และปริมณฑล คือมันเป็นชุดข้อมูลที่จะไม่ออกมาเป็นคำเท็จ เราเลยหันมาโฟกัสบริเวณนี้แทน อีกอย่างคือ จำนวนครึ่งนึงของอุบัติเหตุที่เกิดขึ้น มันก็เกิดในแถวๆ นี้
ตัวอย่างนึงคือมีคนชอบคิดกันว่า สงกรานต์ หรือเจ็ดวันอันตรายคือช่วงพีคของการเสียชีวิตและการเกิดอุบัติเหตุ แต่ผมคิดว่ามันถูกพูดถึงเกินจริงไปหน่อย เพราะข้อมูลจริงทั้งเรื่องอุบัติเหตุและเสียชีวิต ในช่วงนั้นมันเป็นแค่ 2-3 เปอร์เซ็นต์ของสิ่งที่เกิดขึ้นตลอดทั้งปีเท่านั้น
คือมันจริงที่มีคนเสียชีวิตมากกว่าวันปกติ แต่มันไม่ใช่วันมัจจุราช วันโลกสิ้นโลก วันอื่นๆ อีก 300 กว่าวันก็ไม่น้อยหน้านัก
หรือกับตัวผมเอง ตอนเริ่มทำโปรเจ็กต์ ผมก็มีความคิดว่าเราจะทำยังไงกับวันสงกรานต์หรือปีใหม่ดี แต่จากสิ่งที่ได้พบผ่าน data ก็คือ เราก็ต้องโฟกัสกับช่วงเวลาอื่นๆ ด้วยนะ
ถ้าช่วงสงกรานต์ไม่ใช่จุดพีคของอุบัติเหตุ แล้วจุดพีคจริงๆ คือช่วงไหน
ตอนเดือนมีนาคมมันมีสถิติที่เพิ่มขึ้น แต่ผมไม่รู้ว่าเพราะอะไร การจะตอบให้เป็นเหตุเป็นผลว่า อะไรคือสาเหตุมันตอบยาก เพราะข้อมูลยังไม่ค่อยสมบูรณ์นัก ทำให้เราฟันธงได้ยากและอาจจะผิด
เราได้เห็นมุมที่น่าสนใจคือการกระจุกตัวของอุบัติเหตุ ในประเทศไทยเรา มันอยู่ในกรุงเทพฯ และปริมณฑลค่อนข้างมาก และถ้าซูมลงไปดูในกรุงเทพฯ ก็จะเห็นอีกว่า ประมาณ 70-90 เปอร์เซ็นต์ของอุบัติเหตุทั้งหมด เกิดขึ้นในพื้นที่แค่ 5 เปอร์เซ็นต์เท่านั้น
หรือจริงๆ แล้วถ้าแบ่งกรุงเทพฯ เป็นกริด ๆ กริดละ 250 เมตรคูณ 250 เมตร top 100 กริดกินอุบัติเหตุไปแล้วกว่า 16 เปอร์เซ็นต์ของอุบัติเหตุทั้งหมด แปลว่าหากเราตั้งใจเฝ้าระวังและแก้ไขจริงๆ ในท้องที่ที่มีจำนวนไม่เหลือบ่ากว่าแรงนี้ เราจะช่วยลดปริมาณอุบัติเหตุได้อย่างมีประสิทธิภาพขึ้นมาก ไม่เปลืองแรงเกินไป
แล้วพื้นที่ไหนในกรุงเทพฯ ที่เกิดอุบัติเหตุเยอะสุด
ที่พีคๆ เลยแถวสะพานตากสิน และพวกเส้นถนนทั้งหลายฝั่งธนที่เชื่อมหรือใกล้กับสะพานตากสิน แล้วอีกพื้นที่คือ วิภาวดี-รังสิต ตรงนี้พีคมาก อีกจุดคือแถวรัชดา
แล้วพอจะวิเคราะห์เหตุผลได้ไหมว่า ทำไมถึงเป็นพื้นที่เหล่านี้
อย่างตรงเส้นรัชดา มันอุบัติเหตุจะเกิดขึ้นบ่อยๆ ในวันศุกร์ เสาร์ มันน่าจะเพราะว่าคนไปดื่มเที่ยวกันแถวนั้น แต่กับบางที่มันก็ไม่ได้มีเรื่องเล่าที่จะมาอธิบายได้ง่ายขนาดนั้น
คือจุดนี้เป็นจุดที่เราพัฒนาระบบ AI ขึ้นมาช่วยคาดเดาความเสี่ยงในแต่ละท้องที่คือถ้ามันง่ายๆ ก็ไม่ต้องใช้ AI แต่จากที่เราไปสัมภาษณ์เจ้าหน้าที่ การที่เจ้าหน้าที่อาศัยจากประสบการณ์ว่าตรงไหนเป็นจุดเสี่ยงมันไม่พอ
ระบบนี้มันจะช่วยลดงานตำรวจและเจ้าหน้าที่มูลนิธิได้ ด้วยการช่วยทำนายว่าแต่ละข้อต่อของถนนในกรุงเทพฯ นั้นมีความเสี่ยงที่จะเกิดอุบัติเหตุได้มากน้อยแค่ไหน กี่เปอร์เซ็นต์ ซึ่งเราจัดอันดับให้เห็นเลยตั้งแต่ถนนที่เสี่ยงมากสุดไปถึงน้อยที่สุด เจ้าหน้าที่ภาคสนามก็สามารถเอาข้อมูลนี้ไปให้กับเจ้าหน้าที่ เพื่อวางกำลังได้ดีที่สุด
ดังนั้นถ้ามี AI มาช่วยวิเคราะห์ เจ้าหน้าที่ก็จะไม่ต้องเสียเวลามาก เพราะเราวิเคราะห์พื้นที่ทุกที่ในกรุงเทพฯ ให้แล้ว
แปลว่ามันกระจุกตัวมากๆ ในพื้นที่บางแห่ง
มันแปลว่าน่าจะแก้ได้ด้วยทรัพยากรที่มีจำกัดกันยังไงดี เพราะตำรวจก็ไม่ได้มีกำลังคนเยอะมากนัก เจ้าหน้าที่มูลนิธิก็ไม่ค่อยพอ การที่ให้เขาตระเวนไปแบบมั่วๆ ก็ไม่ค่อยเกิดประโยชน์เท่าไหร่
สิ่งที่เราเจอมันมีประโยชน์มาก คือ พื้นที่ตรงไหนมีอุบัติเหตุเยอะมากและเกิดซ้ำๆ บ้าง มันจะเป็นไปได้ยังไงถ้าในปีนึง จะมีรถชนกันในที่แยกเดิม 10-20 ครั้ง มันไม่ควรเกิดขึ้น หรือจริงๆ แล้วเราสามารถช่วยอะไรในตรงพื้นที่นั้นได้บ้าง
แต่มันจะต่างกับคนที่ทำงานโดยรู้ข้อมูลที่เจ้าหน้าที่มีอยู่แล้วยังไง
เราเคยสัมภาษณ์คนมูลนิธิป่อเต็กตึ๊ง เขาบอกว่า บางทีก็รู้จุดอยู่แล้วน่าว่าที่ไหนมันเสี่ยงบ้าง แต่ไม่รู้ว่าต้องรอนานแค่ไหน บางครั้งรอนานถึง 5 ชั่วโมงแต่ก็ไม่มีเหตุอะไรเกิดขึ้น พอขึ้นรถกลับบ้านก็ดันเกิดตรงที่ไปรอมา
ซึ่งการเอากำลังคนไปรอนานถึง 5 ชั่วโมง แล้วมันไม่เกิดเหตุอะไรขึ้นมา มันมีค่าเสียโอกาส เพราะจริงๆ แล้วใน 5 ชั่วโมงนั้นอาจจะมีคนที่กำลังจะเสียชีวิต หรือกำลังบาดเจ็บในบริเวณอื่นก็ได้ ยิ่งรถติด ก็ยิ่งเดินทางไปถึงเหตุได้ยาก
ความต่างจากการมีข้อมูลแบบเดิมอยู่ตรงที่ว่า เจ้าหน้าที่เขาได้ข้อมูลอุบัติเหตุจากใคร จริงๆ แล้วข้อมูลอุบัติเหตุมันมีแหล่งข้อมูลเยอะมาก ซึ่งถ้าเขาได้ข้อมูลมาแค่ถังเดียว ข้อมูลมันก็ไม่ได้ดีเท่ากับรวมทุกถัง นอกจากนี้ มันยังมีเรื่องความละเอียดของเวลาด้วย
เราเทียบประสิทธิภาพของระบบ AI ที่เราพัฒนากับ baseline วิชาการที่ใช้แค่ความรู้ว่า “ตรงไหนเกิดบ่อย” พบว่าภูมิปัญญา baseline มักจะดีแค่การทำนายอุบัติเหตุในบริเวณที่เกิดบ่อยครั้ง แต่ช่วยแทบไม่ได้เลยในการป้องกันในบริเวณกว้าง ยกตัวอย่าง เช่น การใช้ baseline ไปทำนายและวางกำลังให้ “เจอ” อุบัติเหตุให้ได้ 90 เปอร์เซ็นต์ของที่มันกำลังจะเกิด จะต้องไปถึง 80 กว่าเปอร์เซ็นต์ของพื้นที่ในแต่ละห้วงเวลา แต่ถ้าใช้ระบบ AI ที่เราพัฒนามา เราไปแค่ 12 เปอร์เซ็นต์โดยเฉลี่ยก็จะ “เจอ” อุบัติเหตุแล้ว เรียกได้ว่าประหยัดทรัพยากรลงได้อย่างมหาศาล
เจ้าหน้าที่หนึ่งคนอาจจะมีประสบการณ์ที่จำกัด และไม่มีทางที่คนหนึ่งคนจะรู้ข้อมูลทุกอย่างในกรุงเทพฯ แต่ถ้าเราผูกข้อมูลได้ครบ ระบบจะรับรู้ มันจะรู้หมดได้ทุกพื้นที่ และมันจะสามารถให้ข้อแนะนำให้กับเจ้าหน้าที่ได้ว่า ควรวางกำลังดูแลยังไงต่อไป
พูดอย่างนี้ได้ไหมว่า AI มันช่วยบอกแพทเทิร์นการเกิดอุบัติเหตุในกรุงเทพฯ ได้ มากกว่าแค่ใช้สัญชาตญาณอย่างเดียว
มันคือหลักฐานนะ หรือจริงๆ เอา AI ออกไปจากเรื่องก่อนเลยก็ได้ เพียงแค่ data มันก็คือหลักฐานแล้วว่าอุบัติเหตุมันเกิดที่ไหนเยอะ และเราจะมีข้อแนะนำให้กับเจ้าหน้าที่ได้ยังไงบ้าง แค่นี้ก็ลดจำนวนอุบัติเหตุและผู้เสียชีวิตได้บ้างแล้ว
เห็นใน abstract ของงานวิจัย มีอธิบายว่าป้ายรถเมล์มันเป็นปัจจัยทำให้เกิดอุบัติเหตุด้วย อยากให้เล่าเพิ่มเติมในเรื่องนี้อีกหน่อย
เอาจริงๆ ถ้าจะตอบเรื่องนี้มันก็มีโอกาสที่จะผิดพลาดสูง เพราะเราไม่มีข้อมูลเกี่ยวกับพฤติกรรมการขับรถในโปรเจ็กต์นี้เลย ถ้าเราเร่งเวลาไปข้างหน้า รถมันจะมีตัวส่งสัญญาณว่าวิ่งอยู่ที่ไหน แล้วคนขับเร็วเกินไปกี่ครั้ง แต่ตอนนี้มันไม่เป็นอย่างนั้น ดังนั้นมันฟันธงยาก
แต่ถึงอย่างนั้น ถ้าเราสวมหมวกนักวิชาการตลอดเวลา แล้วจะไม่อธิบาเลยว่ามันเกิดขึ้นเพราะอะไรก็ไม่ได้ ผมเลยลองทำแบบเอาเข้าใกล้ความจริงที่สุด เราเลยเอาข้อมูลมา run regression ดู ผมเทียบพื้นที่บางพื้นที่ที่มีจำนวนถนนเท่ากัน ถนนโค้งเท่ากัน มีเซเว่นเท่ากัน มีจำนวนตึก จำนวนร้านอาหารเท่าๆ กัน มาเทียบกันดู และพบว่า พื้นที่ที่มีอุบัติเหตุมากกว่า มันมีป้ายรถเมล์มากกว่าอีกพื้นที่
คือมันไม่ได้ฟันธง 100 เปอร์เซ็นต์ แต่ค่อนข้างชัวร์ว่าปัจจัยสำคัญเป็นป้ายรถเมล์ แล้วเราเจออีกว่าถนนเส้นที่มีเส้นรถเมล์วิ่งผ่าน เสี่ยงกว่าเส้นที่ไม่มีรถเมล์วิ่งผ่าน ปัจจัยที่เหนือไปกว่านั้นอีกคือ ถ้าถนนเส้นนั้นมีรถเมล์วิ่งผ่าน แต่ไม่มีป้ายรถเมล์ มันเสี่ยงน้อยกว่าถนนที่ไม่มีป้าย
แสดงว่ามันมีผลกระทบสองอย่างที่แยกกัน คือการมีรถเมล์วิ่งผ่านทำให้เสี่ยงเกิดอุบัติเหตุมากขึ้น แต่การที่มีรถเมล์วิ่งผ่านแล้วยังมีป้ายด้วย ความเสี่ยงก็เพิ่มขึ้นอีก
สมมติว่าถนนเส้นเดียวกันเลยนะ ถ้าเราหั่นเป็นช่องๆ เป็นข้อๆ ข้อนึงอาจจะไม่มีป้ายรถเมล์เลย คือรถวิ่งอยู่นะแต่ไม่มีป้ายจอด ช่องวิ่งนี้มันจะเสี่ยงน้อยกว่าช่องวิ่งที่มีที่หยุด
มันก็เลยทำให้เราสงสัยว่า มันน่าจะเป็นเพราะรถเข้าๆ หยุดๆ หรือหยุดกลางคันบนถนนแล้วมีคนลงมา เราเจอว่า 1 ป้ายรถเมล์ทำให้อุบัติเหตุเพิ่มขึ้น 1 ครั้งต่อปี ซึ่งถ้าคูณไปก็จะเป็นประมาณ 2,000 กว่าครั้งต่อปี หรือประมาณ 9 เปอร์เซ็นต์ของอุบัติเหตุทั้งหมดในกรุงเทพฯ ที่เราคิดว่ามีนัยยะทางสถิติมาจากปัจจัยเรื่องป้ายรถเมล์
แต่เราก็มีข้อมูลจำกัด และไม่สามารถบอกได้ว่าเพราะอะไร หรือเป็นเพราะรถเมล์ไปชนคนอื่นรึเปล่า มันไม่ค่อยเป็นอุบัติเหตุที่เกิดขึ้นเพราะรถเมล์ คือมันเป็นรถแบบอื่นชนกัน จากนั้น เราก็เลยไปดูข้อมูลจากกรมทางหลวงอีกที เราก็เจอว่า มันเป็นการชนในลักษณะที่ระหว่างรถจอด และเคลื่อนตัวออก
โดยส่วนตัว คิดว่าถ้าใครขับรถตามหลังรถเมล์จะรู้ได้เป็นอย่างดีว่า เวลารถเมล์เบรคเราจะไม่ค่อยรู้ เพราะไฟท้ายของเขาเล็กและดูยาก ไม่ค่อยสว่าง บางทีเวลาที่เขาเบรก แต่ภาพตรงหน้าเรายังใหญ่เหมือนเดิม
พอข้อมูลเป็นอย่างนี้ แล้วทางออกควรจะเป็นในรูปแบบไหน
ทางออกไม่ควรจะเป็นการลดป้ายรถเมล์ เพราะมันไม่แฟร์กับคนที่ขึ้นรถเมล์ แต่อาจจะต้องหาวิธีดูว่า เวลามันเกิด มันเกิดเพราะอะไร อาจจะมีคนไปจอดตรงที่ป้ายรถเมล์ ทำให้รถเมล์ต้องปล่อยคนกลางถนนหรือจอดไม่เทียบดีๆ รึเปล่า
ยังมีปัจจัยอื่นๆ อีกไหมที่น่าจะเกี่ยวกับการเกิดอุบัติเหตุบนถนน
จริงๆ ยังมีอีกหลายอย่าง ที่ตอบได้เลยแบบไม่ต้องเปิดดูข้อมูลคือความเร็ว อันนี้ต้องบอกก่อนว่า เขาเถียงกันพอสมควรเลยเรื่องนโยบายเพิ่มความเร็ว แต่การศึกษาของเราเจอแต่หลักฐานที่บ่งบอกว่า ไม่ควรเพิ่มความเร็ว
แต่ข้อมูลที่เราศึกษามาเห็นชัดเลยว่า การที่รถไปวิ่งอยู่บนถนนที่ความเร็วสูงมาก เทียบกับ ถนนที่มีความเร็วต่ำ มันมีโอกาสเกิดอุบัติเหตุได้มากน้อยแค่ไหน เราพบว่ามากขึ้นโดยที่ไม่เกี่ยวกับตัวแปรอื่นเลย ทั้งเรื่องความแออัดในพื้นที่หรือความโค้งของถนน ข้อมูลนี้อาจยังไม่ใช่ความจริง 100 เปอร์เซ็นต์ แต่มันก็น่าสนใจที่จะศึกษากันให้มากขึ้น
ข้อมูลที่ออกมาแบบนี้ เลยทำให้ผมค่อนข้างรู้สึกกังวลกับการเพิ่ม speed limit บนถนนบ้านเรา จริงๆ โปรเจ็กต์นี้ยังมีอีกหลายประเด็นที่ค่อนข้าง controversial พอสมควร คือเราอยากวัดประสิทธิภาพของนโยบายลดอุบัติเหตุของรัฐบาล เราก็เลือกเฉพาะสิ่งที่เราพอจะวัดได้
อันแรกคือเรื่องการตั้งด่านเป่าแอลกอฮอล์ตอนกลางคืน มันช่วยลดอุบัติเหตุไหม ซึ่งเราได้ความร่วมมือกับ บก.จร. เราศึกษาและพบว่า ประมาณปีที่ผ่านมา การเปิดด่านเป่าแอลกอฮอล์มันช่วยเซฟไม่ให้เกิดอุบัติเหตุได้กว่า 760 ครั้ง ซึ่งถ้าเป็นตอนกลางคืนเนี่ย มันคือความอันตรายสูงนะ ซึ่งตรงนี้มันคือประเด็นที่น่าสนใจและควรเอามาถกเถียงกันอย่างเปิดเผย
ผมไม่ได้หวังว่าการทำวิจัยชิ้นนี้ มันจะเป็นคำตอบสุดท้ายนะ แต่อยากให้จุดประเด็นและให้นักวิจัยคนอื่นต่อยอดไปทำงานต่อได้ แล้วก็อยากให้การกำหนดนโยบายต่างๆ จากรัฐ มันเกิดขึ้นบนหลักฐานที่ชัดเจนมากขึ้นกว่านี้
จากการทำวิจัยครั้งนี้มา ข้อมูลมันสามารถช่วยเราสรุปได้ไหมว่า ตกลงอุบัติเหตุบนท้องถนนมันเกิดจากอะไรมากกว่ากัน ระหว่างปัญหาเชิงโครงสร้างถนน กับปัญหาเรื่องพฤติกรรมส่วนบุคคล
ผมไม่มีข้อมูลเรื่องพฤติกรรม ณ วันนี้ไม่มีใครมี data point เรื่องพฤติกรรมคนได้เยอะขนาดนั้น แต่ผมบอกได้ว่า ระบบที่ผมมีมันสามารถคาดเดาความเสี่ยงได้ค่อนข้างโอเคเลย มันอาจจะไม่ได้แม่นมากแบบ 100 เปอร์เซ็นต์ แต่เราก็พอทำได้โดยไม่ต้องพึ่งข้อมูลเชิงพฤติกรรม สิ่งนี้มันบ่งบอกอะไรได้บางอย่าง ระหว่างพฤติกรรมไม่ได้สำคัญเท่ากับที่คิด หรือ พฤติกรรมคนมันจะโดนหล่อหลอมบนพื้นที่และเวลา ดังนั้น ต่อให้คุณขับรถแย่แค่ไหน แต่ถ้าขับบนถนนที่โล่งมากๆ และมีสิ่งช่วยป้องกัน มันก็ช่วยชีวิตได้
ผมคิดว่าตอนนี้มันยังมีช่องว่างสำหรับการพัฒนาได้ในเชิงนโยบาย คนขับอาจจะแก้ได้ยาก เพราะการโน้มน้าวจิตใจคนมันไม่ง่ายนะ
คุยกันมาถึงตรงนี้ ยิ่งเห็นว่าการจัดทำนโยบายที่ตั้งอยู่บนหลักฐานหรือข้อมูลที่ชัดเจนมันสำคัญมากๆ
ที่ผมยังชั่งใจว่าควรจะฟันธงตรงไหน เพราะมันยังมีความเป็นไปได้ว่าบางข้อมูลมันยังไม่ดีพอ ซึ่งมันก็ยากมาก เวลาเกิดเหตุนึงมีองค์กรเกิน 10 ที่ข้อมูลมันจะไหลไปถึงพวกเขา พอเป็นแบบนี้ ทำให้การวิเคราะห์ข้อมูลมันยากเป็นทวีคูณ
ยกตัวอย่าง สมมุติว่าในไฟล์ excel สำหรับการวิจัย เรามี 100 แถวของข้อมูล เป็นไปได้มากๆ ที่ 20 แถว จะไม่มีข้อมูลประเภทรถ ส่วนอีก20 แถวอาจจะไม่มีช่วงเวลาที่เกิดเหตุ ไปๆ มาๆ มันอาจจะเหลือ data set ที่ใช้ได้จริงน้อยมาก อาจจะไม่ถึง 40 แถวเลยก็ได้
ซึ่งการตีความจากข้อมูลที่ไม่สมบูรณ์มันอันตราย เพราะมันส่งผลถึงชีวิตคนเกิน 100 แถวนี้อีก เพราะมันมีอีกหลายแถวแน่ๆ ที่ไม่ได้ถูกเก็บมาในไฟล์ตั้งแต่แรก
การจัดการ data ในภาครัฐที่เป็นเอกภาพมันเลยจำเป็น
ถูก แต่ก็ไม่ง่าย ผมก็เห็นใจคนที่ทำงานในหน้างานเหมือนกัน เพราะหน้าที่ของเขาคือช่วยชีวิตคนตรงหน้าให้ได้ก่อน ดังนั้น มันต้องเป็นระบบที่เก็บแบบเกือบจะอัตโนมัติ และง่ายๆ สำหรับเจ้าหน้าที่เลย เพราะบางทีเราไปคาดหวังให้เจ้าหน้าที่ทำคนเดียวก็ไม่ไหวนะ อย่างไรก็ดี ผมคิดว่าคนที่เก็บข้อมูลควรจะเป็นบริษัทเอกชนที่มีเป้าหมายอยากลดอุบัติเหตุบนท้องถนนจริงๆ ใช้เทคโนโลยีเข้ามาช่วย และทำงานคู่ขนานไปกับรัฐ ซึ่งถ้าไม่มีใครทำ ผมทำให้เองก็ได้ เพราะผมทนดูปัญหานี้ไม่ไหวแล้ว
ในฐานะคนที่ทำงานกับเรื่อง big data มา คิดว่ามันคือคำตอบสุดท้ายสำหรับการแก้ไขปัญหาอุบัติเหตุบนท้องถนนรึเปล่า
ผมคิดว่า data มันคือคำตอบแรกเลยด้วยซ้ำ ก่อนที่จะทำอะไรสักอย่างเราก็ควรมี data ก่อนด้วยซ้ำ เครื่องนี้มันเหมาะสำหรับการวางแผนว่า เราควรปฏิบัติหน้าที่ยังไง ซึ่งมันไม่ควรเป็นคำตอบสุดท้ายของการแก้ไขปัญหา ตอนนี้ฟังดูเหมือนคำตอบสุดท้ายเพราะคนเพิ่งจะหันมาสนใจ
แต่ผมอยากทิ้งท้ายไว้ว่า ไม่ว่าจะอย่างไร การวิเคราะห์ข้อมูลจะไม่เกิดประโยชน์ถ้าไม่มีนโยบายตามมา สิ่งที่โครงการนี้ทำและพบเจอ มีหลายอย่าง แต่หลักๆ ผมอยากเห็นแค่ไม่กี่อย่างก่อนก็ยังได้
หนึ่งคือส่งกำลังไปตรวจจุดเสี่ยงเหล่านี้ ให้รู้เรื่อง และทำการป้องกัน จะทาสี จะอะไรก็ได้ แต่มันหน้าอายที่เราปล่อยให้มันเกิดซ้ำอยู่อย่างนั้นมาหลายปี อย่างสะพานคอขาดแถวคลองตัน เป็นต้น
สองคือ ผู้เสียชีวิตส่วนใหญ่ขับมอเตอร์ไซค์ และแทบจะทั้งหมดเสียชีวิตตอนกลางคืนถึงรุ่งสา
ฉะนั้นนโยบายที่ไม่แตะมอเตอร์ไซค์ และไม่แตะช่วงเวลาค่ำคืน จะไม่มีทางมีประสิทธิภาพสูงแน่นอน