จะน่ากลัวแค่ไหน ถ้าเราได้ยินเสียงของตัวเองทั้งๆ ที่เราไม่เคยพูดประโยคนั้นเลย? AI ตัวใหม่ของไมโครซอฟต์กำลังทำให้เรื่องนี้เกิดขึ้นแล้วจริงๆ
ไมโครซอฟท์ เปิดตัว VALL-E เอไอ text-to-speech ตัวใหม่ที่สามารถจำลองเสียงของบุคคลให้ใกล้เคียงกับเสียงเดิม เพียงแค่ฟังตัวอย่างเสียงของคนนั้น 3 วินาทีเท่านั้น และเมื่อเอไอตัวนี้ได้เรียนรู้เสียงดังกล่าวแล้ว ยังสามารถสังเคราะห์เสียงขึ้นมาใหม่ โดยรักษาทั้งน้ำเสียง และโทนเสียงให้เหมือนกับเจ้าของต้นฉบับอย่างเป็นธรรมชาติ เหมือนคนนั้นมาพูดเอง
โดยผู้สร้างคาดการณ์ว่า VALL-E สามารถปลอมแปลงคําพูด รวมไปถึงสร้างประโยคใหม่ๆ ด้วยเสียงของคุณที่จดจำเอาไว้แล้ว ทำให้เกิดเป็นประโยคที่เราอาจจะไม่เคยพูดมาก่อนเลยก็ได้ สร้างความเข้าใจผิดให้กับคนอื่นๆ ได้ และจะยิ่งน่ากลัวไปมากกว่านี้ หากมีการทำงานร่วมกับเอไอตัวอื่นๆ ที่ใกล้เคียงกัน เช่น GPT-3
จากข้อกังวลที่กล่าวมา ผู้พัฒนาอย่างไมโครซอฟท์เองก็ได้ตอบถึงข้อกังวลดังกล่าวไว้ว่า พวกเขาจะระมัดระวังกับปัญหาดังกล่าว โดยในตอนนี้จะยังไม่มีการเปิดเผยโค้ดซอฟต์แวร์ดังกล่าวให้คนเข้าถึงได้อย่างอิสระ (open source code) เพื่อป้องกันความเสี่ยงไม่ให้คนนำไปใช้ในทางที่ผิด นอกจากนี้ทางไมโครซอฟท์ก็ยังกำลังพัฒนาระบบบางอย่างที่จะตรวจจับว่าเสียงใดบ้างเที่ถูกสร้างขึ้นโดยใช้ VALL-E
อ้างอิงจาก