For English-version news, please visit : https://www.nstda.or.th/en/news/news-years-2023/sontana-an-faq-conversational-avatar.html
องค์กรของคุณกำลังเผชิญปัญหาขาดแคลนบุคลากรสำหรับให้บริการตอบคำถามใช่หรือไม่ ยกหน้าที่นี้ให้ ‘อวทาร์ หรือ อวตาร (Avatar)’ เป็นผู้ช่วยดูแลลูกค้าให้แก่คุณ สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) โดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) พัฒนา ‘สนทนา (Sontana)’ อวทาร์ให้บริการตอบคำถามแบบอัตโนมัติ เพื่อให้ผู้ใช้บริการได้รับข้อมูลที่เป็นประโยชน์รวดเร็ว เกิดความประทับใจต่อองค์กร
ดร.ชัยอนันต์ ดำรงรัตน์ ทีมวิจัยการเข้าใจเสียงและข้อความ กลุ่มวิจัยปัญญาประดิษฐ์ เนคเทค สวทช. เล่าว่า ที่ผ่านมาทีมวิจัยได้พัฒนาแพลตฟอร์มปัญญาประดิษฐ์ (Artificial intelligence: AI) ด้านเสียงและข้อความเพื่อให้บริการแก่ลูกค้าหลากหลายด้าน อาทิ แพลตฟอร์มแปลงเสียงเป็นข้อความ แพลตฟอร์มแปลงข้อความเป็นเสียง แพลตฟอร์มวิเคราะห์ข้อมูลจากข้อความ แพลตฟอร์มแชตบอตหรือระบบตอบโต้อัตโนมัติ โดยแพลตฟอร์มเหล่านี้มีจุดแข็งที่สำคัญคือสามารถประมวลผลภาษาธรรมชาติ (Natural language processing: NLP) หรือภาษาพูดที่ไม่เป็นทางการได้ทั้งภาษาไทยและอังกฤษ
“ดังนั้นแล้วเพื่อพัฒนาต่อยอดให้ผลงานตอบโจทย์ความต้องการของลูกค้าที่ต้องเผชิญปัญหาการขาดแคลนบุคลากร โดยเฉพาะด้านการดำเนินงานบริการตอบข้อซักถามทั่วไป (Frequently asked questions, FAQ) ทีมวิจัยจึงได้นำแพลตฟอร์ม 3 รูปแบบที่เปิดให้บริการแล้วอย่าง ‘พาที (Partii)’ ระบบบริการถอดความเสียงภาษาไทย ‘อับดุล (Abdul)’ ระบบบริการโต้ตอบอัตโนมัติ และ ‘วาจา (VAJA)’ ระบบบริการสังเคราะห์ภาพและเสียงภาษาไทยผ่านอินเทอร์เน็ต มาผนวกรวมกับเทคโนโลยีการสร้างอวทาร์ เพื่อให้ได้ ‘อวทาร์’ สำหรับทำหน้าที่ตอบ FAQ ตามชุดข้อมูลที่ผู้ว่าจ้างกำหนด ด้วยสีหน้า ท่าทาง และน้ำเสียงที่สุภาพ ตอบคำถามได้รวดเร็วภายในเวลาไม่เกิน 5 วินาที โดยเทคโนโลยีที่ผนวกรวมทุกแพลตฟอร์มเข้าด้วยกันนี้มีชื่อเรียกว่า ‘สนทนา (Sontana)’ ส่วนอวทาร์สาวสวยที่ทำหน้าที่ให้ข้อมูลในเวอร์ชันเปิดตัวนี้ ผู้ที่ได้ทดลองใช้ระบบต่างเรียกเธอด้วยความเอ็นดูว่า ‘น้องสนทนา’ ”
จุดแข็งที่น่าจับตาของ ‘อวทาร์สนทนา’ ไม่ได้มีแค่เรื่องการตอบ FAQ ได้รวดเร็วจนผู้ใช้บริการประทับใจเท่านั้น การแสดงสีหน้าและท่าทางได้อย่างสมจริงและมีชีวิตชีวาก็ดึงดูดความสนใจจากผู้ใช้บริการได้ไม่แพ้กัน
ดร.อัษฎางค์ แตงไทย ทีมวิจัยการเข้าใจเสียงและข้อความ กลุ่มวิจัยปัญญาประดิษฐ์ เนคเทค สวทช. อธิบายว่า หลังจากที่ผู้ใช้บริการสอบถามข้อมูลกับอวทาร์แล้ว แพลตฟอร์มพาที อับดุล และวาจา จะประมวลผลต่อเนื่องกันโดยอัตโนมัติจนได้เป็นชุดเสียงสังเคราะห์สำหรับให้คำตอบแก่ผู้ใช้บริการ ซึ่งระบบจะส่งต่อข้อมูลเหล่านั้นไปยังส่วนควบคุมการเคลื่อนไหวของ ‘โมเดล 3D’ หรือ ‘อวทาร์’ เพื่อให้อวทาร์แสดงท่าทางขยับริมฝีปากและองค์ประกอบต่าง ๆ บนใบหน้าให้สอดรับกับถ้อยคำที่เปล่งเสียงออกไป เสมือนเป็นพนักงานคนหนึ่งที่กำลังทำหน้าที่ตอบคำถามแก่ผู้ใช้บริการ
“สำหรับการควบคุมการขยับองค์ประกอบบนใบหน้าของอวทาร์แบบอัตโนมัติ ทีมวิจัยได้นำเทคโนโลยี Blendshapes จากแพลตฟอร์ม ARkit ซึ่งเป็นเทคโนโลยีจากบริษัทแอปเปิล จำกัด มาใช้ในการขยับองค์ประกอบ โดยแพลตฟอร์มนี้มีการใช้ Shapes มากถึง 52 แบบ และมีการใช้พรีเซตสระของภาษาอังกฤษ (A-E-I-O-U) ในการประมวลผล อวทาร์จึงขยับริมฝีปากและแสดงสีหน้าได้ละเอียด สมจริง มีชีวิตชีวา ซึ่งทีมวิจัยสามารถปรับแต่งการแสดงสีหน้า ท่าทาง รวมถึงเสียงสังเคราะห์ของอวทาร์ให้มีลักษณะเฉพาะตัวตามที่ผู้ว่าจ้างต้องการได้อีกด้วย ส่วนทางด้านโมเดล 3D ที่ใช้สร้างเป็นอวทาร์นั้น ผู้ว่าจ้างสามารถจัดเตรียมโมเดลขององค์กรหรืองานต่าง ๆ มาด้วยตัวเอง หรือใช้บริการการผลิตโมเดลจากทางเนคเทคก็ได้เช่นกัน”
ปัจจุบันทีมวิจัยพร้อมให้บริการแพลตฟอร์ม ‘สนทนา (Sontana)’ แก่กลุ่มธุรกิจ กลุ่มบริษัทซอฟต์แวร์เฮาส์ รวมถึงองค์กรทั้งภาครัฐและเอกชนที่ต้องการใช้ระบบตอบคำถามอัตโนมัติด้วยภาพและเสียงแล้ว หากสนใจใช้บริการติดต่อได้ที่ฝ่ายกลยุทธ์วิจัยและถ่ายทอดเทคโนโลยี เนคเทค สวทช. อีเมล business@nectec.or.th
เรียบเรียงโดย : ภัทรา สัปปินันทน์ ฝ่ายสร้างสรรค์สื่อและผลิตภัณฑ์ สวทช.
อาร์ตเวิร์คโดย : ภัทรา สัปปินันทน์
ภาพประกอบโดย : ภัทรา สัปปินันทน์ และเนคเทค สวทช.