หน้าแรก คลังความรู้ 30 ปี สวทช. งานวิจัย 30 ปี สวทช. ซอฟต์แวร์ภาษาลดช่องว่างของการสื่อสารข้ามพรมแดน
ซอฟต์แวร์ภาษาลดช่องว่างของการสื่อสารข้ามพรมแดน
10 มิ.ย. 2564
0
30 ปี สวทช.
งานวิจัย 30 ปี สวทช.
ผลงานวิจัยเด่น

ซอฟต์แวร์ภาษาลดช่องว่างของการสื่อสารข้ามพรมแดน

การพัฒนาซอฟต์แวร์ด้านภาษาถือเป็นอีกหนึ่งปัจจัยสำคัญในการติดต่อสื่อสาร เพราะนอกจากจะเป็นตัวกลางที่แสดงให้เห็นว่าการสื่อสารโดยเฉพาะกับต่างประเทศประสบความสำเร็จหรือไม่แล้วยังสามารถเพิ่มคุณภาพชีวิตให้แก่ทุกคน เนื่องจากการพัฒนาซอฟต์แวร์ภาษาในรูปแบบต่าง ๆ จะช่วยให้บุคคลที่มีความบกพร่องทางด้านการสื่อสารสามารถที่จะสื่อสารกับบุคคลอื่น ๆ ได้อย่างสะดวกสบายมากขึ้น อีกทั้งยังช่วยลดความเหลื่อมล้ำในการเข้าถึงแหล่งความรู้ แหล่งข้อมูลที่จะช่วยส่งเสริมคุณภาพชีวิตให้ดีขึ้น

เช่นเดียวกับการพัฒนาซอฟต์แวร์ด้านภาษาของศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) ที่ริเริ่มวิจัยและพัฒนาการประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP) เป็นรายแรก ๆ ในประเทศไทย

โดยการประมวลผลภาษาธรรมชาติ หรือ NLP นี้ เป็นวิทยาการแขนงหนึ่งของเทคโนโลยีปัญญาประดิษฐ์หรือเอไอ ที่ทำให้คอมพิวเตอร์สามารถเข้าใจและตีความการใช้งานภาษาปกติที่มนุษย์ใช้ในการติดต่อสื่อสารได้

ในยุคแรก ๆ เนคเทค สวทช. ได้ร่วมมือกับภาคีทั้งภายในและภายนอกประเทศ จัดตั้งโครงการแปลภาษาด้วยคอมพิวเตอร์ขึ้น โครงการนี้ได้พัฒนาไปเป็นห้องปฏิบัติการวิจัยภาษาและวิทยาการความรู้ (Linguistics and Knowledge Science Laboratory: LINKS) ซึ่งเป็นหนึ่งในห้องปฏิบัติการวิจัยภายในเนคเทค สวทช.

การสร้างองค์ความรู้และพัฒนาระบบที่ใช้เป็นโครงสร้างพื้นฐานในการสร้างนวัตกรรมด้านภาษาต่าง ๆ ( ทั้งซอฟต์แวร์แปลภาษา ระบบพจนานุกรมอิเล็กทรอนิกส์ที่มีระบบตัดคำ ฟอนต์ภาษาไทยและการตรวจคำผิด และขยายไปสู่ซอฟต์แวร์ ที่ใช้สำหรับการสืบค้นต่าง ๆ ทั้งพจนานุกรมอิเล็กทรอนิกส์ ผลงานในปี พ.ศ. 2536 ที่ถ่ายทอดเทคโนโลยีให้แก่บริษัทวันไทย คอมพิวเตอร์ จำกัด และบริษัทถาวรคอมพิวเตอร์ จำกัด ได้นำไปใช้ในภาคธุรกิจได้สำเร็จ รวมไปถึงระบบแปลภาษาบนเว็บไซต์สุภาษิตดอทคอม และโปรแกรมพจนานุกรมเล็กซิตรอน (LEXITRON) ผลงานในปี พ.ศ. 2538 ทั้งยังมีการพัฒนาการวิจัยไปสู่ระบบสืบค้นข้อมูล OCR (Optical Character Recognition) และ Speech (Speech recognition) อีกด้วย

ทั้งนี้ผลงานเด่นทางด้านการพัฒนาซอฟต์แวร์ภาษาของเนคเทค สวทช. ที่เป็นที่รู้จักกันดีจนถึงปัจจุบันก็คือ ภาษิต (PARSIT) วาจา (VAJA) และพาที (PARTY) ที่สามารถรองรับการสื่อสารของบุคคลในทุกกลุ่มได้อย่างมีประสิทธิภาพ และทำให้การสื่อสารสามารถเข้าถึงบุคคลในทุกกลุ่ม ทุกเพศ และทุกวัย

โดย ภาษิต (PARSIT) เป็นชอฟต์แวร์แปลภาษาที่พัฒนาขึ้นภายใต้ความร่วมมือระหว่างเนคเทค สวทช. กับบริษัทเอ็นอีซี ประเทศญี่ปุ่น ให้บริการแปลภาษาจากภาษาอังกฤษเป็นภาษาไทยผ่านทางเครือข่ายอินเทอร์เน็ต ผู้ใช้สามารถกำหนดให้แปลได้ทั้งข้อความสั้น ๆ และข้อความของเว็บเพจทั่วไปที่เป็นภาษาอังกฤษ

ภาษิตทำงานโดยมีโปรแกรมทำการแยกข้อความออกจากรูปแบบของเว็บเพจ แล้วส่งเพียงข้อความอย่างเดียวไปแปล โดยอาศัยกฎทางไวยากรณ์และพจนานุกรมจากนั้นภาษิตจะนำข้อความที่แปลได้รวมเข้ากับรูปแบบของเว็บที่แยกไว้ตอนต้นแล้วส่งกลับไปแสดงผล

ผลที่ได้คือ ผู้ใช้จะสามารถเรียกดูเว็บเพจต่าง ๆ ที่เป็นภาษาอังกฤษได้ โดยมีการแสดงผลเป็นภาษาไทยทั้งหมด และยังคงรูปแบบของต้นฉบับไว้ทุกประการปัจจุบันเนคเทค สวทช. ยังได้พัฒนาซอฟต์แวร์ภาษิตเพื่อรองรับการแปลภาษาจีนเป็นภาษาไทยอีกด้วย

สำหรับ วาจา (VAJA) เป็นซอฟต์แวร์สังเคราะห์เสียงพูดภาษาไทย ที่ช่วยเพิ่มศักยภาพการติดต่อสื่อสาร โดยพัฒนาจากเทคโนโลยีสร้างเสียงพูดจากข้อความ (Text-to-Speech synthesis: TTS) ซึ่งเป็นเทคโนโลยีสำคัญที่จะเป็นเครื่องมือช่วยประชาสัมพันธ์ข่วสารได้ในทุกพื้นที่ สามารถสื่อสารเข้าถึงได้ทั้งกรณีเฉพาะบุคคล หรือการประกาศแบบวงกว้างในที่สาธารณะ โดยให้ระบบคอมพิวเตอร์สร้างเสียงคำพูดเพื่ออ่านข้อความตามที่กำหนดแบบอัตโนมัติ เพื่อตอบสนองผู้รับสารหรือลูกค้าแบบทันทีทันใด ปรับเปลี่ยนได้ทันต่อเหตุการณ์ และเหมาะสมตามสถานการณ์ซึ่งมีจุดเด่นที่เหนือกว่าการใช้เสียงที่บันทึกไว้ล่วงหน้า

ซอฟต์แวร์วาจานี้ได้มีการวิจัย พัฒนา ปรับปรุง และเปลี่ยนแปลงกระบวนการสร้างเสียงพูดที่ใช้งานอยู่ให้ทำงานได้มีประสิทธิภาพและถูกต้องมากยิ่งขึ้น ทั้งในส่วนประมวลผล์ข้อความที่เส้นอการใช้งานหน่วยย่อยพื้นฐานของการอ่านมาช่วยในการตัดแบ่งเพื่อสร้างเสียงอ่านให้ถูกต้อง ที่เรียกว่า พยางค์เสมือน (Pseudo sylable) ในส่วนของการแปลงข้อความเป็นสัญรูปหน่วยเสียง ได้วิจัยและนำเสนอแนวทางใหม่โดยอาศัยเทคนิคการรู้จำสายอักษรและคาดเดาสายสัญรูปเสียง (Sequence-to sequence) ที่สามารถทำงานได้อย่างมีประสิทธิภาพ

การใช้งานซอฟต์แวร์วาจา สามารถนำมาใช้ในการนำทางการขับรถด้วยเสียง (Voice navigation) อ่านชื่อของผู้โทรศัพท์เข้ามา รวมถึงข้อความ SMS หรืออ่าน E-book โดยใช้เป็นเสียงของผู้ช่วยเสมือนจริง รวมถึงใช้เป็นเสียงอ่านหน้าจอสำหรับผู้พิการทางสายตา

จุดเด่นของซอฟต์แวร์วาจาคือช่วยปรับการออกเสียงของคำได้ตามต้องการสามารถตั้งภาษาที่อยากให้ออกเสียงได้ ปรับความดังของเสียงพูดได้ และสามารถสังเคราะห์เสียงได้อย่างมีประสิทธิภาพ มีการอัปเดตเพื่อปรับคุณภาพเสียงและการออกเสียงอย่างสม่ำเสมอ รองรับข้อความทั้งภาษาไทยและอังกฤษด้วยการติดตั้งเพียงครั้งเดียว ติดตั้งง่ายโดยระบบอัตโนมัติ ปัจจุบันซอฟต์แวร์ VAJA เวอร์ชัน 8.0มีความสามารถในการสร้างเสียงใหม่ได้อีกด้วย

ส่วน พาที (PARTY) ระบบรู้จำเสียงพูดภาษาไทย เป็นการพัฒนาเทคโนโลยีแปลงเสียงพูดเป็นข้อความ หรือการรู้จำเสียงพูด ซึ่งเป็นนวัตกรรมที่เป็นที่น่าสนใจ และมีการนำมาใช้ในการติดต่อสื่อสารกับสมาร์ตโฟน รวมถึงการถอดความเสียงพูดในโปรแกรมประยุกต์อื่น ๆ

แม้ในประเทศไทยจะมีงานวิจัยด้านนี้ตั้งแต่ 20 ปีที่ผ่านมา แต่งานวิจัยยังสามารถนำมาต่อยอดเชิงธุรกิจได้อย่างจำกัด เนื่องจากเป็นเทคโนโลยีที่ต้องลงทุนสูงเพื่อสร้างคลังข้อมูลที่ครอบคลุมการใช้งาน แต่ประสิทธิภาพและความถูกต้องของการรู้จำที่ได้ยังไม่คุ้มค่าต่อการลงทุน

เพื่อลดค่าใช้จ่ายในการนำเข้าเทคโนโลยีราคาสูง และเปิดโอกาสให้คนไทยสามารถต่อยอดนวัตกรรมได้เองโดยไม่ต้องพึ่งพาต่างชาติ เนคเทค สวทช. ได้มีการต่อยอดงานวิจัยพาทีที่พัฒนาขึ้นตั้งแต่ปีพ.ศ. 2543 มาเป็นโครงการวิจัยและพัฒนาบริการระบบรู้จำเสียงพูดภาษาไทย โครงการเสร็จสิ้นในปี พ.ศ. 2558 โดยช่วยลดข้อจำกัดของระบบเดิม เช่น จำกัดจำนวนคำศัพท์ จำกัดไวยากรณ์ จำกัดสภาวะแวดล้อมของการใช้งาน และจำกัดความสามารถในการขยายบริการขยายความสามารถไปสู่ระบบรู้จำเสียงพูดภาษาไทยแบบไม่จำกัดเนื้อหา ความถูกต้องของการรู้จำทัดเทียมเทคโนโลยีจากต่างชาติโดยเฉพาะการใช้งานผ่านสมาร์ตโฟน สามารถตอบสนองได้รวดเร็วสามารถขยายขนาดของบริการ และต่อยอดไปเป็นระบบประยุกต์ได้ตามต้องการพื้นฐานเทคโนโลยีรู้จำเสียงพูด

พาทีได้ใช้วิทยาการใหม่ที่สร้างขึ้น โดยมีพจนานุกรมในระบบขนาดเพียง40,000 คำ มีความแม่นยำ 80% ภายใต้การทดสอบกับเสียงพูดผ่านช่องทางข้อมูล(Data channel) ด้วยสมาร์ตโฟน และเนคเทค สวทช. ยังได้เพิ่มคำในฐานข้อมูลจำนวน 5 ล้านคำ เพื่อให้บริการที่มีประสิทธิภาพมากยิ่งขึ้น

การพัฒนาซอฟต์แวร์ภาษาจึงนับว่ามีประโยชน์อย่างมากในการสื่อสารหลากหลายรูปแบบ นอกจากช่วยเพิ่มประสิทธิภาพการสื่อสารระหว่างบุคคลแล้ว ยังสามารถทำให้การสื่อสารผ่านอุปกรณ์ต่าง ๆ มีประสิทธิภาพมากยิ่งขึ้นอีกด้วย

ดาวน์โหลดหนังสือฉบับเต็ม

แชร์หน้านี้: