หน้าแรก ‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย
‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย
10 ก.พ. 2568
0
ข่าว
ข่าวประชาสัมพันธ์
บทความ
ผลงานวิจัยเด่น

‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย

 

Large Language Model (LLM) คือ โมเดล AI ขนาดใหญ่ที่ผ่านการฝึกฝนจากข้อมูลจำนวนมหาศาล ให้มีความสามารถเฉพาะทางโดยเฉพาะทักษะด้านภาษาและการสื่อสารแบบมนุษย์ ทำให้โมเดลนี้มีศักยภาพที่จะเรียนรู้คำถามหรือคำสั่ง (prompt) และสร้างคำตอบที่เหมาะสมด้วยตัวเอง โดยหนึ่งในฟังก์ชันที่ใช้งานอย่างแพร่หลายแล้วในปัจจุบัน คือ Generative AI หรือเอไอแบบรู้สร้าง ที่สร้างข้อความหรือรูปภาพได้ เช่น Chat-GPT, Gemini, Claude, MidJourney, DeepSeek

กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม (อว.) โดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) พัฒนา Pathumma LLM (ปทุมมา แอลแอลเอ็ม) เพื่อสนับสนุนการขับเคลื่อนระบบบริการ AI โดยทีมวิจัยตั้งเป้าหมายในการพัฒนาจุดแข็งของโมเดลให้เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทประเทศไทย รวมถึงเป็น Multi-Modal Generative AI หรือโมเดล AI ที่รองรับการประมวลผลข้อมูลได้หลากหลายทั้งข้อความ รูป และเสียง

 

ทำไมประเทศไทยต้องมี LLM เป็นของตัวเอง ?

 

‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย
ดร.ศราวุธ คงยัง นักวิจัยกลุ่มวิจัยปัญญาประดิษฐ์ เนคเทค สวทช.

 

ดร.ศราวุธ คงยัง นักวิจัยกลุ่มวิจัยปัญญาประดิษฐ์ เนคเทค สวทช. อธิบายถึงความสำคัญของการพัฒนา LLM ว่า โมเดล LLM แบ่งออกเป็น 2 ประเภท ประเภทแรก คือ โมเดลแบบปิด (close model) หรือโมเดลที่ผู้พัฒนาไม่เปิดให้สาธารณะดาวน์โหลดไปพัฒนาต่อ เช่น Chat-GPT, Gemini, Claude ประเภทที่สองคือโมเดลแบบเปิด (open model) หรือโมเดลที่ผู้พัฒนาเปิดให้สาธารณะดาวน์โหลดไปพัฒนาต่อได้ เช่น Gemma, Sea Lion, Typhoon, THaLLE

“ซึ่งจากข้อจำกัดของโมเดลแบบปิดที่ต้องพึ่งพาการนำเข้าฐานข้อมูลและการปรับแต่งความสามารถจากผู้พัฒนา ทำให้การนำโมเดลประเภทนี้มาใช้งานอาจขาดความคล่องตัว เช่น ไม่สามารถใช้งานในองค์กรที่ต้องปกปิดข้อมูล (ธนาคาร, สถานพยาบาล, ศาล ฯลฯ) ไม่สามารถใช้กับงานเฉพาะทางของประเทศไทย (การเรียบเรียงเอกสารราชการไทย, การสื่อสารภาษาถิ่นไทย, ฯลฯ) ซึ่งจะส่งผลโดยตรงต่อการพัฒนาระบบบริการ AI เพื่อสนับสนุนการทำงานและการให้บริการของทั้งภาครัฐและเอกชน

“จากความสำคัญดังกล่าวทีมวิจัยได้นำความเชี่ยวชาญด้านการพัฒนาโมเดล AI และความพร้อมด้านโครงสร้างพื้นฐานในระดับสากลของ สวทช. เช่น ซูเปอร์คอมพิวเตอร์ลันตา (LANTA) มาใช้ในการผลิต Pathumma LLM สำหรับให้บริการแก่ทั้งภาครัฐและภาคเอกชนไทยในรูปแบบโมเดลแบบเปิด โดยปัจจุบันได้เปิดให้ทดลองใช้งานเวอร์ชัน 1.0.0 แล้วที่ https://aiforthai.in.th/pathumma-llm/ ทั้งในรูปแบบ APP สำหรับให้บุคคลทั่วไปเข้าใช้งานผ่านเว็บแอปพลิเคชัน, API สำหรับนักพัฒนาที่ต้องการดึงข้อมูลแอปพลิเคชันไปแสดงผลที่หน้าเว็บไซต์ของตัวเอง และ Model สำหรับนักพัฒนาที่ต้องการดาวน์โหลดโมเดลไปพัฒนาต่อ ทั้งนี้ Pathumma LLM ยังอยู่ในขั้นตอนการวิจัยและพัฒนา”

 

‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย

‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย
Pathumma LLM เวอร์ชัน 1.0.0

 

‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย
ซูเปอร์คอมพิวเตอร์ลันตา (LANTA)

 

พร้อมให้ทดลองใช้ Generative AI สัญชาติไทยแล้ว

ดร.ศราวุธ อธิบายว่าในเวอร์ชันปัจจุบัน Pathumma LLM มีฟังก์ชันเป็น Multi-Modal Generative AI  ที่รองรับการประมวลผลข้อมูล 3 รูปแบบ รูปแบบแรกคือ Text LLM หรือโมเดลสำหรับประมวลผลคำถามหรือคำสั่งที่เป็นข้อความ โดยโมเดลนี้ผ่านการปรับแต่งให้เหมาะกับการสืบค้นข้อมูลและตอบคำถามอย่างเป็นเหตุเป็นผล ทำให้เหมาะแก่การพัฒนาต่อยอดเพื่อใช้ประมวลผลข้อมูลเฉพาะของแต่ละองค์กร เช่น กรมสรรพากรใช้ให้บริการแชตบอตตอบข้อซักถามด้านการยื่นภาษีแก่ประชาชน หน่วยงานวิจัยใช้ให้บริการแชตบอตสืบค้นและสรุปภาพรวมข้อมูลงานวิจัยขององค์กร

‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย

 

“ส่วนที่สอง Audio LLM หรือโมเดลสำหรับประมวลผลข้อมูลที่เป็นเสียง โมเดลนี้ผ่านการปรับแต่งให้ช่วยถอดความจากเสียงได้ทั้งภาษาไทยและอังกฤษ​ สร้างคำบรรยายเสียงบรรยากาศแวดล้อม ระบุอารมณ์และเพศของผู้พูด และตอบคำถามหรือให้ข้อมูลเกี่ยวกับเนื้อหาภายในคลิปได้ ส่วนสุดท้ายคือ Vision LLM หรือโมเดลสำหรับประมวลผลข้อมูลที่เป็นภาพ โมเดลนี้ผ่านการปรับแต่งให้สร้างคำบรรยายภาพ ถอดข้อความที่อยู่ในภาพ และตอบคำถามหรือให้ข้อมูลเกี่ยวกับภาพนั้น ๆ ได้”

 

‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย

 

การจะเพิ่มประสิทธิภาพและศักยภาพการทำงานให้แก่ LLM ต้องอาศัยปัจจัยหลายด้านโดยเฉพาะปริมาณ คุณภาพ และความทันสมัยของข้อมูล รวมถึงความพร้อมด้านระบบโครงสร้างพื้นฐาน เช่น ระบบ คลาวด์คอมพิวติง (cloud computing) สำหรับใช้ประมวลผล AI

ดร.ศราวุธ อธิบายเสริมเกี่ยวกับแผนการเพิ่มศักยภาพให้แก่ LLM ของประเทศไทยว่า ทีมวิจัยมีแผนจะเริ่มดำเนินงานความร่วมมือกับพันธมิตรทั้งภาครัฐและเอกชนไทยในการพัฒนา foundation model หรือโมเดลพื้นฐานสำหรับประเทศไทยที่มีขนาดใหญ่ขึ้น เพื่อเพิ่มศักยภาพในการรองรับปริมาณข้อมูลและพารามิเตอร์ที่ใช้ในการเทรนโมเดล AI โดยเมื่อพัฒนาแล้วเสร็จสามารถนำโมเดลพื้นฐานที่พัฒนานี้มาใช้เพิ่มศักยภาพการทำงานให้แก่ Pathumma LLM ได้ด้วย ซึ่งคาดว่าจะเริ่มดำเนินงานภายในกุมภาพันธ์ 2568 นอกจากนี้ทีมวิจัยยังมีแผนจะขอความอนุเคราะห์ข้อมูลที่เปิดเผยได้ของหน่วยงานภาครัฐและเอกชนไทยมาใช้เทรน AI เพื่อให้ Pathumma LLM มีฐานข้อมูลมากพอแก่การเป็นโมเดลแบบเปิดที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย และมีส่วนช่วยขับเคลื่อน AI Governance หรือการใช้ AI เพิ่มประสิทธิภาพการทำงานและระบบบริการของภาครัฐในอนาคต

“สำหรับเป้าหมายต่อไปของการพัฒนาระบบ Pathumma LLM ที่ทีมวิจัยตั้งไว้ นอกจากการเพิ่มจุดแข็งด้านข้อมูลและความสามารถในการเป็น Generative AI แล้ว ทีมวิจัยยังมีแผนจะพัฒนาให้ Pathumma LLM ก้าวสู่การเป็น Agentic AI หรือ AI ที่มีศักยภาพในการคิดวิเคราะห์และตัดสินใจด้วยตัวเองอย่างมีประสิทธิภาพโดยอัตโนมัติ เช่น AI ผู้ช่วยส่วนตัวที่ช่วยวิเคราะห์ข้อมูลตลาดและซื้อขายหุ้นตามเงื่อนไขให้โดยอัตโนมัติ หรือแชตบอตช่วยแนะนำระบบบริการที่สอดคล้องกับความสนใจของผู้ใช้งานพร้อมช่วยตรวจสอบสถานะของงานให้โดยอัตโนมัติ ซึ่งการยกระดับสู่ Agentic AI เป็นเทรนด์เทคโนโลยีที่ผู้พัฒนาทั่วโลกต่างกำลังให้ความสำคัญ ณ ขณะนี้ด้วยเช่นกัน”

ผู้ที่สนใจทดลองใช้งาน Pathumma LLM เวอร์ชัน 1.0.0 ทั้งในรูปแบบ APP, API และ Model เข้าใช้งานได้ที่ https://aiforthai.in.th/pathumma-llm/ และติดต่อสอบถามรายละเอียดเพิ่มเติมเกี่ยวกับ Pathumma LLM ได้ที่ Sarawoot.kongyoung@nectec.or.th


ผู้ให้การสนับสนุนในการพัฒนาโมเดล : คณะทำงานจาก Super AI Engineer ซีซัน 4


เรียบเรียงโดย ภัทรา สัปปินันทน์ ฝ่ายสร้างสรรค์สื่อและผลิตภัณฑ์ สวทช.
อาร์ตเวิร์กโดย ภัทรา สัปปินันทน์
ภาพประกอบโดย ภัทรา สัปปินันทน์, ฝ่ายประชาสัมพันธ์ สวทช. และ Shutterstock

แชร์หน้านี้: