Large Language Model (LLM) คือ โมเดล AI ขนาดใหญ่ที่ผ่านการฝึกฝนจากข้อมูลจำนวนมหาศาล ให้มีความสามารถเฉพาะทางโดยเฉพาะทักษะด้านภาษาและการสื่อสารแบบมนุษย์ ทำให้โมเดลนี้มีศักยภาพที่จะเรียนรู้คำถามหรือคำสั่ง (prompt) และสร้างคำตอบที่เหมาะสมด้วยตัวเอง โดยหนึ่งในฟังก์ชันที่ใช้งานอย่างแพร่หลายแล้วในปัจจุบัน คือ Generative AI หรือเอไอแบบรู้สร้าง ที่สร้างข้อความหรือรูปภาพได้ เช่น Chat-GPT, Gemini, Claude, MidJourney, DeepSeek
กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม (อว.) โดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) พัฒนา Pathumma LLM (ปทุมมา แอลแอลเอ็ม) เพื่อสนับสนุนการขับเคลื่อนระบบบริการ AI โดยทีมวิจัยตั้งเป้าหมายในการพัฒนาจุดแข็งของโมเดลให้เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทประเทศไทย รวมถึงเป็น Multi-Modal Generative AI หรือโมเดล AI ที่รองรับการประมวลผลข้อมูลได้หลากหลายทั้งข้อความ รูป และเสียง
ทำไมประเทศไทยต้องมี LLM เป็นของตัวเอง ?
![‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย](https://www.nstda.or.th/home/wp-content/uploads/2025/02/IMG_3136_resize.jpg)
ดร.ศราวุธ คงยัง นักวิจัยกลุ่มวิจัยปัญญาประดิษฐ์ เนคเทค สวทช. อธิบายถึงความสำคัญของการพัฒนา LLM ว่า โมเดล LLM แบ่งออกเป็น 2 ประเภท ประเภทแรก คือ โมเดลแบบปิด (close model) หรือโมเดลที่ผู้พัฒนาไม่เปิดให้สาธารณะดาวน์โหลดไปพัฒนาต่อ เช่น Chat-GPT, Gemini, Claude ประเภทที่สองคือโมเดลแบบเปิด (open model) หรือโมเดลที่ผู้พัฒนาเปิดให้สาธารณะดาวน์โหลดไปพัฒนาต่อได้ เช่น Gemma, Sea Lion, Typhoon, THaLLE
“ซึ่งจากข้อจำกัดของโมเดลแบบปิดที่ต้องพึ่งพาการนำเข้าฐานข้อมูลและการปรับแต่งความสามารถจากผู้พัฒนา ทำให้การนำโมเดลประเภทนี้มาใช้งานอาจขาดความคล่องตัว เช่น ไม่สามารถใช้งานในองค์กรที่ต้องปกปิดข้อมูล (ธนาคาร, สถานพยาบาล, ศาล ฯลฯ) ไม่สามารถใช้กับงานเฉพาะทางของประเทศไทย (การเรียบเรียงเอกสารราชการไทย, การสื่อสารภาษาถิ่นไทย, ฯลฯ) ซึ่งจะส่งผลโดยตรงต่อการพัฒนาระบบบริการ AI เพื่อสนับสนุนการทำงานและการให้บริการของทั้งภาครัฐและเอกชน
“จากความสำคัญดังกล่าวทีมวิจัยได้นำความเชี่ยวชาญด้านการพัฒนาโมเดล AI และความพร้อมด้านโครงสร้างพื้นฐานในระดับสากลของ สวทช. เช่น ซูเปอร์คอมพิวเตอร์ลันตา (LANTA) มาใช้ในการผลิต Pathumma LLM สำหรับให้บริการแก่ทั้งภาครัฐและภาคเอกชนไทยในรูปแบบโมเดลแบบเปิด โดยปัจจุบันได้เปิดให้ทดลองใช้งานเวอร์ชัน 1.0.0 แล้วที่ https://aiforthai.in.th/pathumma-llm/ ทั้งในรูปแบบ APP สำหรับให้บุคคลทั่วไปเข้าใช้งานผ่านเว็บแอปพลิเคชัน, API สำหรับนักพัฒนาที่ต้องการดึงข้อมูลแอปพลิเคชันไปแสดงผลที่หน้าเว็บไซต์ของตัวเอง และ Model สำหรับนักพัฒนาที่ต้องการดาวน์โหลดโมเดลไปพัฒนาต่อ ทั้งนี้ Pathumma LLM ยังอยู่ในขั้นตอนการวิจัยและพัฒนา”
![‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย](https://www.nstda.or.th/home/wp-content/uploads/2025/02/Screenshot-2568-01-29-at-16.32.54.png)
![‘Pathumma LLM’ โมเดลเพื่อการสร้าง Generative AI ที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย](https://www.nstda.or.th/home/wp-content/uploads/2025/02/LANTA-Supercomputer_ThaiSC-nstda.jpg)
พร้อมให้ทดลองใช้ Generative AI สัญชาติไทยแล้ว
ดร.ศราวุธ อธิบายว่าในเวอร์ชันปัจจุบัน Pathumma LLM มีฟังก์ชันเป็น Multi-Modal Generative AI ที่รองรับการประมวลผลข้อมูล 3 รูปแบบ รูปแบบแรกคือ Text LLM หรือโมเดลสำหรับประมวลผลคำถามหรือคำสั่งที่เป็นข้อความ โดยโมเดลนี้ผ่านการปรับแต่งให้เหมาะกับการสืบค้นข้อมูลและตอบคำถามอย่างเป็นเหตุเป็นผล ทำให้เหมาะแก่การพัฒนาต่อยอดเพื่อใช้ประมวลผลข้อมูลเฉพาะของแต่ละองค์กร เช่น กรมสรรพากรใช้ให้บริการแชตบอตตอบข้อซักถามด้านการยื่นภาษีแก่ประชาชน หน่วยงานวิจัยใช้ให้บริการแชตบอตสืบค้นและสรุปภาพรวมข้อมูลงานวิจัยขององค์กร
“ส่วนที่สอง Audio LLM หรือโมเดลสำหรับประมวลผลข้อมูลที่เป็นเสียง โมเดลนี้ผ่านการปรับแต่งให้ช่วยถอดความจากเสียงได้ทั้งภาษาไทยและอังกฤษ สร้างคำบรรยายเสียงบรรยากาศแวดล้อม ระบุอารมณ์และเพศของผู้พูด และตอบคำถามหรือให้ข้อมูลเกี่ยวกับเนื้อหาภายในคลิปได้ ส่วนสุดท้ายคือ Vision LLM หรือโมเดลสำหรับประมวลผลข้อมูลที่เป็นภาพ โมเดลนี้ผ่านการปรับแต่งให้สร้างคำบรรยายภาพ ถอดข้อความที่อยู่ในภาพ และตอบคำถามหรือให้ข้อมูลเกี่ยวกับภาพนั้น ๆ ได้”
การจะเพิ่มประสิทธิภาพและศักยภาพการทำงานให้แก่ LLM ต้องอาศัยปัจจัยหลายด้านโดยเฉพาะปริมาณ คุณภาพ และความทันสมัยของข้อมูล รวมถึงความพร้อมด้านระบบโครงสร้างพื้นฐาน เช่น ระบบ คลาวด์คอมพิวติง (cloud computing) สำหรับใช้ประมวลผล AI
ดร.ศราวุธ อธิบายเสริมเกี่ยวกับแผนการเพิ่มศักยภาพให้แก่ LLM ของประเทศไทยว่า ทีมวิจัยมีแผนจะเริ่มดำเนินงานความร่วมมือกับพันธมิตรทั้งภาครัฐและเอกชนไทยในการพัฒนา foundation model หรือโมเดลพื้นฐานสำหรับประเทศไทยที่มีขนาดใหญ่ขึ้น เพื่อเพิ่มศักยภาพในการรองรับปริมาณข้อมูลและพารามิเตอร์ที่ใช้ในการเทรนโมเดล AI โดยเมื่อพัฒนาแล้วเสร็จสามารถนำโมเดลพื้นฐานที่พัฒนานี้มาใช้เพิ่มศักยภาพการทำงานให้แก่ Pathumma LLM ได้ด้วย ซึ่งคาดว่าจะเริ่มดำเนินงานภายในกุมภาพันธ์ 2568 นอกจากนี้ทีมวิจัยยังมีแผนจะขอความอนุเคราะห์ข้อมูลที่เปิดเผยได้ของหน่วยงานภาครัฐและเอกชนไทยมาใช้เทรน AI เพื่อให้ Pathumma LLM มีฐานข้อมูลมากพอแก่การเป็นโมเดลแบบเปิดที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย และมีส่วนช่วยขับเคลื่อน AI Governance หรือการใช้ AI เพิ่มประสิทธิภาพการทำงานและระบบบริการของภาครัฐในอนาคต
“สำหรับเป้าหมายต่อไปของการพัฒนาระบบ Pathumma LLM ที่ทีมวิจัยตั้งไว้ นอกจากการเพิ่มจุดแข็งด้านข้อมูลและความสามารถในการเป็น Generative AI แล้ว ทีมวิจัยยังมีแผนจะพัฒนาให้ Pathumma LLM ก้าวสู่การเป็น Agentic AI หรือ AI ที่มีศักยภาพในการคิดวิเคราะห์และตัดสินใจด้วยตัวเองอย่างมีประสิทธิภาพโดยอัตโนมัติ เช่น AI ผู้ช่วยส่วนตัวที่ช่วยวิเคราะห์ข้อมูลตลาดและซื้อขายหุ้นตามเงื่อนไขให้โดยอัตโนมัติ หรือแชตบอตช่วยแนะนำระบบบริการที่สอดคล้องกับความสนใจของผู้ใช้งานพร้อมช่วยตรวจสอบสถานะของงานให้โดยอัตโนมัติ ซึ่งการยกระดับสู่ Agentic AI เป็นเทรนด์เทคโนโลยีที่ผู้พัฒนาทั่วโลกต่างกำลังให้ความสำคัญ ณ ขณะนี้ด้วยเช่นกัน”
ผู้ที่สนใจทดลองใช้งาน Pathumma LLM เวอร์ชัน 1.0.0 ทั้งในรูปแบบ APP, API และ Model เข้าใช้งานได้ที่ https://aiforthai.in.th/pathumma-llm/ และติดต่อสอบถามรายละเอียดเพิ่มเติมเกี่ยวกับ Pathumma LLM ได้ที่ Sarawoot.kongyoung@nectec.or.th
ผู้ให้การสนับสนุนในการพัฒนาโมเดล : คณะทำงานจาก Super AI Engineer ซีซัน 4
เรียบเรียงโดย ภัทรา สัปปินันทน์ ฝ่ายสร้างสรรค์สื่อและผลิตภัณฑ์ สวทช.
อาร์ตเวิร์กโดย ภัทรา สัปปินันทน์
ภาพประกอบโดย ภัทรา สัปปินันทน์, ฝ่ายประชาสัมพันธ์ สวทช. และ Shutterstock