SCB 10X เปิดตัวโมเดล AI ที่เชี่ยวชาญภาษาอีสาน “Typhoon Isan” เมื่อวันที่ 27 พฤศจิกายน 2025 บริษัทนี้เป็นผู้นำด้านเทคโนโลยีการเงินของไทย ภาษาอีสานเป็นภาษาท้องถิ่นที่ใช้ในภาคตะวันออกเฉียงเหนือของไทย มีผู้ใช้ประมาณ 20 ล้านคน การเปิดตัวครั้งนี้เป็นก้าวสำคัญ ประชาชนในท้องถิ่นที่ไม่พูดภาษาไทยกลางสามารถเข้าถึงโลกดิจิทัลได้
โมเดล AI ภาษาอีสานที่เป็นระบบแห่งแรก
Typhoon Isan เป็นโมเดลการรู้จำเสียงพูดอัตโนมัติ (ASR) ที่รองรับภาษาอีสานอย่างเป็นระบบแห่งแรก โครงการประกอบด้วยผลงาน 3 ชิ้น
ประการแรกคือโมเดล ASR แบบโอเพนซอร์ส โมเดลนี้แปลงเสียงพูดภาษาอีสานเป็นข้อความได้อย่างแม่นยำสูง ประการที่สองคือมาตรฐานการสะกดคำภาษาอีสาน มาตรฐานนี้กำหนดไว้สำหรับภาษาท้องถิ่นที่ถ่ายทอดกันมาด้วยวาจา ประการที่สามคือชุดข้อมูลเสียงและพจนานุกรมการออกเสียงแบบโอเพนซอร์ส
SCB 10X ได้เปิดเผยทั้งหมดนี้เป็นโอเพนซอร์ส เพื่อส่งเสริมให้นักพัฒนาภายนอกสร้างแอปพลิเคชัน
ความแม่นยำสูงกว่า Gemini
ประสิทธิภาพของ Typhoon Isan ASR บรรลุอัตราข้อผิดพลาดของอักขระ (CER) ที่ 0.0885 ซึ่งเป็นความแม่นยำที่สูงกว่า Gemini-2.5-pro ของ Google (CER 0.1020)
นอกจากนี้ยังมี “Typhoon Isan ASR Realtime” ที่ปรับให้เหมาะสมสำหรับการประมวลผลแบบเรียลไทม์ มี CER ที่ 0.1065 เหมาะสำหรับแอปพลิเคชันแบบสด เช่น วอยซ์บอทและการแปลแบบเรียลไทม์
การกำหนดมาตรฐานการสะกดคำคืออุปสรรคที่ใหญ่ที่สุด
ความท้าทายที่ใหญ่ที่สุดในการพัฒนา ASR ภาษาอีสานคือการไม่มีภาษาเขียนที่เป็นมาตรฐาน คำเดียวกันอาจมีการสะกดที่แตกต่างกันไปตามผู้ถอดความ
SCB 10X ร่วมมือกับนักภาษาศาสตร์ ชุมชน และครู เพื่อกำหนดมาตรฐานการสะกดคำภาษาอีสาน ระบบนี้อิงจากอักษรไทยและสามารถแสดงหน่วยเสียงของภาษาอีสานได้อย่างสม่ำเสมอ นี่เป็นการสร้างโครงสร้างพื้นฐานที่แปลงภาษาพูดให้เป็นภาษาดิจิทัล
ดิจิทัลไลเซชันเศรษฐกิจ 1.8 แสนล้านบาท
ภาคตะวันออกเฉียงเหนือมีประชากรประมาณ 20 ล้านคน มี GDP มากกว่า 1.8 แสนล้านบาท (ประมาณ 10% ของเศรษฐกิจประเทศ)
แอปธนาคารแบบดั้งเดิมต้องการการอ่านและเขียนภาษาไทยกลาง นี่เป็นอุปสรรคใหญ่สำหรับผู้สูงอายุและกลุ่มที่มีระดับการรู้หนังสือต่ำ การสำรวจของไทยพบว่าประชาชน 74.1% มีทักษะดิจิทัลต่ำกว่ามาตรฐาน
อินเทอร์เฟซ “วอยซ์เฟิร์สต์” ที่ใช้ Typhoon Isan ทำให้สามารถทำธุรกรรมได้เพียงแค่พูดภาษาอีสาน การพูดภาษาแม่สร้างความไว้วางใจ ระบบนี้ให้ความรู้สึกเหมือนผู้จัดการสาขาท้องถิ่น ไม่ใช่บริษัทใหญ่ในกรุงเทพฯ ที่อยู่ห่างไกล
การประยุกต์ใช้ในสถานพยาบาล
ในสถานพยาบาลภาคตะวันออกเฉียงเหนือของไทย มีการขาดการสื่อสารอย่างร้ายแรงระหว่างแพทย์ที่พูดภาษาไทยกลางกับผู้ป่วยที่พูดภาษาอีสาน กำแพงภาษานำไปสู่การวินิจฉัยผิดและการรักษาที่ไม่เหมาะสม
Typhoon Isan ASR Realtime แปลงเสียงพูดภาษาอีสานของผู้ป่วยเป็นข้อความภาษาไทยกลางทันที จากนั้นระบบจะนำเสนอข้อความต่อแพทย์ ระบบสามารถสร้างกระบวนการที่ผู้สูงอายุในพื้นที่ห่างไกลพูดคุยอาการกับบอท AI ไทรเอจได้ จากนั้น AI จะส่งสรุปให้แพทย์
โรคเมลิออยด์โดซิสเป็นโรคประจำถิ่นที่พบบ่อยในภาคตะวันออกเฉียงเหนือ เมื่อมีการระบาด คำเตือนภาษามาตรฐานมักถูกเพิกเฉย AI ที่พูดภาษาท้องถิ่นมีประสิทธิภาพในการส่งเสริมพฤติกรรมป้องกัน
แนวโน้มในอนาคต
Typhoon Isan เป็นส่วนหนึ่งของตระกูลโมเดล AI “Typhoon” ที่กว้างขึ้น SCB 10X ได้เปิดตัว Typhoon 1.5 และ 2.0 มาก่อนหน้านี้ ซึ่งแสดงประสิทธิภาพสูงในภาษาไทย
แผนงานรวมถึงการรวม Typhoon 2.5 และฟังก์ชันมัลติโมดัล (ข้อความ ภาพ เสียง) ความสำเร็จของโมเดลภาษาอีสานจะเป็นรากฐานสำหรับการขยายไปยังภาษาท้องถิ่นอื่น เช่น คำเมือง (ภาคเหนือ) และปักษ์ใต้ (ภาคใต้)
BKK IT News มองว่าแนวทางนี้อาจขยายไปยังประเทศอื่นในอาเซียน เนื่องจากแต่ละประเทศมีภาษาท้องถิ่นเฉพาะของตนเอง และมีการแยกออกทางดิจิทัลที่คล้ายคลึงกัน


