OpenAI เปิดตัว gpt-oss ฟรี ความจริงเบื้องหลัง ~ โมเดล AI ใหม่ 120 พันล้านพารามิเตอร์สำหรับการคิดวิเคราะห์

OpenAI เปิดตัว gpt-oss ฟรี ความจริงเบื้องหลัง ~ โมเดล AI ใหม่ 120 พันล้านพารามิเตอร์สำหรับการคิดวิเคราะห์ AI
AI

เมื่อวันที่ 5 สิงหาคม 2025 OpenAI ได้ประกาศเปิดตัวโมเดล Open Weight แรกในรอบ 5 ปีชื่อ “gpt-oss” ทั้ง 2 รุ่น คือ “gpt-oss-120b” ที่มี 117 พันล้านพารามิเตอร์ และ “gpt-oss-20b” ที่มี 21 พันล้านพารามิเตอร์ ทั้ง 2 รุ่นสามารถใช้งานได้ฟรี และมีประสิทธิภาพเทียบเคียงโมเดล “o4-mini” ของ OpenAI ที่เสียค่าใช้จ่าย

ซีอีโอ แซม อัลท์แมน กล่าวไว้ในต้นปี 2025 ว่า “เราอยู่ในด้านที่ผิดของประวัติศาสตร์” เกี่ยวกับ Open Source ซึ่งนำไปสู่การเปิดตัวครั้งนี้

เบื้องหลังการเปลี่ยนแปลงกลยุทธ์ครั้งนี้ มีสาเหตุมาจากการที่ DeepSeek R1 จากจีน และ Llama จาก Meta กำลังได้รับความนิยมในตลาด Open Source OpenAI จึงต้องตอบโต้เพื่อรักษาการควบคุมระบบนิเวศของนักพัฒนา

การเปลี่ยนแปลงจากกลยุทธ์ปิด 5 ปี

หากมองย้อนกลับไปในประวัติศาสตร์ของ OpenAI บริษัทก่อตั้งขึ้นในปี 2015 ด้วยอุดมการณ์ “ประโยชน์ของ AI สำหรับมนุษยชาติทั้งหมด” และสนับสนุน Open Source อย่างแรงกล้า แต่ด้วยต้นทุนที่สูงมากในการพัฒนา GPT-3 และ GPT-4 บริษัทจึงได้รับเงินลงทุนจำนวนมหาศาลจาก Microsoft ในปี 2019 และเปลี่ยนไปใช้กลยุทธ์แบบปิด

การเปลี่ยนแปลงกลยุทธ์นี้ทำให้เกิดความขัดแย้งกับ อีลอน มัสก์ ผู้ร่วมก่อตั้ง และนำไปสู่การฟ้องร้องกันในภายหลัง หลังจาก GPT-2 บริษัทได้ปิดโมเดลล่าสุดทั้งหมดและให้บริการผ่าน API เท่านั้น การประกาศครั้งนี้จึงเป็นการเปลี่ยนแปลงนโยบายพื้นฐานอย่างสิ้นเชิง

เทคโนโลยี Mixture-of-Experts เพื่อประสิทธิภาพสูง

จุดเด่นหลักของ gpt-oss อยู่ที่เทคโนโลยี Sparse Mixture-of-Experts (MoE) เทคโนโลยีนี้ช่วยให้ gpt-oss-120b ใช้เพียง 5.1 พันล้านพารามิเตอร์จากทั้งหมด 117 พันล้านพารามิเตอร์เมื่อประมวลผล ส่วน gpt-oss-20b ใช้ 3.6 พันล้านจาก 21 พันล้านพารามิเตอร์

กลไก “การเปิดใช้งานแบบกระจาย” นี้ช่วยลดต้นทุนการคำนวณอย่างมาก โดย gpt-oss-120b สามารถทำงานบน GPU NVIDIA H100 เพียงตัวเดียว (80GB VRAM) และ gpt-oss-20b สามารถทำงานบน PC ธรรมดาที่มี RAM 16GB

จากผลการทดสอบ gpt-oss-120b ได้คะแนน 96.6% ในการแข่งขันคณิตศาสตร์ระดับมหาวิทยาลัย AIME 2024 เมื่อใช้เครื่องมือ และได้ Elo Rating 2622 ใน Codeforces ซึ่งเทียบเท่า o4-mini

การออกแบบเฉพาะทางและปัญหา Hallucination

สิ่งสำคัญคือ gpt-oss ได้รับการออกแบบมาเป็น “AI ที่คิดได้” โดยแสดงประสิทธิภาพยอดเยี่ยมในงานที่ต้องใช้ความคิดเชิงตรรกะ เช่น คณิตศาสตร์และการเขียนโค้ด แต่กลับมีอัตรา Hallucination สูงในการตอบข้อมูลข้อเท็จจริงง่ายๆ เช่น ข้อมูลบุคคลสำคัญ

gpt-oss-120b มีอัตรา Hallucination 49% และ gpt-oss-20b ที่ 53% ซึ่งสูงกว่า o4-mini ที่ 36% นี่ไม่ใช่ข้อบกพร่อง แต่เป็นการออกแบบที่ตั้งใจให้โมเดลทำงานร่วมกับเครื่องมือภายนอก เช่น การค้นหาเว็บ OpenAI เปิดตัว “AI ที่คิดได้” แทน “AI ที่จำได้” อย่างชัดเจน

การตอบสนองต่อภัยคุกคามจากจีน

ที่มาของการประกาศครั้งนี้มีบริบททางภูมิรัฐศาสตร์ที่ไม่ควรมองข้าม DeepSeek R1 จากจีนสามารถทำงานได้ในระดับเทียบเคียง OpenAI ด้วยต้นทุนที่ต่ำกว่า ซึ่งสร้างความกระแทกแก่อุตสาหกรรม แผน “AI Action Plan” ของรัฐบาลทรัมป์ มุ่งต่อต้านระบบ Techno-Authoritarianism จากจีน และต้องการให้เทคโนโลยี AI ที่อิงตามค่านิยมประชาธิปไตยของสหรัฐฯ เป็นมาตรฐานโลก

OpenAI โพซิชัน gpt-oss ว่าเป็น “Open AI Stack ที่สร้างบนรางของสหรัฐฯ และตั้งอยู่บนค่านิยมประชาธิปไตย” เพื่อต่อต้านการขยายอิทธิพลของโมเดล AI จีนที่มีประสิทธิภาพสูง นี่เป็นกลยุทธ์ “Soft Power” ที่เกินกว่าการแข่งขันทางธุรกิจ แต่เป็นการแย่งชิงอำนาจทางเทคโนโลยี

กลยุทธ์การล้อมระบบนิเวศอย่างชาญฉลาด

กลยุทธ์การเผยแพร่ gpt-oss ที่น่าสนใจคือการรวมกันระหว่างไลเซนส์ Apache 2.0 ที่เปิดกว้าง กับ Harmony Format ที่เป็นข้อกำหนดเฉพาะของ OpenAI แม้การใช้งานเชิงพาณิชย์จะเสรี แต่การเรียนรู้ Harmony Format จำเป็นต้องใช้เครื่องมือและเอกสารของ OpenAI

ข้อกำหนดทางเทคนิคนี้ทำหน้าที่เป็น “คูเมือง” ที่ล้อมนักพัฒนาเข้าสู่ระบบนิเวศของตนอย่างนุ่มนวล เมื่อนักพัฒนาเริ่มพัฒนาแอปด้วย gpt-oss เมื่อต้องการประสิทธิภาพที่สูงขึ้น ก็จะย้ายไปใช้บริการ GPT-5 หรือบริการแบบเสียค่าใช้จ่ายของบริษัทเดียวกันโดยธรรมชาติ

การเปิดตัวพร้อมกันกับพันธมิตรฮาร์ดแวร์ (NVIDIA, AMD, Qualcomm) และผู้ให้บริการคลาวด์ (AWS, Microsoft Azure) เป็นกลยุทธ์ที่มุ่งสร้างมาตรฐานก่อนคู่แข่งจะตามทัน

ผลกระทบต่อธุรกิจไทย: โอกาสลดต้นทุน AI

สำหรับธุรกิจขนาดกลางและเล็กในไทย การประกาศครั้งนี้เป็นโอกาสใหญ่ AI ประสิทธิภาพสูงที่เคยต้องใช้ API แพงๆ กลายเป็นใช้งานฟรี ทำให้ประตู AI เปิดกว้างมากขึ้น

โดยเฉพาะอุตสาหกรรมการผลิตและการเงินที่ไม่ต้องการส่งข้อมูลความลับออกนอกองค์กร คุณค่าของ Open Weight Model ที่สามารถรันใน On-premise มีค่าอย่างมาก gpt-oss-20b ที่ใช้ RAM เพียง 16GB สามารถใช้งานบน PC ธุรกิจทั่วไปได้

แต่จำเป็นต้องระวังอัตรา Hallucination ที่สูง งานที่ต้องการความถูกต้องของข้อเท็จจริงต้องมีการเชื่อมต่อกับระบบ RAG หรือเครื่องมือค้นหาเว็บเป็นส่วนประกอบ

ความเห็นของ BKK IT News: ตัวเลือกกลยุทธ์ในตลาดแบ่งขั้ว

การประกาศครั้งนี้จะทำให้ตลาด AI แบ่งเป็น 2 ขั้ว คือ Open Model ประสิทธิภาพสูงแบบฟรี กับ Proprietary Model ล่าสุดแบบแพง ธุรกิจจะไม่ใช้โมเดลประสิทธิภาพสูงสุดกับงานทั้งหมด แต่จะใช้กลยุทธ์ Hybrid โดยใช้ gpt-oss กับงานทั่วไป และใช้ Proprietary Model กับงานที่ต้องการการตัดสินใจระดับสูง

เป้าหมายของ OpenAI ชัดเจน ใช้ Open Model เป็นประตูเข้าดึงดูดนักพัฒนาเข้าสู่ระบบนิเวศ แล้วค่อยนำไปสู่บริการเชิงพาณิชย์ที่กำไรสูง หาก “กลยุทธ์ Freemium” นี้สำเร็จ คู่แข่งจะต้องเผชิญกับการเลือกที่ยาก

สำหรับธุรกิจไทย นี่คือช่วงเวลาที่เหมาะสมในการเริ่มใช้ AI อย่างจริงจัง เพื่อเพิ่มผลิตภาพและสร้างความได้เปรียบทางการแข่งขัน

ลิงก์บทความอ้างอิง