Runway Gen-4.5 เข้าใจกฎฟิสิกส์ด้วย AI ~พนักงาน 120 คนเอาชนะ Google และ OpenAI ด้วยเทคโนโลยี~

Runway Gen-4.5 เข้าใจกฎฟิสิกส์ด้วย AI ~พนักงาน 120 คนเอาชนะ Google และ OpenAI ด้วยเทคโนโลยี~ AI
AI

เมื่อวันที่ 1 ธันวาคม 2025 Runway AI ในนิวยอร์ก สหรัฐอเมริกา ได้เปิดตัวโมเดล AI สร้างวิดีโอรุ่นล่าสุด “Gen-4.5” โมเดลนี้ได้คะแนน Elo 1247 ใน “Video Arena” ของ Artificial Analysis องค์กรประเมินผลอิสระ โมเดลนี้ทำลายสถิติของ Google Veo 3 และ OpenAI Sora 2 กลายเป็นโมเดลสร้างวิดีโอที่มีประสิทธิภาพสูงสุดในโลก Runway เป็นบริษัทที่มีพนักงานเพียง 120 คน สามารถเอาชนะ Google และ OpenAI ที่มีมูลค่าตลาดหลายล้านล้านดอลลาร์ได้ด้วยเทคโนโลยี

พลังทางเทคนิคที่พิสูจน์ด้วยเบนช์มาร์ก

ปี 2025 เป็นปีที่การแข่งขัน AI สร้างวิดีโอเข้มข้นขึ้น Google ประกาศ Veo 3 ในเดือนพฤษภาคมและตุลาคม OpenAI ปล่อย Sora 2 เมื่อวันที่ 30 กันยายน ในช่วงปลายปี Runway ได้ผลลัพธ์ที่ดีกว่าคู่แข่งด้วย Gen-4.5 Gen-4.5 เน้น “ความถูกต้องทางภาพ” และ “การจำลองฟิสิกส์”

ผลการทดสอบแบบ Blind Test โดย Artificial Analysis องค์กรเบนช์มาร์กอิสระมีดังนี้

อันดับ ชื่อโมเดล ผู้พัฒนา คะแนน Elo
1 Gen-4.5 (“David”) Runway 1247
2 Veo 3 Google 1226
3 Kling v1.5/2.0 Kuaishou ~1225
7 Sora 2 Pro OpenAI 1206

ที่น่าสนใจคือโมเดลล่าสุดของ OpenAI คือ Sora 2 Pro อยู่อันดับที่ 7 โมเดลนี้เน้นการสร้างเสียงและฟีเจอร์โซเชียล ส่งผลให้คุณภาพวิดีโอแท้จริงตามหลัง Runway ที่เชี่ยวชาญเฉพาะด้าน

AI ที่เข้าใจกฎฟิสิกส์

ความสำเร็จทางเทคนิคที่สำคัญที่สุดของ Gen-4.5 คือความสามารถในการจำลองปรากฏการณ์ทางฟิสิกส์ โมเดล AI วิดีโอแบบเดิมสร้าง “การเคลื่อนไหวที่ดูเหมือนจริง” โดยอิงจากความน่าจะเป็นทางสถิติ Gen-4.5 แสดงพฤติกรรมที่เข้าใจความสัมพันธ์เชิงสาเหตุและกฎฟิสิกส์ โมเดลนี้สร้าง World Model ขั้นสูง

โมเดลนี้วาดความหนืด การกระเซ็นของน้ำ คลื่นบนผิวน้ำเมื่อเทน้ำ ด้วยความแม่นยำใกล้เคียงกับการจำลองพลศาสตร์ของไหลจริง โมเดลนี้แสดงศักยภาพในการทดแทนซอฟต์แวร์จำลองของไหลราคาแพงใน CM ของบริษัทเครื่องดื่มและ VFX ในภาพยนตร์

นอกจากนี้ยังมีการปรับปรุง “Object Permanence” ซึ่งเป็นปัญหาเก่าแก่ของ AI วิดีโอ เมื่อบุคคลเดินผ่านไปหลังเสา โมเดลเดิมจะทำให้บุคคลหายไปหรือเปลี่ยนเป็นคนอื่น Gen-4.5 คำนวณว่าวัตถุนั้นยังอยู่ในระหว่างที่มองไม่เห็น โมเดลนี้รักษารูปร่างและคุณสมบัติที่สอดคล้องกันเมื่อวัตถุปรากฏขึ้นอีกครั้ง

การควบคุมสำหรับมืออาชีพ

สำหรับผู้สร้างภาพมืออาชีพ “การควบคุม” สำคัญกว่าคุณภาพของภาพ Gen-4.5 เหนือกว่าคู่แข่งในจุดนี้

ผู้ใช้สามารถระบุการทำงานของกล้องอย่างแม่นยำ เช่น Pan, Tilt, Zoom, Tracking โมเดลนี้ปรับปรุงฟีเจอร์ในการป้อนองค์ประกอบของภาพนิ่งเป็นภาพอ้างอิงและสร้างวิดีโอโดยรักษาโครงสร้างนั้น ผู้ใช้สามารถสร้างภาพตาม Storyboard และสร้างแอนิเมชันที่รักษาความสอดคล้องของการออกแบบตัวละครเฉพาะได้

ความสำเร็จของกลยุทธ์เชี่ยวชาญเฉพาะด้าน

เหตุใดสตาร์ทอัพที่มีพนักงาน 120 คนและมูลค่า 3.5 พันล้านดอลลาร์จึงชนะ Google และ Microsoft ที่มีมูลค่าตลาดเกิน 2 ล้านล้านดอลลาร์

Google และ OpenAI ขยายธุรกิจที่หลากหลาย โมเดลสร้างวิดีโอถูกออกแบบเป็นส่วนหนึ่งของ Ecosystem Veo 3 เน้นการเชื่อมโยงกับ YouTube Shorts Sora 2 เน้นการเชื่อมโยงกับ ChatGPT และ SNS ขณะที่ Runway มุ่งเน้นทรัพยากรไปที่จุดเดียว คือ “เครื่องมือสำหรับผู้สร้างภาพ”

Runway ใช้ข้อมูลภาพมืออาชีพคุณภาพสูงในการเรียนรู้ผ่านความร่วมมือกับสตูดิโอภาพยนตร์อย่าง Lionsgate ชุดข้อมูลที่สะอาดและมีโครงสร้างนี้มีส่วนทำให้การคำนวณฟิสิกส์แม่นยำ โมเดลนี้สามารถจำลองแสงแบบภาพยนตร์ได้

โครงสร้างพื้นฐาน Inference ของ Gen-4.5 ใช้ GPU “Blackwell” และ “Hopper” สถาปัตยกรรมล่าสุดของ NVIDIA Runway และ NVIDIA มีความร่วมมืออย่างใกล้ชิด โดย NVIDIA เป็นนักลงทุนของ Runway ความร่วมมือนี้ทำให้ Runway สามารถรักษาทรัพยากรการคำนวณนี้ได้

ผลกระทบต่ออุตสาหกรรม IT และแนวโน้มในอนาคต

การเปิดตัว Gen-4.5 แสดงให้เห็นว่าเทคโนโลยี AI สร้างวิดีโอเปลี่ยนจาก “ของเล่นทดลอง” เป็น “เครื่องมืออุตสาหกรรมที่ใช้งานได้จริง”

ในอุตสาหกรรมสร้างภาพ Gen-4.5 เป็นโอกาสในการสร้าง VFX ระดับฮอลลีวูดด้วยงบประมาณต่ำ อุปสรรคสำหรับบริษัทภาพยนตร์และละครอินดี้ลดลง บริษัทเหล่านี้สามารถจัดหาเนื้อหาคุณภาพสูงสำหรับแพลตฟอร์มโลกอย่าง Netflix ได้ง่ายขึ้น

อย่างไรก็ตาม เทคโนโลยีสร้างวิดีโอความละเอียดสูงอย่าง Gen-4.5 มีความเสี่ยงในการกัดเซาะความไว้วางใจทางสังคมด้วย Deepfake Gen-4.5 มีความละเอียดสูงกว่า Deepfake แบบเดิมมาก โมเดลนี้มีความขัดแย้งทางกายภาพน้อยมาก Runway เองได้นำเครื่องหมายน้ำอิเล็กทรอนิกส์อย่าง “SynthID” มาใช้ แต่มีความเป็นไปได้ที่จะถูกหลีกเลี่ยงทางเทคนิค

ตั้งแต่เดือนตุลาคม 2025 เทรนด์ของ AI กำลังเปลี่ยนจากการสร้างเนื้อหาเพียงอย่างเดียวไปสู่ “Agentic AI” ในการสร้างวิดีโอ รุ่นถัดไปของ Gen-4.5 คาดว่า AI จะทำหน้าที่เป็นผู้กำกับโดยให้บทภาพยนตร์เพียงอย่างเดียว AI จะทำการตัดต่อ การทำงานของกล้อง แสง การกำกับการแสดงโดยอัตโนมัติ

BKK IT News เห็นว่าในปี 2026 รุ่นพัฒนาของ Gen-4.5 อาจรวมฟีเจอร์ Agent และเปลี่ยนแปลง Workflow ของการสร้างภาพโดยพื้นฐาน

ลิงก์บทความอ้างอิง