Runway Gen-4.5 เข้าใจกฎฟิสิกส์ด้วย AI ～พนักงาน 120 คนเอาชนะ Google และ OpenAI ด้วยเทคโนโลยี～

เมื่อวันที่ 1 ธันวาคม 2025 Runway AI ในนิวยอร์ก สหรัฐอเมริกา ได้เปิดตัวโมเดล AI สร้างวิดีโอรุ่นล่าสุด “Gen-4.5” โมเดลนี้ได้คะแนน Elo 1247 ใน “Video Arena” ของ Artificial Analysis องค์กรประเมินผลอิสระ โมเดลนี้ทำลายสถิติของ Google Veo 3 และ OpenAI Sora 2 กลายเป็นโมเดลสร้างวิดีโอที่มีประสิทธิภาพสูงสุดในโลก Runway เป็นบริษัทที่มีพนักงานเพียง 120 คน สามารถเอาชนะ Google และ OpenAI ที่มีมูลค่าตลาดหลายล้านล้านดอลลาร์ได้ด้วยเทคโนโลยี

Table of contents

พลังทางเทคนิคที่พิสูจน์ด้วยเบนช์มาร์ก
AI ที่เข้าใจกฎฟิสิกส์
การควบคุมสำหรับมืออาชีพ
ความสำเร็จของกลยุทธ์เชี่ยวชาญเฉพาะด้าน
ผลกระทบต่ออุตสาหกรรม IT และแนวโน้มในอนาคต
ลิงก์บทความอ้างอิง

พลังทางเทคนิคที่พิสูจน์ด้วยเบนช์มาร์ก

ปี 2025 เป็นปีที่การแข่งขัน AI สร้างวิดีโอเข้มข้นขึ้น Google ประกาศ Veo 3 ในเดือนพฤษภาคมและตุลาคม OpenAI ปล่อย Sora 2 เมื่อวันที่ 30 กันยายน ในช่วงปลายปี Runway ได้ผลลัพธ์ที่ดีกว่าคู่แข่งด้วย Gen-4.5 Gen-4.5 เน้น “ความถูกต้องทางภาพ” และ “การจำลองฟิสิกส์”

ผลการทดสอบแบบ Blind Test โดย Artificial Analysis องค์กรเบนช์มาร์กอิสระมีดังนี้

อันดับ	ชื่อโมเดล	ผู้พัฒนา	คะแนน Elo
1	Gen-4.5 (“David”)	Runway	1247
2	Veo 3	Google	1226
3	Kling v1.5/2.0	Kuaishou	~1225
7	Sora 2 Pro	OpenAI	1206

ที่น่าสนใจคือโมเดลล่าสุดของ OpenAI คือ Sora 2 Pro อยู่อันดับที่ 7 โมเดลนี้เน้นการสร้างเสียงและฟีเจอร์โซเชียล ส่งผลให้คุณภาพวิดีโอแท้จริงตามหลัง Runway ที่เชี่ยวชาญเฉพาะด้าน

AI ที่เข้าใจกฎฟิสิกส์

ความสำเร็จทางเทคนิคที่สำคัญที่สุดของ Gen-4.5 คือความสามารถในการจำลองปรากฏการณ์ทางฟิสิกส์ โมเดล AI วิดีโอแบบเดิมสร้าง “การเคลื่อนไหวที่ดูเหมือนจริง” โดยอิงจากความน่าจะเป็นทางสถิติ Gen-4.5 แสดงพฤติกรรมที่เข้าใจความสัมพันธ์เชิงสาเหตุและกฎฟิสิกส์ โมเดลนี้สร้าง World Model ขั้นสูง

โมเดลนี้วาดความหนืด การกระเซ็นของน้ำ คลื่นบนผิวน้ำเมื่อเทน้ำ ด้วยความแม่นยำใกล้เคียงกับการจำลองพลศาสตร์ของไหลจริง โมเดลนี้แสดงศักยภาพในการทดแทนซอฟต์แวร์จำลองของไหลราคาแพงใน CM ของบริษัทเครื่องดื่มและ VFX ในภาพยนตร์

นอกจากนี้ยังมีการปรับปรุง “Object Permanence” ซึ่งเป็นปัญหาเก่าแก่ของ AI วิดีโอ เมื่อบุคคลเดินผ่านไปหลังเสา โมเดลเดิมจะทำให้บุคคลหายไปหรือเปลี่ยนเป็นคนอื่น Gen-4.5 คำนวณว่าวัตถุนั้นยังอยู่ในระหว่างที่มองไม่เห็น โมเดลนี้รักษารูปร่างและคุณสมบัติที่สอดคล้องกันเมื่อวัตถุปรากฏขึ้นอีกครั้ง

การควบคุมสำหรับมืออาชีพ

สำหรับผู้สร้างภาพมืออาชีพ “การควบคุม” สำคัญกว่าคุณภาพของภาพ Gen-4.5 เหนือกว่าคู่แข่งในจุดนี้

ผู้ใช้สามารถระบุการทำงานของกล้องอย่างแม่นยำ เช่น Pan, Tilt, Zoom, Tracking โมเดลนี้ปรับปรุงฟีเจอร์ในการป้อนองค์ประกอบของภาพนิ่งเป็นภาพอ้างอิงและสร้างวิดีโอโดยรักษาโครงสร้างนั้น ผู้ใช้สามารถสร้างภาพตาม Storyboard และสร้างแอนิเมชันที่รักษาความสอดคล้องของการออกแบบตัวละครเฉพาะได้

ความสำเร็จของกลยุทธ์เชี่ยวชาญเฉพาะด้าน

เหตุใดสตาร์ทอัพที่มีพนักงาน 120 คนและมูลค่า 3.5 พันล้านดอลลาร์จึงชนะ Google และ Microsoft ที่มีมูลค่าตลาดเกิน 2 ล้านล้านดอลลาร์

Google และ OpenAI ขยายธุรกิจที่หลากหลาย โมเดลสร้างวิดีโอถูกออกแบบเป็นส่วนหนึ่งของ Ecosystem Veo 3 เน้นการเชื่อมโยงกับ YouTube Shorts Sora 2 เน้นการเชื่อมโยงกับ ChatGPT และ SNS ขณะที่ Runway มุ่งเน้นทรัพยากรไปที่จุดเดียว คือ “เครื่องมือสำหรับผู้สร้างภาพ”

Runway ใช้ข้อมูลภาพมืออาชีพคุณภาพสูงในการเรียนรู้ผ่านความร่วมมือกับสตูดิโอภาพยนตร์อย่าง Lionsgate ชุดข้อมูลที่สะอาดและมีโครงสร้างนี้มีส่วนทำให้การคำนวณฟิสิกส์แม่นยำ โมเดลนี้สามารถจำลองแสงแบบภาพยนตร์ได้

โครงสร้างพื้นฐาน Inference ของ Gen-4.5 ใช้ GPU “Blackwell” และ “Hopper” สถาปัตยกรรมล่าสุดของ NVIDIA Runway และ NVIDIA มีความร่วมมืออย่างใกล้ชิด โดย NVIDIA เป็นนักลงทุนของ Runway ความร่วมมือนี้ทำให้ Runway สามารถรักษาทรัพยากรการคำนวณนี้ได้

ผลกระทบต่ออุตสาหกรรม IT และแนวโน้มในอนาคต

การเปิดตัว Gen-4.5 แสดงให้เห็นว่าเทคโนโลยี AI สร้างวิดีโอเปลี่ยนจาก “ของเล่นทดลอง” เป็น “เครื่องมืออุตสาหกรรมที่ใช้งานได้จริง”

ในอุตสาหกรรมสร้างภาพ Gen-4.5 เป็นโอกาสในการสร้าง VFX ระดับฮอลลีวูดด้วยงบประมาณต่ำ อุปสรรคสำหรับบริษัทภาพยนตร์และละครอินดี้ลดลง บริษัทเหล่านี้สามารถจัดหาเนื้อหาคุณภาพสูงสำหรับแพลตฟอร์มโลกอย่าง Netflix ได้ง่ายขึ้น

อย่างไรก็ตาม เทคโนโลยีสร้างวิดีโอความละเอียดสูงอย่าง Gen-4.5 มีความเสี่ยงในการกัดเซาะความไว้วางใจทางสังคมด้วย Deepfake Gen-4.5 มีความละเอียดสูงกว่า Deepfake แบบเดิมมาก โมเดลนี้มีความขัดแย้งทางกายภาพน้อยมาก Runway เองได้นำเครื่องหมายน้ำอิเล็กทรอนิกส์อย่าง “SynthID” มาใช้ แต่มีความเป็นไปได้ที่จะถูกหลีกเลี่ยงทางเทคนิค

ตั้งแต่เดือนตุลาคม 2025 เทรนด์ของ AI กำลังเปลี่ยนจากการสร้างเนื้อหาเพียงอย่างเดียวไปสู่ “Agentic AI” ในการสร้างวิดีโอ รุ่นถัดไปของ Gen-4.5 คาดว่า AI จะทำหน้าที่เป็นผู้กำกับโดยให้บทภาพยนตร์เพียงอย่างเดียว AI จะทำการตัดต่อ การทำงานของกล้อง แสง การกำกับการแสดงโดยอัตโนมัติ

BKK IT News เห็นว่าในปี 2026 รุ่นพัฒนาของ Gen-4.5 อาจรวมฟีเจอร์ Agent และเปลี่ยนแปลง Workflow ของการสร้างภาพโดยพื้นฐาน