Anthropic เปิดตัวโมเดลระดับสูงสุด~Claude Opus 4.5 มาตรฐานใหม่แห่งการแข่งขันพัฒนา AI

Anthropic เปิดตัวโมเดลระดับสูงสุด~Claude Opus 4.5 มาตรฐานใหม่แห่งการแข่งขัน AI AI
AI

Anthropic ได้ประกาศเปิดตัวโมเดลระดับสูงสุด “Claude Opus 4.5” เมื่อวันที่ 24 พฤศจิกายน 2025 ในช่วงเดือนพฤศจิกายนนี้ Google ได้ประกาศ Gemini 3 Pro และ OpenAI ได้ประกาศ GPT-5.1 ตามลำดับ การแข่งขันในอุตสาหกรรม AI กำลังทวีความรุนแรงขึ้น Opus 4.5 บันทึกคะแนนประสิทธิภาพการเขียนโค้ดที่ 80.9% และลดราคาลงเหลือหนึ่งในสามของราคาเดิม

การประกาศโมเดลใหม่จากบริษัท AI

ในเดือนพฤศจิกายน 2025 บริษัท AI ชั้นนำได้ประกาศโมเดลรุ่นใหม่อย่างเข้มข้น Google ประกาศ Gemini 3 Pro เมื่อวันที่ 18 พฤศจิกายน OpenAI ประกาศ GPT-5.1 เมื่อวันที่ 19 พฤศจิกายน Anthropic ประกาศ Claude Opus 4.5 เมื่อวันที่ 24 พฤศจิกายน

เบื้องหลังการประกาศที่เข้มข้นนี้คือช่วงเวลาต่ออายุสัญญาสำหรับองค์กรขนาดใหญ่ในช่วงปลายปี แต่ละบริษัทกำลังมุ่งเป้าไปที่การรักษาระบบนิเวศสำหรับนักพัฒนาในปี 2026

Anthropic ได้เร่งการขยายผลิตภัณฑ์ในปี 2025 โดยเปิดตัว Claude 4 ในเดือนพฤษภาคม Opus 4.1 ในเดือนสิงหาคม Sonnet 4.5 ในเดือนกันยายน และ Haiku 4.5 ในเดือนตุลาคม Opus 4.5 เป็นโมเดลตัวสุดท้ายของซีรีส์นี้

ฟีเจอร์หลักของ Claude Opus 4.5

นวัตกรรมที่ยิ่งใหญ่ที่สุดของ Opus 4.5 คือการแนะนำ “Effort Parameter” ผู้ใช้สามารถเลือกการตั้งค่า 3 ระดับ คือ low, medium, high เมื่อร้องขอ API การตั้งค่า Low จะให้ความสำคัญกับความเร็วและประสิทธิภาพต้นทุน การตั้งค่า High จะทำการคิดและตรวจสอบอย่างละเอียดสำหรับการใช้เหตุผลที่ซับซ้อนและงานการเขียนโค้ด

จากเบนช์มาร์กภายในของ Anthropic การตั้งค่า High สามารถลดจำนวนโทเค็นลง 48% พร้อมกับปรับปรุงคะแนน SWE-bench Verified ขึ้น 4.3 คะแนน การที่ผู้ใช้สามารถจัดการความสมดุลระหว่างต้นทุนและความแม่นยำได้ จะช่วยเพิ่มความสามารถในการคาดการณ์สำหรับการใช้งานระดับองค์กร

ฟังก์ชันสำหรับเอเจนต์ที่ทำงานระยะยาวได้รับการปรับปรุง กระบวนการคิดของผู้ช่วยที่เคยถูกยกเลิกในโมเดลก่อนหน้านี้ จะถูกเก็บไว้ในบริบทโดยค่าเริ่มต้น เทคโนโลยี Compaction จะบีบอัดข้อมูลบริบทที่เพิ่มขึ้นจากการทำงานระยะยาวโดยไม่สูญเสียความหมาย

ฟังก์ชัน Computer Use ได้รับการพัฒนา มีการสนับสนุน “Zoom Tool” ใหม่ที่สามารถขยายพื้นที่เฉพาะบนหน้าจอเพื่อตรวจสอบรายละเอียด บันทึกคะแนน 66.3% ใน OSWorld benchmark ซึ่งมีความก้าวหน้าอย่างชัดเจนจาก Sonnet 4.5 (61.4%) และ Opus 4.1 (44.4%)

การเปรียบเทียบกับโมเดลคู่แข่ง

SWE-bench Verified เป็นเบนช์มาร์กการเขียนโค้ดที่วัดความสามารถในการแก้ปัญหาจริงบน GitHub Opus 4.5 บันทึกคะแนน 80.9% GPT-5.1 Codex Max อยู่ที่ 77.9%, Claude Sonnet 4.5 อยู่ที่ 77.2%, Gemini 3 Pro อยู่ที่ 76.2% Opus 4.5 เป็นโมเดลแรกที่ทะลุกำแพง 80%

ในด้านราคามีการปรับเปลี่ยนอย่างมาก Opus 4.5 มีราคา input $5.00/output $25.00 Opus 3 ก่อนหน้านี้มีราคา input $15/output $75 ดังนั้นจึงเป็นการตั้งราคาประมาณหนึ่งในสาม GPT-5.1 อยู่ที่ input $1.25/output $10.00, Gemini 3 Pro อยู่ที่ input $2.00/output $12.00 Opus 4.5 ถึงแม้จะลดราคาลงแล้ว แต่ยังคงมีราคาสูงกว่าคู่แข่ง

ในด้านความปลอดภัย Opus 4.5 แสดงความแข็งแกร่งที่เหนือกว่าบริษัทอื่น จากการทดสอบอิสระโดย Gray Swan อัตราความสำเร็จของการโจมตี Opus 4.5 อยู่ที่ 4.7% Gemini 3 Pro อยู่ที่ 12.5%, GPT-5.1 อยู่ที่ 21.9% สำหรับอุตสาหกรรมที่มีความต้องการด้านความปลอดภัยสูง เช่น สถาบันการเงินและสถาบันการแพทย์ ความแข็งแกร่งนี้อาจเป็นปัจจัยสำคัญในการตัดสินใจนำมาใช้

การเปลี่ยนแปลงบทบาทของนักพัฒนา

พร้อมกับการเปิดตัว Opus 4.5 มีความเห็นบางส่วนว่า “วิศวกรรมซอฟต์แวร์ได้รับการแก้ไขแล้ว” Opus 4.5 ได้บันทึกคะแนนสูงกว่าผู้สมัครในอดีตทั้งหมดในการสอบคัดเลือกของ Anthropic

อย่างไรก็ตาม มีความเห็นระมัดระวังจากสถานที่พัฒนาจริง มีเสียงที่ว่า “สามารถทำแอปง่ายๆ ได้ แต่การบำรุงรักษาระบบเก่าเป็นเรื่องอื่น” และมีรายงานว่า “การทดสอบครึ่งหนึ่งล้มเหลว”

สิ่งที่กำลังเกิดขึ้นในขณะนี้ไม่ใช่ “การทดแทนนักพัฒนาอย่างสมบูรณ์” แต่เป็น “การเปลี่ยนแปลงเชิงคุณภาพของกระบวนการพัฒนา” บทบาทของนักพัฒนากำลังเปลี่ยนจากงานเขียนโค้ดไปสู่การกำหนดข้อกำหนด การตรวจสอบโค้ดที่ AI เขียน และการออกแบบระบบโดยรวม

การเชื่อมต่อกับแพลตฟอร์มคลาวด์

Opus 4.5 พร้อมใช้งานบนแพลตฟอร์มคลาวด์หลักพร้อมกับการเปิดตัว Amazon Bedrock รักษาปริมาณงานในช่วงเวลาที่มีความต้องการสูงผ่านการอนุมานข้ามภูมิภาค Google Vertex AI พร้อมใช้งานทันที Microsoft Azure (Foundry) เริ่มให้บริการแล้ว

เครื่องมือสำหรับนักพัฒนามีความหลากหลาย Claude Agent SDK เป็นโครงสร้างพื้นฐานที่ Anthropic ใช้ในการสร้าง Claude Code โดยเปิดให้ใช้งานในรูปแบบ SDK Opus 4.5 สามารถใช้งานได้บน GitHub Copilot และแนะนำให้ใช้สำหรับการรีแฟคเตอร์ที่ซับซ้อนและการวางแผน

แนวโน้มในอนาคต

การเปิดตัว Claude Opus 4.5 แสดงให้เห็นอย่างชัดเจนว่าการแข่งขันของโมเดล AI ได้เปลี่ยนจาก “ความฉลาดของแชทบอท” ไปสู่ “การใช้งานจริงของเอเจนต์อัตโนมัติ” คะแนน SWE-bench 80.9% และความแข็งแกร่งที่อัตราความสำเร็จของการโจมตี 4.7% ได้กลายเป็นมาตรฐานใหม่สำหรับการใช้งานระดับองค์กร

เพื่อรองรับปี 2026 องค์กรกำลังเผชิญกับความท้าทายที่เปลี่ยนจาก “จะใช้ AI อย่างไร” ไปสู่ “จะทำงานร่วมกับและจัดการเอเจนต์ AI อย่างไร” มนุษย์อาจต้องรับบทบาทเป็น “ผู้กำกับดูแล” ที่ไม่เพียงแต่สั่งการ AI แต่ยังอนุมัติแผนที่ AI สร้างขึ้นและรับผิดชอบต่อผลลัพธ์

Google และ OpenAI กำลังเปิดตัวโมเดลใหม่ต่อเนื่อง คาดว่าการแข่งขันพัฒนา AI จะทวีความรุนแรงขึ้นในอนาคต BKK IT News เห็นว่าควรประเมินทั้ง 3 องค์ประกอบ คือ ต้นทุน ประสิทธิภาพ และความปลอดภัย อย่างครอบคลุม และเลือกโมเดลที่เหมาะสมกับการใช้งานขององค์กร

ลิงก์บทความอ้างอิง