Google เปิดเผยตัวตน “nano-banana” คือ Gemini 2.5 Flash Image ~ปฏิวัติการแก้ไขภาพด้วย AI เปิดโอกาสใหม่ให้บริษัทไทย~

Google Gemini 2.5 Flash Image AI ใหม่ AI
AI

เมื่อวันที่ 26 สิงหาคม 2025 Google ได้ประกาศอย่างเป็นทางการว่าโมเดล AI ลึกลับที่มีชื่อรหัสว่า “nano-banana” ที่สร้างความฮือฮาในชุมชนนั้น คือผลิตภัณฑ์ล่าสุดของบริษัท “Gemini 2.5 Flash Image” โมเดลนี้ไม่ใช่เครื่องมือสร้างภาพทั่วไป แต่เป็นเครื่องมือสร้างสรรค์รุ่นใหม่ที่มีฟังก์ชันการแก้ไขที่แม่นยำด้วยภาษาธรรมชาติ สิ่งที่น่าสนใจที่สุดคือราคาที่แข่งขันได้เพียง 0.039 ดอลลาร์ต่อภาพ และความสามารถในการแก้ไขระดับสูงที่เทียบเคียงกับ Adobe Photoshop สำหรับบริษัทไทย นี่คือโอกาสที่จะเปลี่ยนแปลงการสร้างสื่อการตลาดคุณภาพสูงในต้นทุนต่ำ

จากปรากฏการณ์ “nano-banana” สู่การประกาศอย่างเป็นทางการ

Google ได้ใช้กลยุทธ์ก่อนเปิดตัวที่ชาญฉลาดมาก บริษัทได้ทดสอบโมเดลแบบไม่เปิดเผยชื่อบนแพลตฟอร์ม “LMArena” ซึ่งเป็นเว็บไซต์เปรียบเทียบ AI หลายสัปดาห์ก่อนการประกาศอย่างเป็นทางการ ผู้ใช้ต่างทึ่งกับประสิทธิภาพที่โดดเด่น และตั้งชื่อเล่นว่า “nano-banana” ให้เอง

จากการทดสอบแบบไม่เปิดเผยตัวตนนี้ “nano-banana” ได้รับคะแนนโหวตจากผู้ใช้มากกว่า 2.5 ล้านคะแนน และคว้าอันดับ 1 ในส่วนการแก้ไขภาพ ชนะคู่แข่งที่แข็งแกร่งอย่าง Flux จาก Black Forest Lab และ GPT-Image-1 จาก OpenAI อย่างท่วมท้น การโพสต์อีโมจิกล้วยอย่างลึกลับจากวิศวกรและผู้บริหารของ Google ก็ยิ่งเป็นเชื้อเพลิงให้ชุมชน AI พูดถึงกันอย่างกว้างขวาง

กลยุทธ์นี้ทำให้ Google ได้รับการยืนยันประสิทธิภาพแบบเป็นกลางจากบุคคลที่สามล่วงหน้า และสร้างความคาดหวังสูงสุดต่อผลิตภัณฑ์ได้ CEO Sundar Pichai ยังโพสต์อีโมจิกล้วยบน X (เดิมชื่อ Twitter) ในวันประกาศ โดยนำชื่อเล่นที่เกิดขึ้นเองจากชุมชนมาใช้ในการตลาดอย่างเป็นทางการ

ฟังก์ชันปฏิวัติของ Gemini 2.5 Flash Image

Gemini 2.5 Flash Image ที่ประกาศอย่างเป็นทางการมีฟังก์ชันที่แตกต่างจากเครื่องมือสร้างภาพ AI แบบดั้งเดิม คุณลักษณะสำคัญที่สุดคือฟังก์ชัน “การรักษาความสอดคล้องของตัวละครและวัตถุ” สามารถรักษาลักษณะภายนอกของบุคคลหรือวัตถุเฉพาะได้อย่างสอดคล้องผ่านการแก้ไขภาพหลายๆ ครั้ง นี่คือการแก้ปัญหาพื้นฐานของการสร้างภาพ AI แบบเดิม

ฟังก์ชันการแก้ไขด้วยภาษาธรรมชาติก็เป็นนวัตกรรมเช่นกัน ผู้ใช้สามารถสั่งได้ด้วยคำสั่งง่ายๆ เช่น “เบลอพื้นหลัง” “ลบคราบเสื้อยืด” “เปลี่ยนกางเกงเป็นยีนส์สีฟ้าอ่อน” แล้วแก้ไขส่วนเฉพาะในภาพได้อย่างแม่นยำ งานที่เคยต้องใช้เทคนิคเฉพาะทางอย่างการสร้าง mask หรือการจัดการ layer จะไม่จำเป็นอีกต่อไป

ฟังก์ชันการผสมและการประกอบภาพหลายภาพสามารถดึงองค์ประกอบจากภาพหลายภาพ และรวมเป็นภาพใหม่ที่มีความสอดคล้อง สิ่งที่น่าทึ่งคือความสามารถในการสร้างส่วนของร่างกายเช่นแขนหรือขาที่ไม่มีในภาพต้นฉบับ โดยสร้างได้อย่างเป็นธรรมชาติตามบริบท

ฟังก์ชันการแก้ไขแบบหลายรอบ (Multi-turn editing) ทำให้สามารถให้คำสั่งแก้ไขแบบสนทนาซ้ำๆ เพื่อพัฒนาภาพทีละขั้น โมเดลจะรักษาบริบทของทั้งฉากในแต่ละขั้นตอน และเพิ่มการปรับแต่งโดยคงความสอดคล้อง

ในด้านราคา การใช้ API ตั้งราคาที่ 30 ดอลลาร์ต่อ 1 ล้าน output token และการสร้างหรือแก้ไขภาพ 1 ครั้งคำนวณเป็น 1,290 output token ทำให้ได้ราคาที่แข่งขันได้สูงเพียง 0.039 ดอลลาร์ต่อภาพ

ในเวลาเดียวกับการประกาศ ก็สามารถใช้งานได้ทันทีผ่านแอป Gemini สำหรับผู้ใช้ทั่วไป Gemini API สำหรับนักพัฒนา Google AI Studio และแพลตฟอร์ม Vertex AI สำหรับองค์กร เพื่อส่งเสริมการใช้งานอย่างกว้างขวาง ยังจับมือกับ OpenRouter และ fal.ai รวมถึงใช้งานได้ใน Creative Cloud และ Firefly ของ Adobe อีกด้วย

ข้อโต้แย้งเริ่มต้นจากการเพิ่มการเซ็นเซอร์

แต่หลังจากเปิดตัวอย่างเป็นทางการ ก็เกิดการวิพากษ์วิจารณ์อย่างรุนแรง โดยเฉพาะจากชุมชนครีเอทีฟบน Reddit ตามรายงานจากผู้ใช้ Gemini 2.5 Flash Image เวอร์ชันทางการมีปัญหา “การเซ็นเซอร์มากเกินไป” เมื่อเปรียบเทียบกับเวอร์ชันพรีวิวที่ทดสอบบน LMArena

พรอมต์สร้างสรรค์หลายอย่างที่ถูกกฎหมายและเหมาะสมทุกวัยที่เคยใช้ได้ในเวอร์ชันพรีวิว กลับถูกปฏิเสธในเวอร์ชันผลิตภัณฑ์ ทำให้เกิดความไม่พอใจอย่างมากว่า “ไม่สามารถใช้งานได้สำหรับความต้องการสร้างสรรค์ที่ถูกต้องหลายอย่าง”

ปัญหานี้เผยให้เห็นความขัดแย้งโครงสร้างที่แฝงอยู่ในกลยุทธ์ก่อนเปิดตัวของ Google “nano-banana” สามารถคว้าอันดับ 1 ในเบนช์มาร์กได้เพราะการเซ็นเซอร์ที่หลวม และสามารถตอบสนองคำสั่งสร้างสรรค์ได้กว้างขวางกว่า แต่ทีมกฎหมายและจัดการความเสี่ยงของบริษัทต้องการการใช้ฟิลเตอร์ที่เข้มงวดกว่าในการเปิดตัวอย่างเป็นทางการ

ผลกระทบและโอกาสการใช้งานสำหรับบริษัทไทย

การเปิดตัว Gemini 2.5 Flash Image นำมาซึ่งโอกาสใหญ่ในการเพิ่มความสามารถในการแข่งขันให้บริษัทไทย โดยเฉพาะในสาขาโฆษณา การตลาด และอีคอมเมิร์ซ จะสามารถสร้างเนื้อหาภาพคุณภาพสูงในต้นทุนต่ำได้

ประโยชน์ที่ใหญ่ที่สุดสำหรับ SME คือการแก้ไขภาพคุณภาพมืออาชีพที่เคยต้องใช้ค่าใช้จ่ายสูง ตอนนี้สามารถใช้งานได้ในราคาเพียงหลักพันบาทต่อเดือน การเปลี่ยนพื้นหลังภาพสินค้า การเปลี่ยนเสื้อผ้าบุคคลในภาพ การปรับภาพให้เข้ากับแบรนด์อิมเมจ จะทำได้โดยไม่ต้องมีความรู้เฉพาะทาง

ในอุตสาหกรรมท่องเที่ยว โรงแรมและบริษัททัวร์สามารถสร้างภาพการตลาดที่ปรับแต่งส่วนบุคคลได้อย่างสมบูรณ์ตามข้อมูลความชอบของลูกค้า นอกจากนี้ ในอุตสาหกรรมการผลิต จะสามารถขยายแคตตาล็อกสินค้าเป็นหลายภาษา และสร้างภาพสถานการณ์การใช้งานเสมือนได้อย่างมีประสิทธิภาพ

BKK IT News คาดการณ์ว่าเทคโนโลยีนี้จะมีบทบาทสำคัญในการขับเคลื่อนกลยุทธ์ “Thailand 4.0” สอดคล้องกับนโยบายของรัฐบาลไทยที่มุ่งสู่การเปลี่ยนผ่านเศรษฐกิจดิจิทัล และจะช่วยยกระดับความสามารถในการแข่งขันของอุตสาหกรรมสร้างสรรค์ในระดับนานาชาติ

การเปลี่ยนแปลงของสภาพแวดล้อมการแข่งขันในตลาดอนาคต

การเปิดตัว Gemini 2.5 Flash Image จะทำให้การแข่งขันในตลาดการแก้ไขภาพ AI ทวีความรุนแรงขึ้น โดยเฉพาะภัยคุกคามต่อ Adobe ที่จะส่งผลกระทบต่อผลิตภัณฑ์เดิมอย่าง Photoshop และ Firefly

คู่แข่งอย่าง OpenAI และ Black Forest Lab อาจจะเร่งพัฒนาฟังก์ชันคล้ายกันตามความสำเร็จของ Google ในขณะเดียวกัน จากปัญหาการเซ็นเซอร์ ความต้องการโมเดลโอเพนซอร์สที่มีข้อจำกัดน้อยกว่า หรือเครื่องมือเฉพาะทางสำหรับผู้เชี่ยวชาญด้านสร้างสรรค์อาจจะเพิ่มขึ้น

ในระยะยาว การทำให้การแก้ไขภาพเป็นเรื่องง่าย จะทำให้ทุกคนสามารถสร้างเนื้อหาภาพคุณภาพสูงได้ ซึ่งจะทำให้ปริมาณเนื้อหาเพิ่มขึ้นอย่างมาก แต่การสร้างความแตกต่างด้วยคุณภาพจะสำคัญมากขึ้น

กลยุทธ์การนำเข้าใช้ที่บริษัทควรพิจารณา

สำหรับบริษัทไทยที่จะใช้ Gemini 2.5 Flash Image ให้มีประสิทธิภาพ กลยุทธ์การนำเข้าใช้แบบทีละขั้นตอนเป็นสิ่งสำคัญ ขั้นแรกควรวิเคราะห์เวิร์กโฟลว์การตลาดที่มีอยู่ และทดลองนำเข้าใช้จากพื้นที่ที่คาดหวังผลสูงสุด

การจัดระบบการจัดการข้อมูลก็ขาดไม่ได้ เพื่อให้เครื่องมือ AI ได้ประสิทธิภาพสูงสุด จำเป็นต้องจัดระเบียบและจำแนกข้อมูลเช่นภาพสินค้าและข้อมูลลูกค้าให้เหมาะสม นอกจากนี้ การเข้าใจความเสี่ยงทางกฎหมายเกี่ยวกับลิขสิทธิ์และทรัพย์สินทางปัญญา และการใช้งานภายใต้ข้อกำหนดการใช้งานที่เหมาะสมก็สำคัญ

การลงทุนในการฝึกอบรมพนักงานก็จำเป็น การเรียนรู้เทคนิค prompt engineering และการสร้างเวิร์กโฟลว์ที่ใช้ AI ช่วยเหลือ จะทำให้สามารถใช้ประโยชน์จากเครื่องมือได้อย่างแท้จริง การใช้โปรแกรมอย่าง Google Career Certificates และการฝึกอบรมที่ตรงกับความต้องการของตลาดจริงจะมีประสิทธิภาพ

สุดท้ายควรมองไปถึงการสร้างโมเดลธุรกิจใหม่ที่ใช้ AI ไม่ควรมองเป็นเพียงเครื่องมือลดต้นทุน แต่ควรตั้งตำแหน่งเป็นวิธีการสร้างคุณค่าใหม่ เพื่อสร้างความแตกต่างจากคู่แข่ง

ลิงก์บทความอ้างอิง