Microsoft เปิดตัว Fara-7B ~ AI ควบคุมคอมพิวเตอร์ด้วยการมองเห็นเปิดยุคใหม่ของระบบอัตโนมัติ~

Microsoft เปิดตัว Fara-7B ~ AI ควบคุมคอมพิวเตอร์ด้วยการมองเห็นเปิดยุคใหม่ของระบบอัตโนมัติ~ AI
AI

ปลายเดือนพฤศจิกายน 2025 Microsoft ได้ประกาศเปิดตัว “Fara-7B” โมเดลขนาดเล็กที่มีเพียง 7 พันล้านพารามิเตอร์ แต่สามารถจดจำหน้าจอคอมพิวเตอร์ด้วยสายตาและควบคุมเมาส์และคีย์บอร์ดเพื่อทำงานให้เสร็จสมบูรณ์ได้ ในฐานะ “On-device AI” ที่หลุดพ้นจากการพึ่งพา Cloud นำเสนอทางเลือกใหม่ในการทำงานอัตโนมัติขององค์กร

เทคโนโลยีใหม่ที่ใช้การมองเห็น

Fara-7B สามารถควบคุม PC ได้เพียงแค่ดูภาพหน้าจอ เครื่องมืออัตโนมัติแบบเดิมพึ่งพาโครงสร้าง DOM ของ HTML หรือ Accessibility API แต่ Fara-7B ตัดสินใจจาก “รูปลักษณ์” เหมือนมนุษย์ ระบบจดจำองค์ประกอบภาพเช่นปุ่ม ลิงก์ ฟอร์มกรอกข้อมูล และทำนายพิกัดที่ควรคลิกหรือข้อความที่ควรกรอก

แนวทางที่ขับเคลื่อนด้วยการมองเห็นนี้มีข้อได้เปรียบสำคัญ สามารถทำงานได้แม้กับระบบเก่าที่ไม่มี API ตราบใดที่มี GUI ก็สามารถใช้งานได้กับทุกเป้าหมาย Fara-7B ใช้สถาปัตยกรรมที่ปรับปรุงมาจาก “Qwen2.5-VL-7B” ซึ่งเชี่ยวชาญในการประมวลผลรูปภาพและภาษาแบบบูรณาการ

นวัตกรรมการสร้างข้อมูลการเรียนรู้

สิ่งที่สนับสนุนประสิทธิภาพคือระบบสร้างข้อมูลการเรียนรู้ “FaraGen” ข้อมูลขั้นตอนการทำงานของมนุษย์บน PC หายากมาก การขาดแคลนชุดข้อมูลคุณภาพสูงเป็นอุปสรรคในการพัฒนา FaraGen ใช้ GPT-4 สร้างสถานการณ์งานบนเว็บที่หลากหลายและจำลองกระบวนการแก้ปัญหาเพื่อแก้ไขปัญหานี้

Microsoft ประสบความสำเร็จในการผลิตข้อมูลการทำงานที่มีคุณภาพสูงและผ่านการตรวจสอบแล้วในปริมาณมาก ต้นทุนต่ำเพียง 1 ดอลลาร์ต่องาน Fara-7B ได้รับการฝึกอบรมอย่างละเอียดโดยใช้ข้อมูลสังเคราะห์นี้ ผลลัพธ์คือความแม่นยำในการทำงานเทียบเท่าหรือดีกว่าโมเดลที่มีหลายพันพันล้านพารามิเตอร์ แม้จะมีเพียง 7 พันล้านพารามิเตอร์

ในการประเมิน Fara-7B ทำงานให้เสร็จด้วยเฉลี่ย 16 ขั้นตอน ในขณะที่โมเดลคู่แข่งใช้เฉลี่ย 41 ขั้นตอน มีการทำงานสูญเปล่าหรือหลงทางน้อย เมื่อผสมกับความเร็วในการประมวลผลแบบ on-device ระบบสามารถปรับปรุงประสบการณ์ผู้ใช้โดยตรง

ประโยชน์ของการประมวลผลแบบ On-device

สิ่งสำคัญคือการประมวลผลทั้งหมดเสร็จสมบูรณ์ภายใน “อุปกรณ์” AI Agent แบบ Cloud จำเป็นต้องส่งภาพหน้าจอไปยังเซิร์ฟเวอร์ ซึ่งมีความเสี่ยงของการรั่วไหลของข้อมูลและข้อกังวลด้านการปฏิบัติตามกฎระเบียบ

Fara-7B ใช้ NPU (Neural Processing Unit) ในเครื่องทำการอนุมาน ระบบกำจัดความเสี่ยงของการรั่วไหลของข้อมูลลับสู่เครือข่ายภายนอกอย่างเป็นโครงสร้าง นักวิจัยของ Microsoft เสนอแนวคิด “Pixel Sovereignty” แนวคิดนี้หมายถึงสถานะที่ข้อมูลหน้าจอ (พิกเซล) ของผู้ใช้ได้รับการประมวลผลโดยไม่ออกจากอุปกรณ์

ระบบมีข้อได้เปรียบด้านต้นทุนด้วย AI Agent แบบ Cloud คิดค่าใช้จ่ายตามโทเค็นในแต่ละขั้นตอนการทำงาน แต่ Fara-7B เมื่อนำมาใช้แล้ว ต้นทุนการอนุมานคือค่าไฟฟ้าเท่านั้น ประสิทธิภาพด้านต้นทุนที่โดดเด่นนี้ช่วยให้ SME ที่มีอัตรากำไรต่ำได้รับประโยชน์จาก AI

กลยุทธ์ SLM ของ Microsoft

การเปิดตัว Fara-7B คือจุดสูงสุดของกลยุทธ์ “ประชาธิปไตย AI” และ “ประสิทธิภาพ” ที่ Microsoft ส่งเสริมมานาน Microsoft แสวงหาความเป็นไปได้ของโมเดลภาษาขนาดเล็ก (SLM) เป็นทางเลือกแทน LLM ที่ใหญ่ขึ้นเรื่อยๆ

ตัวแทนคือซีรีส์ “Phi” Phi-1 ในปี 2023 แสดงประสิทธิภาพสูงในงานการเขียนโปรแกรมด้วย 1.3 พันล้านพารามิเตอร์ โมเดลเรียนรู้จากข้อมูลคุณภาพสูงเท่านั้น Phi-2 เสริมความสามารถในการอนุมาน Phi-3 และ Phi-3.5 รวมฟังก์ชันการมองเห็น โมเดลเหล่านี้ถูกนำไปใช้เป็น SLM ที่ใช้งานได้จริงบนสมาร์ทโฟนและ PC

Fara-7B นำเทคโนโลยีที่พัฒนาในซีรีส์ Phi มาประยุกต์ใช้ในพื้นที่ใหม่คือ “การทำงานของ PC” ปี 2024 เป็นปีที่ Generative AI วิวัฒนาการเป็น “Copilot (รองนักบิน)” เข้าสู่ปี 2025 แนวโน้มของอุตสาหกรรม AI เปลี่ยนไปสู่ “Agent” อย่างรวดเร็ว

Fara-7B คือคำตอบ “On-device” ที่ Microsoft นำเสนอต่อคลื่น “Agent” นี้ บริษัทอื่นมุ่งสู่ Agent ประสิทธิภาพสูงที่พึ่งพา Cloud Power Microsoft เลือกใช้จุดแข็งของระบบนิเวศ Windows คือ “PC Hardware” อย่างเต็มที่ บริษัทเน้น “ความเร็ว” และ “ความปลอดภัย” จากการทำงานแบบ Local เป็นปัจจัยความแตกต่าง

ผลกระทบต่อองค์กรและสถานการณ์การใช้งาน

Fara-7B นำเสนอทางเลือกใหม่ในการทำงานอัตโนมัติขององค์กร แม้จะเป็นระบบเก่าที่ไม่มี API ระบบก็สามารถดูหน้าจอและทำงานได้ องค์กรสามารถทำให้เป็นอัตโนมัติได้โดยใช้ประโยชน์จากสินทรัพย์ที่มีอยู่โดยไม่ต้องเปลี่ยนระบบ

ตัวอย่างเช่น สามารถให้ Fara-7B อ่านข้อความสั่งซื้อที่ได้รับทาง LINE และป้อนข้อมูลโดยอัตโนมัติลงในแอปพลิเคชันเดสก์ท็อปเก่า ในตลาดอย่างไทยที่อัตราการใช้ LINE สูงมาก บทบาทในการเชื่อมช่องว่างระหว่างแอปพลิเคชันแชทและระบบธุรกิจมีความสำคัญมาก

ระบบยังสามารถสนับสนุนการใช้บริการดิจิทัลของผู้สูงอายุหรือผู้ที่มีการทำงานของสายตาและปลายนิ้วลดลง ระบบแทนที่การทำงาน UI ที่ซับซ้อน ผู้ใช้เพียงแค่สั่งด้วยเสียง AI ก็จะทำงานกับแอปธนาคารหรือเว็บไซต์โรงพยาบาล นี่คือแนวทางแก้ไข Digital Divide ด้วย “การแทนที่โดยเทคโนโลยี”

ลักษณะการประมวลผลแบบ on-device มีประสิทธิภาพเป็นพิเศษในสภาพแวดล้อมที่ต้องปฏิบัติตาม PDPA การรับประกันว่าข้อมูลไม่ออกจาก PC เป็นปัจจัยเร่งการนำไปใช้ในด้าน Healthcare และ FinTech ที่จัดการข้อมูลทางการแพทย์และข้อมูลทางการเงิน

การรับมือกับความเสี่ยงและความท้าทาย

“คำโกหกที่น่าเชื่อ (Hallucination)” ของ Generative AI อาจนำไปสู่ผลลัพธ์ร้ายแรงในการทำงานของ PC ความเสี่ยงที่ Fara-7B เห็นผิดระหว่างปุ่ม “ซื้อ” และ “ยกเลิก” บนหน้าจออาจเกิดขึ้นได้ การป้อนเลข “0” เกินไปหนึ่งตัวในจำนวนเงินโอนก็เป็นไปได้

Microsoft ขณะนี้แนะนำให้ใช้ใน “Sandbox (สภาพแวดล้อมแยก)” การนำไปใช้ในธุรกิจจริงต้องมีการตรวจสอบอย่างระมัดระวัง ความกังวลด้านความปลอดภัยก็มีอยู่ หากถูกใช้โดยผู้โจมตีที่มีเจตนาร้าย อาจเกิด “Malware แบบอัตโนมัติ”

Fara-7B ต้องการ PC ล่าสุดที่มี NPU ประสิทธิภาพสูงเพื่อทำงานได้อย่างราบรื่น ข้อกำหนดฮาร์ดแวร์นี้กลายเป็นอุปสรรคใหม่ ความกังวลคือระบบจะขยายความแตกต่างระหว่างกลุ่มที่ได้รับประโยชน์จาก AI และกลุ่มที่ไม่ได้รับ

ความหมายในตลาดไทย

ในประเทศไทย เมื่อวันที่ 18 พฤศจิกายน 2025 Microsoft ประกาศความมุ่งมั่นเชิงกลยุทธ์ บริษัทกำลังส่งเสริมการเปิด Local Cloud Region และการพัฒนาบุคลากร AI Microsoft กำลังดำเนินโครงการพัฒนาทักษะ AI 150,000 คนร่วมกับกระทรวงแรงงานไทย ฐานการแพร่กระจายเครื่องมือ AI ที่ใช้งานได้จริงเช่น Fara-7B กำลังพร้อม

SME ของไทยเป็นแกนหลักที่คิดเป็นกว่า 99% ของจำนวนบริษัทและกว่า 70% ของการจ้างงาน หลายบริษัทยังคงใช้ซอฟต์แวร์บัญชีและระบบจัดการสินค้าคงคลังเก่าที่ไม่รองรับการเชื่อมต่อ API เป็นหลัก Fara-7B ทำหน้าที่เป็น “สะพาน” ระหว่างระบบเก่าและเทคโนโลยีใหม่ ระบบนำเสนอความเป็นไปได้ในการทำให้เป็นอัตโนมัติทางธุรกิจโดยไม่ต้องเปลี่ยนระบบที่มีค่าใช้จ่ายสูง

กฎหมายคุ้มครองข้อมูลส่วนบุคคลของไทย (PDPA) มีผลบังคับใช้อย่างเต็มที่ในปี 2022 กฎหมายกำหนดระเบียบวินัยอย่างเข้มงวดในการจัดการข้อมูลของบริษัท Fara-7B ที่ทำงานแบบ on-device สามารถประมวลผลโดยไม่ส่งข้อมูลส่วนบุคคลของลูกค้าไปยังเซิร์ฟเวอร์ต่างประเทศ ระบบจึงมีข้อได้เปรียบจากมุมมองการปฏิบัติตาม PDPA

แนวโน้มในอนาคต

Fara-7B แสดงจุดเปลี่ยนสำคัญในยุค AI Agent AI ควบคุมด้วยการมองเห็นหลุดพ้นจากการพึ่งพา Cloud ระบบเสร็จสมบูรณ์แบบ on-device ระบบบรรลุข้อได้เปรียบสามประการพร้อมกัน คือการปกป้องความเป็นส่วนตัว การลดต้นทุน และความเข้ากันได้กับระบบเก่า

ในตลาดเช่นไทย SME เป็นศูนย์กลางเศรษฐกิจ กฎระเบียบการคุ้มครองข้อมูลส่วนบุคคลเช่น PDPA ถูกเสริมกำลัง ลักษณะทางเทคนิคของ Fara-7B มีความเหมาะสมสูง อย่างไรก็ตาม ความเสี่ยงของการทำงานผิดพลาดจาก Hallucination และความกังวลด้านความปลอดภัยยังมีอยู่ ระบบควบคุมดูแลและการศึกษาผู้ใช้ที่เหมาะสมจึงจำเป็น

BKK IT News เห็นว่าสิ่งต่อไปนี้จำเป็น การศึกษา “ทักษะการดูแล” เพื่อป้องกันการทำงานผิดพลาดของ AI มาตรการสนับสนุนเพื่อให้ได้รับประโยชน์แม้มีฮาร์ดแวร์เก่า และกฎหมายใหม่บนสมมติฐานของการทำงานอัตโนมัติโดย AI Fara-7B จะกลายเป็นจุดทดสอบสำหรับการเติบโตจากผู้ใช้ AI สู่ “สังคมที่อยู่ร่วมกับ AI”

ลิงก์บทความอ้างอิง