เทคนิคใหม่ นักวิจัยสร้าง โมเดล AI ราคาถูก แต่ฉลาดเทียบชั้น OpenAI o1

โมเดล AI ราคาถูก

ทีมวิจัยจากมหาวิทยาลัยสแตนฟอร์ดและวอชิงตันได้พัฒนาระบบ AI ตัวใหม่ที่เรียกว่า s1 โดยอาศัยวิธีการที่ประหยัดค่าใช้จ่ายมากกว่าแบบเดิมๆ และยังมีความสามารถใกล้เคียงกับ OpenAI’s o1 ซึ่งเป็นโมเดลที่ได้รับการยอมรับในด้านความสามารถด้านการให้เหตุผล

การสร้างโมเดล AI ใหม่ตั้งแต่ต้น มักจะมีค่าใช้จ่ายสูงถึงหลักล้านดอลลาร์ แต่ทีมวิจัยเลือกใช้เทคนิค Distillation หรือการปรับแต่งโมเดลที่มีอยู่แล้วให้มีความสามารถเฉพาะทางมากขึ้น

ในกรณีนี้ พวกเขานำความสามารถด้านการให้เหตุผลจากโมเดล Gemini 2.0 ของ Google มาปรับใช้กับโมเดลพื้นฐานที่มีราคาถูกกว่า โดยการฝึกให้เลียนแบบกระบวนการแก้ปัญหาแบบทีละขั้นตอนบนชุดข้อมูลขนาดเล็ก

ทีมงานยังเปิดเผยซอร์สโค้ดและข้อมูลทั้งหมดบน GitHub พร้อมทั้งตีพิมพ์บทความอธิบายถึงกระบวนการที่ใช้ เทคนิคนี้ไม่ใช่เรื่องใหม่เสียทีเดียว หลายทีมเคยใช้ distillationมาก่อน

แม้ OpenAI เองจะเคยกล่าวหาว่า DeepSeek ใช้แนวทางนี้ แต่การที่ทีมสแตนฟอร์ดและวอชิงตันสามารถทำให้ต้นทุนต่ำลงอย่างมากก็ชัดเจนแล้วว่า วิธีการของ OpenAI อาจจะต้องมีการปรับปรุง

นอกจากนี้ ทีมงานยังค้นพบวิธีการใหม่ที่เรียกกันง่ายๆ ว่ารอหรือ wait trick ซึ่งเป็นการให้โมเดลหยุดคิดสักครู่ก่อนที่จะให้คำตอบ วิธีนี้ช่วยให้ AI มีเวลาตรวจสอบกระบวนการคิดของตัวเองอีกครั้ง และสามารถปรับปรุงคำตอบให้ดีขึ้นเล็กน้อย

ความท้าทายและข้อจำกัดที่ยังต้องพิจารณา
ถึงแม้ว่าโมเดล s1 จะมีความสามารถโดดเด่นเมื่อเทียบกับต้นทุนต่ำมาก แต่ยังมีข้อจำกัด เช่น ความสามารถอาจยังไม่สามารถขยายไปสู่ระดับสูงสุดได้ และยังอาจต้องเผชิญกับข้อกังขาเรื่องการนำโมเดลของ Google มาใช้งาน

ที่มา
techspot