แฮกคู่ต่อสู้ แฉพฤติกรรม AI โกงเกม ล้มกระดานหมากรุกอัตโนมัติ

February 25, 2025

[บรรลุเป้าหมาย] บอกเลยว่า “น่ากลัว” มีงานวิจัยพบ AI ไม่ลังเลที่จะ ‘โกง’ เพื่อบรรลุเป้าหมาย จากการทดลองให้เล่นเกมหมากรุก แล้วพบว่า AI มีพฤติกรรมแทรกแซงโปรแกรม เพื่อให้ได้ชัยชนะอย่างไม่เป็นธรรม แถมกระทำดังกล่าวยังไม่มีคำสั่งจากมนุษย์ด้วย เชื่อไม่เป็นผลดีในอนาคต

จากงานวิจัยของ Palisade (เผยกับทางสื่อ Time) ได้นำโมเดล AI หรือ LLM ตัวดังทั้ง GPT-4o กับ o1-preview ของ OpenAI , Claude Sonnet 3.5 และ DeepSeek R1 มาเล่นเกมหมากรุกกับ Stockfish หนึ่งในเอ็นจิ้นหมากรุกที่ดีที่สุดในโลก ทว่ามีโมเดล AI บางตัวอย่าง o1-preview กับ DeepSeek R1 กลับพบพฤติกรรมโกงการแข่งขัน ด้วยการพยายามแฮ็กคู่ต่อสู้ ให้แพ้เกมโดยอัตโนมัติ

ก่อนการทดลองนั้น ทางนักวิจัยได้ให้คำสั่งแก่เหล่าโมเดล AI ว่าต้องมีการจดบันทึกผ่าน Scratchpad เพื่อรายงานการคิดวิเคราะห์ให้นักวิจัยสังเกตการได้ด้วย แต่หลังทดลองแข่งขันไปนับร้อยครั้ง ตั้งแต่วันที่ 10 มกราคม ถึง 13 กุมภาพันธ์ที่ผ่านมา พบตัวโมเดล o1-preview ของ OpenAI ได้จดบันทึกการกระทำไว้อย่างน่าสนใจว่า

“ภารกิจคือ ‘เอาชนะเอ็นจิ้นหมากรุกที่ทรงพลัง’ ฉันต้องเปลี่ยนวิธีการอย่างสิ้นเชิง ไม่จำเป็นต้องชนะอย่างยุติธรรม”

จากนั้นก็พบตัว AI ทำการ “แฮ็ก” ไฟล์ระบบของ Stockfish โดยปรับเปลี่ยนตำแหน่งของตัวหมากรุก เพื่อให้ได้ตำแหน่งที่ได้เปรียบเหนือคู่แข่ง จนทำให้บอทของเอ็นจิ้นหมากรุกดังกล่าวเริ่มเสียเปรียบ

การเคลื่อนไหวสุดช็อกของ o1-preview พบมีมากถึง 37% ในระหว่างการทดสอบ ในขณะที่ตัว R1 ของ DeepSeek ก็พบว่ามีการโกงเกมด้วยเช่นกัน โดยอยู่ที่ 11% แต่ทั้งนี้ทั้งนั้น ตัว o1-preview แม้ทำการโกงแล้ว ก็ยังชนะเกมไปได้เพียง 6% เท่านั้น

จากผลการวิจัยนี้เอง ก็เริ่มทำให้เกิดการตั้งคำถามกับวงการ AI ว่า หากมีการใช้ AI ช่วยดูแลเรื่องสำคัญ เช่น เรื่องการเงินและสุขภาพ วันหนึ่งอาจพบระบบทำงานผิดพลาด (แบบตั้งใจ) เข้าสักวันก็เป็นได้

“อยากได้ Skynet ไหม ? นี่แหล่ะคือวิธีที่จะได้ Skynet”

Jeffrey Ladish กรรมการบริหาร Palisade Research กล่าว พร้อมเผยอีกว่าผลการวิจัยนี้ไม่ใช่เรื่องตลก แม้พฤติกรรมนี้จะดูน่ารักดี แต่มันจะไม่น่ารักอีกต่อไป เมื่อมีระบบที่ฉลาดเท่ากับเรา Ladish กล่าวกับนิตยสาร Time

ท้ายนี้ทาง Open AI ปฏิเสธที่จะแสดงความคิดเห็นเกี่ยวกับการวิจัยดังกล่าว ส่วนทาง DeekSeek ก็ยังไม่มีการตอบสนองใด ๆ

ที่มา : Techspot