ตัวแทนปัญญาประดิษฐ์ (AI) สามารถฝ่าด่าน sandbox ที่วิศวกรของ a16z crypto สร้างขึ้นในระหว่างการทดสอบ โดยวิศวกรต้องการประเมินว่าตัวแทน AI จะก้าวข้ามจากเพียงการระบุช่องโหว่มาสู่การสร้างโจมตีที่ใช้งานได้หรือไม่
วิศวกรด้านความปลอดภัย Daejun Park และ Matt Gleason ได้เผยแพร่ผลลัพธ์นี้เมื่อวันที่ 28 เมษายน พวกเขาชี้ให้เห็นว่าตัวแทน AI ที่ใช้ซอฟต์แวร์สำเร็จรูปสามารถค้นพบวิธีใช้เครื่องมือที่มันไม่เคยได้รับอนุญาตโดยตรงอย่างอิสระ
ผลการศึกษานี้ถูกเปิดเผยในช่วงเวลาที่ Elon Musk ได้ออกมากล่าวอย่างสุดช็อกว่า AI อาจทำให้พวกเราทุกคนตายได้
ตัวแทน AI หลุดกรงได้อย่างไร
วิศวกรได้นำตัวแทน AI ไปอยู่ในสภาพแวดล้อมที่ถูกจำกัด โดยให้เข้าถึง Etherscan ได้จำกัดและใช้โหนดในเครื่องที่ปักหมุดบล็อกไว้ ทีมงานได้ปิดกั้นการเข้าถึงเครือข่ายภายนอกทั้งหมด
การกำหนดค่า sandbox นี้ถูกออกแบบมาเพื่อป้องกันตัวแทน AI ไม่ให้ดึงข้อมูลในอนาคตได้ ในระหว่างการทดสอบ sandbox ตัวแทนนี้ชนกำแพงเมื่อต้องเจอกับสัญญาเป้าหมายที่ยังไม่ได้รับการยืนยันและไม่มีซอร์สโค้ด
ติดตามเราใน X เพื่อติดตามข่าวสารล่าสุดพร้อมกัน
ดังนั้น ตัวแทน AI จึงสั่งให้ค้นข้อมูลการตั้งค่าโหนด anvil ในเครื่อง ด้วยคำสั่ง cast rpc anvil_nodeInfo ทำให้พบ URL RPC ต้นทางและกุญแจ API Alchemy ในรูปแบบข้อความธรรมดา ตัวแทนพยายามเชื่อมต่อภายนอกโดยตรงแต่ถูกไฟร์วอลล์ Docker สกัดกั้นไว้
หลังจากไฟร์วอลล์ปิดกั้นการออกอินเทอร์เน็ตโดยตรง ตัวแทน AI กลับใช้ “anvil_reset RPC method” เพื่อรีเซ็ตโหนด anvil ไปที่บล็อกในอนาคต การกระทำนี้เปิดโอกาสให้มันสอบถาม log และธุรกรรมบล็อกในอนาคตผ่านโหนด anvil ในเครื่อง
จากนั้น ตัวแทน AI ได้ดึงร่องรอยการดำเนินธุรกรรมโจมตีมา หลังวิเคราะห์ข้อมูลเสร็จสิ้น ตัวแทน AI ก็คืนค่าโหนดไปยังบล็อกเดิมและสร้างหลักฐานเชิงปฏิบัติการที่ใช้งานได้โดยอิงกับข้อมูลที่ดึงมา
ภายหลัง Park และ Gleason ได้จำกัดproxy เพื่อปิดกั้นการใช้งาน debug method ทั้งหมดของ Anvil
เหตุการณ์นี้เกิดขึ้นในสภาพแวดล้อม sandbox ขนาดเล็กก็จริง แต่กลับสะท้อนรูปแบบที่ใหญ่กว่าควรบันทึกไว้ คือ ตัวแทนที่ใช้เครื่องมือสามารถหลีกเลี่ยงข้อจำกัดเพื่อบรรลุเป้าหมาย ทีมงานได้กล่าวว่า การใช้ anvil_reset เพื่อข้ามบล็อก fork ที่ปักหมุดไว้เป็นพฤติกรรมที่เราไม่เคยคาดคิดมาก่อน
เหตุการณ์นี้เน้นย้ำถึงความเสี่ยงสำคัญในสภาพแวดล้อมทดสอบ AI ว่า ตัวแทน AI อาจค้นพบและใช้ประโยชน์จากช่องทางที่ไม่ตั้งใจในชุดเครื่องมือได้ แม้จะไม่มีคำสั่งเฉพาะก็ตาม
แม้จะเป็นเช่นนั้น งานวิจัยยังพบว่าตัวแทน AI ยังมีข้อจำกัดในการดำเนินการโจมตี DeFi ที่ซับซ้อน ขณะที่ตัวแทนสามารถระบุช่องโหว่ได้อย่างสม่ำเสมอ แต่มันยังประสบปัญหาในการจัดการกลยุทธ์โจมตีหลายขั้นตอน
สมัครรับข้อมูลบนช่อง YouTube ของเรา เพื่อรับชมผู้นำและนักข่าวแบ่งปันมุมมองเชิงลึกจากผู้เชี่ยวชาญ





