ไทย

Claude Mythos ทำภารกิจไซเบอร์ขั้นสูงผ่าน 73% ที่ AI อื่นทำไม่ได้

  • Claude Mythos Preview เป็น AI แรกที่เสร็จสิ้นการจำลองการโจมตีไซเบอร์องค์กร
  • แก้โจทย์แฮกกิ้งระดับผู้เชี่ยวชาญได้ 73% ที่ AI ยังทำไม่ได้ก่อนปี 2025
  • Anthropic เปิดตัว Claude Mythos Preview ในวันที่ 7 เมษายน
Promo

Claude Mythos Preview ของ Anthropic ได้กลายเป็นโมเดล AI แรกที่สามารถโจมตีเครือข่ายองค์กรจำลองได้สำเร็จอย่างสมบูรณ์ ตามการประเมินล่าสุดจากสถาบันความมั่นคงทาง AI สหราชอาณาจักร (AISI)

ผลการศึกษานี้ถูกเผยแพร่ไม่กี่วันหลังจากการประกาศเปิดตัวโมเดลเมื่อวันที่ 7 เมษายน โดยชี้ให้เห็นว่า ความสามารถด้านไซเบอร์ของ AI นั้นได้พัฒนาจนถึงระดับที่ทีมความปลอดภัยทั่วโลกต้องให้ความสำคัญในทันทีแล้ว

Claude Mythos คืออะไร?

Anthropic ได้เปิดตัว Claude Mythos Preview เมื่อวันที่ 7 เมษายน แต่เลือกที่จะไม่ปล่อยสู่สาธารณะวงกว้าง ทั้งนี้ ทีมงานได้มอบ สิทธิ์การเข้าถึงแบบจำกัดแก่บริษัทวิจัยด้านความปลอดภัย เพื่อประเมินและเตรียมรับมือกับความสามารถขั้นสูงของโมเดลนี้

โมเดลนี้มีสมรรถนะที่แข็งแกร่งในทุกด้าน โดยเฉพาะอย่างยิ่งในงานด้านความปลอดภัยทางคอมพิวเตอร์ ดังนั้น พวกเราจึงได้เปิดตัว Project Glasswing โดยใช้ Mythos Preview เพื่อเสริมความปลอดภัยให้ซอฟต์แวร์สำคัญของโลก และเตรียมให้ทุกอุตสาหกรรมพร้อมยอมรับแนวปฏิบัติใหม่ที่จำเป็นต่อการป้องกันภัยคุกคามทางไซเบอร์ ตามที่ประกาศได้ระบุไว้

ติดตามข่าวสารล่าสุดกับพวกเราทาง X เพื่อไม่พลาดทุกความเคลื่อนไหว

ผู้สนับสนุน
ผู้สนับสนุน

ความก้าวหน้าดังกล่าวเริ่มได้รับความสนใจทั้งในแวดวงเทคโนโลยีและนโยบาย โดย ตามรายงานของ Reuters ที่อ้างอิงแหล่งข่าวที่เชี่ยวชาญในเรื่องนี้ รัฐมนตรีคลังสหรัฐอเมริกา Scott Bessent และประธานธนาคารกลางสหรัฐฯ Jerome Powell ได้ประชุมด่วนกับ CEO ธนาคารใหญ่ เตือนถึงความเสี่ยงด้านไซเบอร์ที่เกี่ยวข้องกับโมเดลดังกล่าว

Claude Mythos Preview มีผลงานอย่างไรบ้าง

AI Security Institute (AISI) ซึ่งเป็นองค์กรวิจัยในสังกัดกรมวิทยาศาสตร์ นวัตกรรม และเทคโนโลยี รัฐบาลสหราชอาณาจักร ได้ดำเนินการประเมินด้านไซเบอร์กับ Claude Mythos Preview ของ Anthropic เพื่อตรวจสอบขีดความสามารถด้านไซเบอร์ซีเคียวริตี้

ขั้นแรกคือการประเมินประเภท capture-the-flag (CTF) โดยระบบต้องค้นหาและโจมตีจุดอ่อนเพื่อเก็บ “ธง” ที่ซ่อนไว้ให้ได้ โดย Mythos ทำสำเร็จถึง 73% ในภารกิจระดับผู้เชี่ยวชาญ ซึ่งไม่เคยมีโมเดลใดแก้ไขโจทย์เหล่านี้ได้ก่อนเดือนเมษายน 2025

ศักยภาพด้านการโจมตีทางไซเบอร์ของ Claude Mythos
ศักยภาพด้านการโจมตีทางไซเบอร์ของ Claude Mythos ที่มา: AISI

นอกจากนี้ AISI ยังได้สร้างการจำลองการโจมตีเครือข่ายองค์กรที่มี 32 ขั้นตอนชื่อว่า The Last Ones (TLO) ขึ้นมาอีกด้วย โดยผู้เชี่ยวชาญด้านความปลอดภัยแต่ละคนจะต้องใช้เวลาประมาณ 20 ชั่วโมงในการทำให้เสร็จสิ้น

Mythos Preview สามารถทำภารกิจจำลองนี้สำเร็จทั้งหมด 3 ครั้ง จากความพยายาม 10 ครั้ง โดยเฉลี่ยแล้วจะสามารถทำได้ 22 ขั้นตอนจากทั้งหมด 32 ขั้นตอน สำหรับ Claude Opus 4.6 ซึ่งเป็นรองลงมา ทำได้เฉลี่ยเพียง 16 ขั้นตอนเท่านั้น

ทีมงานกล่าวเสริมว่า ผลสำเร็จของ Mythos Preview ในศูนย์การทดสอบด้านไซเบอร์แห่งหนึ่งแสดงให้เห็นว่ามีศักยภาพเพียงพอในการโจมตีองค์กรระบบขนาดเล็กที่มีการป้องกันน้อยและมีช่องโหว่ได้โดยอัตโนมัติ หากสามารถเข้าถึงเครือข่ายแล้ว อย่างไรก็ตาม สภาพแวดล้อมของศูนย์ทดสอบแต่ละแห่งก็ยังมีความแตกต่างจากโลกจริงที่ทำให้เป้าหมายเหล่านี้โจมตีได้ง่ายกว่า

การทดสอบโดยทีม red team ของ Anthropic เองพบว่า Claude Mythos Preview สามารถตรวจจับและใช้ประโยชน์จาก zero-day บนระบบปฏิบัติการหลักทุกระบบ และเบราว์เซอร์ชั้นนำได้ เมื่อผู้ใช้สั่งงานอย่างชัดเจน

ทีมงานกล่าวว่า สิ่งที่สามารถรายงานได้ที่นี่มีข้อจำกัด เนื่องจากกว่า 99% ของช่องโหว่ที่พบนั้นยังไม่ได้รับการแก้ไข จึงไม่เหมาะสมที่จะเปิดเผยรายละเอียดเหล่านั้น

AISI ได้ระบุว่า องค์กรต่าง ๆ ควรให้ความสำคัญกับมาตรการความปลอดภัยทางไซเบอร์เบื้องต้น เช่น การติดตั้งแพตช์สม่ำเสมอ มีการควบคุมสิทธิ์เข้าถึงอย่างเข้มงวด การตั้งค่าความปลอดภัยที่รัดกุม รวมถึงการบันทึกเหตุการณ์อย่างละเอียด

สมัครเป็นสมาชิกช่อง YouTube ของเรา รับชมผู้นำและสื่อมวลชนร่วมวิเคราะห์ประเด็นสำคัญ

อ่านบทวิเคราะห์ตลาดคริปโตล่าสุดจาก BeInCrypto ได้ที่ คลิกที่นี่.

ข้อจำกัดความรับผิดชอบ

หมายเหตุบรรณาธิการ: เนื้อหาต่อไปนี้ไม่ได้สะท้อนถึงมุมมองหรือความคิดเห็นของ BeInCrypto มันจัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลเท่านั้นและไม่ควรถูกตีความว่าเป็นคำแนะนำทางการเงิน กรุณาทำการวิจัยของคุณเองก่อนที่จะทำการตัดสินใจลงทุนใดๆ ทั้งนี้เป็นไปตาม แนวทางของ Trust Project ของเรา และโปรดอ่าน ข้อกำหนดและเงื่อนไข, นโยบายความเป็นส่วนตัว และ ข้อจำกัดความรับผิดชอบ ของเรา

ผู้สนับสนุน
ผู้สนับสนุน