Claude Fable 5 ของ Anthropic กำลังเผชิญกับกระแสต่อต้านที่เพิ่มขึ้นหลังจากการรีรีลีสเมื่อวันที่ 1 กรกฎาคม ผู้ใช้ระบุว่าการตั้งขอบเขตความปลอดภัยที่เข้มงวดขึ้นทำให้ความสามารถในการเขียนโค้ด ดีบัก และการทำงานอัตโนมัติของโมเดลหลักนี้ลดลงอย่างมาก
กลุ่ม Benchmark ที่ชื่อ BridgeMind รายงานว่าคะแนนในชุดทดสอบ BridgeBench ร่วงลงอย่างรุนแรง ขณะเดียวกัน Anthropic ยังยืนยันว่าตัวโมเดลพื้นฐานไม่ได้เปลี่ยนแปลง และอ้างว่าสาเหตุที่เกิดความขัดแย้งเป็นเพราะระบบตรวจสอบความปลอดภัยที่เข้มงวดขึ้น
คะแนน Benchmark ของ Claude Fable 5 ร่วงหนักหลังการรีรีลีส
BridgeMind ได้ทดสอบ Fable 5 เวอร์ชันวันที่ 1 กรกฎาคมอีกครั้งและพบว่าคะแนนลดลงอย่างชัดเจน การดีบักลดจาก 86.2 เหลือ 25.9 การปรับปรุงโครงสร้างโค้ดลดจาก 73.6 เหลือ 38.4 และความสามารถจัดการกับข้อมูลหลอนลดจาก 75.9 เหลือ 61.7
กลไกเบื้องหลังตัวเลขเหล่านี้ก็มีความสำคัญ เนื่องจากทำงานดีบักจากงานทั้งหมด 12 งานได้เพียง 3 งานโดยที่ไม่ต้องย้อนกลับไปใช้ Claude Opus 4.8 และทุกครั้งที่ย้อนกลับคะแนนจะเป็นศูนย์
ดังนั้น การร่วงลงครั้งนี้สะท้อนถึงภารกิจที่ถูกบล็อก ไม่ใช่เพราะเหตุผลด้านตรรกะที่อ่อนลง
BridgeMind ได้เน้นย้ำว่า Fable 5 ยังคงตรงตามฟอร์มเดิมในเดือนมิถุนายน เมื่อภารกิจสำเร็จจนจบขั้นตอน
โมเดลไม่ได้แย่ลง มันถูกขังอยู่ พวกเขาระบุไว้ในโพสต์
ติดตามเราบน X เพื่อรับข่าวสารล่าสุดแบบเรียลไทม์
ไทม์ไลน์นี้ช่วยอธิบายความตึงเครียด Anthropic ได้เปิดตัว Fable 5 เมื่อวันที่ 9 มิถุนายน และกรุงวอชิงตันได้นำมันออกจากระบบภายในสามวันหลังจากนั้น หน่วยงานกำกับดูแลได้ยกเลิกข้อจำกัดด้านการส่งออกเมื่อวันที่ 30 มิถุนายน สี่วันหลังจากที่คืนสิทธิ์การเข้าถึง Mythos 5ให้กับสถาบันของสหรัฐอเมริการาว 100 แห่ง
การคืนสิทธิ์การเข้าถึงดังกล่าวยังมีข้อจำกัดด้วย Fable 5 สามารถใช้งานได้เพียง 50% ของโควต้าการใช้งานรายสัปดาห์จนถึงวันที่ 7 กรกฎาคม จากนั้นจะเปลี่ยนไปใช้เครดิตการใช้งานแบบจ่ายเงิน
Anthropic ชี้แจงถึงมาตรฐานความปลอดภัยที่เข้มงวดขึ้น
Anthropic ได้ชี้แจงถึงการแลกเปลี่ยนใน แถลงการณ์ เมื่อวันที่ 30 มิถุนายน โดยบริษัทอธิบายว่าได้ขยายขอบเขตความปลอดภัยให้กว้างขึ้นอย่างตั้งใจ หมายความว่า classifier ในตอนนี้จะบล็อกคำขอที่น่าจะปลอดภัยมากขึ้น ฟิลเตอร์ที่ได้รับการปรับปรุงใหม่ช่วยหยุดเทคนิค bypass ตามที่นักวิจัยจาก Amazon รายงาน ว่าสามารถหยุดยั้งได้ในความพยายามกว่า 99% ของกรณีทั้งหมด
คำขอที่ถูกบล็อกจะถูกส่งต่อไปยัง Opus 4.8 และผู้ใช้จะได้รับการแจ้งเตือน อย่างไรก็ดี Anthropic ก็ยอมรับว่าฟิลเตอร์นี้ระบุงานการเขียนโค้ดและดีบักที่ถูกต้องมากกว่าที่เคยเป็น
การทดสอบของบริษัทเองยังแสดงให้เห็นว่า Fable 5 ไม่ได้มีความเสี่ยงเฉพาะตัว โมเดลคู่แข่งอย่าง GPT-5.5 และ Kimi K2.7 ก็พบช่องโหว่เดียวกันเช่นกัน
Anthropic ระบุว่านักวิจัยจากกระทรวงพาณิชย์สหรัฐอเมริกาได้ทดสอบระบบป้องกันทั้งสองเวอร์ชัน และประเมินว่ามีความแข็งแกร่งเป็นพิเศษ
ประเด็นนี้มีความสำคัญยิ่งกว่ารอบผลิตภัณฑ์เดียว เพราะการระงับการใช้งานทำให้ ยุโรปพยายามดึงดูด Anthropic ขณะที่ โมเดล AI จากจีน เริ่มก้าวหน้าเทียบเท่าห้องแล็บแนวหน้าของสหรัฐอเมริกา
ทุกวันนี้ Anthropic กำลังร่างกรอบประเมินความรุนแรงของ jailbreak ร่วมกับ Amazon, Microsoft และ Google ซึ่งว่าต่อไป classifier จะลดผลบวกผิดพลาดได้เร็วเพียงใด อาจเป็นตัวแปรสำคัญว่าผู้ใช้ระดับสูงจะอยู่ต่อหรือย้ายไปที่อื่น









