กระแสตีกลับ Fable 5 ของ Claude รุนแรงขึ้นเมื่อผู้ใช้บอกว่า Anthropic คุม AI หลักของตนเอง

เขียนโดย

Lockridge Okoth

แก้ไขโดย

Mohammad Shahid

03 กรกฎาคม พ.ศ. 2569, 04:30 ICT

คะแนนดีบัก BridgeBench ของ Claude Fable 5 ลดจาก 86.2 เหลือ 25.9 หลังเปิดตัวใหม่
มีเพียง 3 จาก 12 งานดีบักที่ทำงานได้โดยไม่ต้องย้อนกลับไปใช้ Opus 4.8 เวอร์ชันที่ด้อยกว่า
Anthropic ยอมรับพบ false positive เพิ่มขึ้นแต่ยืนยันโมเดลหลักยังเหมือนเดิม

Claude Fable 5 ของ Anthropic กำลังเผชิญกับกระแสต่อต้านที่เพิ่มขึ้นหลังจากการรีรีลีสเมื่อวันที่ 1 กรกฎาคม ผู้ใช้ระบุว่าการตั้งขอบเขตความปลอดภัยที่เข้มงวดขึ้นทำให้ความสามารถในการเขียนโค้ด ดีบัก และการทำงานอัตโนมัติของโมเดลหลักนี้ลดลงอย่างมาก

กลุ่ม Benchmark ที่ชื่อ BridgeMind รายงานว่าคะแนนในชุดทดสอบ BridgeBench ร่วงลงอย่างรุนแรง ขณะเดียวกัน Anthropic ยังยืนยันว่าตัวโมเดลพื้นฐานไม่ได้เปลี่ยนแปลง และอ้างว่าสาเหตุที่เกิดความขัดแย้งเป็นเพราะระบบตรวจสอบความปลอดภัยที่เข้มงวดขึ้น

คะแนน Benchmark ของ Claude Fable 5 ร่วงหนักหลังการรีรีลีส

BridgeMind ได้ทดสอบ Fable 5 เวอร์ชันวันที่ 1 กรกฎาคมอีกครั้งและพบว่าคะแนนลดลงอย่างชัดเจน การดีบักลดจาก 86.2 เหลือ 25.9 การปรับปรุงโครงสร้างโค้ดลดจาก 73.6 เหลือ 38.4 และความสามารถจัดการกับข้อมูลหลอนลดจาก 75.9 เหลือ 61.7

คะแนน BridgeBench ของ Claude Fable 5 ก่อนและหลังการรีรีลีส ที่มา: ผู้ใช้บน X

กลไกเบื้องหลังตัวเลขเหล่านี้ก็มีความสำคัญ เนื่องจากทำงานดีบักจากงานทั้งหมด 12 งานได้เพียง 3 งานโดยที่ไม่ต้องย้อนกลับไปใช้ Claude Opus 4.8 และทุกครั้งที่ย้อนกลับคะแนนจะเป็นศูนย์

ผู้สนับสนุน

ดังนั้น การร่วงลงครั้งนี้สะท้อนถึงภารกิจที่ถูกบล็อก ไม่ใช่เพราะเหตุผลด้านตรรกะที่อ่อนลง

BridgeMind ได้เน้นย้ำว่า Fable 5 ยังคงตรงตามฟอร์มเดิมในเดือนมิถุนายน เมื่อภารกิจสำเร็จจนจบขั้นตอน

โมเดลไม่ได้แย่ลง มันถูกขังอยู่ พวกเขาระบุไว้ในโพสต์

ติดตามเราบน X เพื่อรับข่าวสารล่าสุดแบบเรียลไทม์

ไทม์ไลน์นี้ช่วยอธิบายความตึงเครียด Anthropic ได้เปิดตัว Fable 5 เมื่อวันที่ 9 มิถุนายน และกรุงวอชิงตันได้นำมันออกจากระบบภายในสามวันหลังจากนั้น หน่วยงานกำกับดูแลได้ยกเลิกข้อจำกัดด้านการส่งออกเมื่อวันที่ 30 มิถุนายน สี่วันหลังจากที่คืนสิทธิ์การเข้าถึง Mythos 5ให้กับสถาบันของสหรัฐอเมริการาว 100 แห่ง

การคืนสิทธิ์การเข้าถึงดังกล่าวยังมีข้อจำกัดด้วย Fable 5 สามารถใช้งานได้เพียง 50% ของโควต้าการใช้งานรายสัปดาห์จนถึงวันที่ 7 กรกฎาคม จากนั้นจะเปลี่ยนไปใช้เครดิตการใช้งานแบบจ่ายเงิน

Anthropic ชี้แจงถึงมาตรฐานความปลอดภัยที่เข้มงวดขึ้น

Anthropic ได้ชี้แจงถึงการแลกเปลี่ยนใน แถลงการณ์ เมื่อวันที่ 30 มิถุนายน โดยบริษัทอธิบายว่าได้ขยายขอบเขตความปลอดภัยให้กว้างขึ้นอย่างตั้งใจ หมายความว่า classifier ในตอนนี้จะบล็อกคำขอที่น่าจะปลอดภัยมากขึ้น ฟิลเตอร์ที่ได้รับการปรับปรุงใหม่ช่วยหยุดเทคนิค bypass ตามที่นักวิจัยจาก Amazon รายงาน ว่าสามารถหยุดยั้งได้ในความพยายามกว่า 99% ของกรณีทั้งหมด

Claude Fable 5 will be available again globally tomorrow.

After a series of productive conversations with the US government, we're redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding…
— Anthropic (@AnthropicAI) July 1, 2026

คำขอที่ถูกบล็อกจะถูกส่งต่อไปยัง Opus 4.8 และผู้ใช้จะได้รับการแจ้งเตือน อย่างไรก็ดี Anthropic ก็ยอมรับว่าฟิลเตอร์นี้ระบุงานการเขียนโค้ดและดีบักที่ถูกต้องมากกว่าที่เคยเป็น

การทดสอบของบริษัทเองยังแสดงให้เห็นว่า Fable 5 ไม่ได้มีความเสี่ยงเฉพาะตัว โมเดลคู่แข่งอย่าง GPT-5.5 และ Kimi K2.7 ก็พบช่องโหว่เดียวกันเช่นกัน

Anthropic ระบุว่านักวิจัยจากกระทรวงพาณิชย์สหรัฐอเมริกาได้ทดสอบระบบป้องกันทั้งสองเวอร์ชัน และประเมินว่ามีความแข็งแกร่งเป็นพิเศษ

ประเด็นนี้มีความสำคัญยิ่งกว่ารอบผลิตภัณฑ์เดียว เพราะการระงับการใช้งานทำให้ ยุโรปพยายามดึงดูด Anthropic ขณะที่ โมเดล AI จากจีน เริ่มก้าวหน้าเทียบเท่าห้องแล็บแนวหน้าของสหรัฐอเมริกา

ทุกวันนี้ Anthropic กำลังร่างกรอบประเมินความรุนแรงของ jailbreak ร่วมกับ Amazon, Microsoft และ Google ซึ่งว่าต่อไป classifier จะลดผลบวกผิดพลาดได้เร็วเพียงใด อาจเป็นตัวแปรสำคัญว่าผู้ใช้ระดับสูงจะอยู่ต่อหรือย้ายไปที่อื่น

หมายเหตุบรรณาธิการ: เนื้อหาต่อไปนี้ไม่ได้สะท้อนถึงมุมมองหรือความคิดเห็นของ BeInCrypto มันจัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลเท่านั้นและไม่ควรถูกตีความว่าเป็นคำแนะนำทางการเงิน กรุณาทำการวิจัยของคุณเองก่อนที่จะทำการตัดสินใจลงทุนใดๆ และโปรดอ่าน ข้อกำหนดและเงื่อนไข, นโยบายความเป็นส่วนตัว และ ข้อจำกัดความรับผิดชอบ ของเรา