Anthropic memulihkan Claude Fable 5 saat AS mencabut kontrol ekspor — filter tunggal kini memblokir prompt yang dapat mengidentifikasi kerentanan perangkat lunak dan menulis kode untuk mengeksploitasinya

Anthropic telah memulihkan akses global ke Claude Fable 5, sehari setelah Departemen Perdagangan AS mencabut kontrol ekspor yang diberlakukan pada model tersebut pada 12 Juni, menurut postingan blog perusahaan. Perbaikan yang mengakhiri kebuntuan selama 18 hari adalah filter keamanan tunggal yang disetel untuk memblokir salah satu teknik yang ditandai oleh peneliti Amazon, dengan Pusat Standar dan Inovasi AI (CAISI) milik Commerce yang meninjau pengamanan sebelum kontrol dilepaskan. Fable 5 kembali hadir di Claude.ai, Platform Claude, Claude Code, dan Claude Cowork hari ini, dengan akses di AWS, Google Cloud, dan Microsoft Foundry menyusul. Arahan tanggal 12 Juni telah melarang warga negara asing mana pun, termasuk staf non-warga negara Anthropic sendiri, untuk menggunakan Fable 5 atau Mythos 5 yang lebih mampu, yang menjadi dasar pembuatannya. Karena tidak ada cara untuk memverifikasi kewarganegaraan penggunanya, Anthropic menarik kedua model tersebut ke seluruh dunia. Teknik kontroversial ini ditandai oleh para peneliti Amazon, yang menemukan cara untuk mendorong Fable 5 untuk mengidentifikasi kerentanan perangkat lunak dan, dalam satu kasus, menulis kode yang menunjukkan bagaimana kerentanan tersebut dapat dieksploitasi. Anthropic melatih pengklasifikasi baru yang memblokir teknik spesifik tersebut di lebih dari 99% kasus dan merutekan ulang permintaan yang ditandai ke Opus 4.8 yang lebih lama. Perusahaan mengatakan perubahan tersebut juga menangkap permintaan pengkodean dan debugging yang lebih jinak sebagai efek samping. Video Terbaru Dari Pengklasifikasi menargetkan prompt yang dilaporkan dan bukan kemampuan model. Fable 5 masih dapat mengidentifikasi kerentanan dalam laporan Amazon; filter mendeteksi permintaan dan merutekannya ulang alih-alih menghilangkan kemampuan model. Pengamanan berbasis deteksi juga gagal memicu pelarangan, dan pengklasifikasi yang disesuaikan dengan satu teknik yang diketahui tidak akan memberikan manfaat apa pun terhadap teknik yang belum ditemukan. Anthropic mengakui bahwa tidak ada model yang dapat dibuat sepenuhnya kuat terhadap jailbreak dan mereka memperkirakan akan ada lebih banyak model yang muncul. Tinjauan Anthropic, yang dilakukan bersama pemerintah dan Amazon, menemukan bahwa Opus 4.8, GPT-5.5 OpenAI, dan Kimi K2.7 Tiongkok dapat mengidentifikasi kerentanan yang sama. Setiap model yang diuji, termasuk Haiku 4.5, Sonnet 4.6, dan beberapa versi Opus, dapat mereproduksi demonstrasi eksploitasi tunggal, yang mendukung argumen bahwa kemampuan cyber sekelas Mythos sudah terlalu banyak terjual. Anda mungkin menyukai kembalinya Fable 5 yang mendapatkan kembali posisi benchmark yang dimiliki oleh GLM-5.2 milik laboratorium Tiongkok Z.ai secara default saat Fable sedang offline, termasuk skor tertinggi yang dapat diakses pada tes tugas multi-minggu AA-Briefcase. Mythos 5, yang memiliki lebih sedikit batasan dan tetap terbatas pada mitra Project Glasswing, kembali ke sejumlah organisasi AS pada tanggal 26 Juni. Anthropic juga membuka program HackerOne bagi para peneliti untuk melaporkan jailbreak Fable 5 yang baru, dan berkomitmen untuk memberikan akses lebih awal kepada mitra pemerintah yang ditunjuk untuk menguji model perbatasan di masa depan sebelum dirilis. Untuk paket Pro, Max, Team, dan Enterprise tertentu, Fable 5 diperhitungkan hingga 50% dari batas penggunaan mingguan hingga 7 Juli, setelah itu beralih ke kredit penggunaan. Dapatkan berita terbaik dan ulasan mendalam dari Tom’s Hardware, langsung ke kotak masuk Anda. Ikuti Tom’s Hardware di Google Berita, atau tambahkan kami sebagai sumber pilihan, untuk mendapatkan berita, analisis, & ulasan terkini di feed Anda.


Diterbitkan : 2026-07-01 11:30:00

sumber : www.tomshardware.com