Anthropic Mengatakan Model Terbarunya Adalah ‘Tingkat Mitos’, tetapi Dengan Perlindungan Yang Ketat
Pada bulan April, Anthropic memperkenalkan model “Mythos” kepada dunia. Mythos Preview, kabarnya, adalah model yang sangat kuat sehingga dapat menemukan kelemahan keamanan di semua jenis perangkat lunak. Di tangan yang salah, pelaku kejahatan dapat menyalahgunakan model tersebut untuk menemukan kerentanan dalam program, layanan, dan situs yang sebagian besar dari kita andalkan dalam kehidupan digital modern. Dampaknya, Mythos bisa membuka peluang peretasan terbesar dalam sejarah. Nada yang luar biasa. Karena itu, Anthropic mengerem Mythos. Meskipun mereka menyatakan bahwa mereka pada akhirnya akan merilis model tersebut ke publik, mereka terlebih dahulu perlu mengujinya dengan sejumlah penguji tepercaya, yang disebut dengan “Project Glasswing”. Pada awalnya, hal ini berarti membuka model tersebut kepada Amerika dan negara-negara lain. Meskipun Mythos masih belum tersedia untuk Anda atau saya, Anthropic merilis model baru yang menjanjikan banyak kemampuan Mythos, tanpa disertai risiko keamanan siber. Apa itu Fable 5 dan Mythos 5 Anthropic?Pada hari Selasa, Anthropic mengumumkan model terbarunya, Claude Fable 5, yang disebutnya sebagai “model kelas Mythos” yang “aman untuk penggunaan umum”. Perusahaan mengatakan Fable 5 seharusnya lebih baik dan lebih mumpuni dibandingkan model publik lainnya. Anthropic mengklaim Fable 5 mendapat skor teratas di sebagian besar tolok ukur, termasuk rekayasa perangkat lunak, pekerjaan pengetahuan, tugas visi, dan penelitian. Perusahaan bahkan mengatakan “semakin panjang dan rumit tugasnya, semakin besar keunggulan Fable 5 dibandingkan model kami yang lain.” Ada juga Mythos 5, yang sepertinya merupakan Fable 5 tanpa batasan tertentu, namun tidak tersedia untuk masyarakat umum. Menurut tolok ukur Anthropic, Fable 5 dan Mythos 5 sama-sama mengungguli Mythos Preview, Opus 4.8, GPT-5.5 OpenAI, dan Gemini 3.1 Pro Google, dalam kategori berikut: pengkodean agen, kerja pengetahuan, penalaran spasial, penggunaan alat, hukum, penalaran multidisiplin (tanpa alat), biologi, keamanan siber, dan kesehatan. Pratinjau Mythos meraih kemenangan dalam penggunaan komputer dan penalaran multidisiplin (dengan alat), tetapi ini merupakan sapu bersih dari semua model lainnya. Kredit: Anthropic Anthropic mengatakan Fable 5 mampu menyelesaikan proyek pengkodean yang membutuhkan waktu lebih dari dua bulan bagi tim untuk menyelesaikannya hanya dalam sehari. Itu dapat membangun kembali kode sumber aplikasi web hanya dari tangkapan layar. Ia dapat mengalahkan Pokémon FireRed dengan “harness minimal yang hanya dapat dilihat”, sementara model Claude lainnya kesulitan untuk bermain sama sekali. Ia mampu memainkan Slay the Spire dan mencapai babak terakhir tiga kali lebih sering daripada Opus 4.8 Mythos 5 yang dibangun berdasarkan kemampuan penelitiannya, dengan peningkatan statistik dalam desain obat, serta hipotesis baru mengenai pertanyaan biologi molekuler, dan kemampuan untuk menghasilkan penelitian baru dalam genomik. Bagaimana Anthropic menjaga Fable 5 tetap aman? Itulah pertanyaan besarnya: Jika Fable 5 berkelas Mythos, bagaimana Anda bisa memastikan bahwa Fable 5 aman untuk dirilis ke masyarakat umum? Tidak bisakah aktor jahat memanfaatkan kemampuan Fable 5 dan memaksanya menemukan dan mengungkapkan kerentanan keamanan? Anthropic mengatakan pihaknya telah menemukan jawabannya. Meskipun Fable 5 mungkin setingkat Mitos dalam banyak hal, perusahaan mengatakan bahwa pengujian Project Glasswing telah menghasilkan model dengan perlindungan yang tepat untuk rilis publik. Fabel 5 mencari “pengklasifikasi”, atau topik yang sangat sensitif, yang diketahui tidak boleh dijawab. Artinya: Ketika Fable 5 menerima permintaan yang menurutnya ada hubungannya dengan keamanan siber, biologi, kimia, atau penyulingan, Fable itu sendiri tidak menjawab pertanyaan tersebut. Sebaliknya, ia meneruskan kueri ke Opus 4.8, model Anthropic yang “paling mampu berikutnya”. Model tersebut harus tetap cukup kuat untuk memberikan jawaban yang akurat, namun tidak mampu menyediakan alat yang diperlukan bagi pengguna jahat untuk mengeksploitasi orang lain. Apa pendapat Anda sejauh ini? Anthropic mengatakan pagar pembatas barunya bersifat hati-hati dan konservatif, dan mungkin berlebihan. Permintaan yang tidak berbahaya mungkin secara tidak sengaja memicu alarm keamanan Fable 5, tetapi hal itu diperkirakan terjadi sekitar 5% dari keseluruhan waktu. Dengan demikian, Anthropic mengatakan Fable 5 mampu menangani permintaan sendiri sekitar 95% dari waktu. Selain itu, perusahaan menemukan bahwa setelah program bug bounty, tidak ada peretas topi putih yang dapat menemukan jailbreak universal (atau eksploitasi untuk melewati protokol keamanan) setelah 1.000 jam pengujian. Meskipun sebuah organisasi telah membuat kemajuan dalam menemukan satu jailbreak, Anthropic mengatakan bahwa mereka yakin bahwa protokolnya membuat peretas menjadi tidak praktis untuk menemukan jailbreak sebelum perusahaan tersebut menemukannya. Mengapa membatalkan permintaan untuk biologi dan kimia? Anthropic mengatakan bahwa Mythos juga terlalu baik dalam membantu penelitian dan pengembangan terapi gen, yang mungkin bermanfaat bagi para ilmuwan, namun menimbulkan risiko besar di tangan yang salah. Selain itu, Anthropic mengetahui bahwa ada aktor di luar sana yang mencoba “menyaring” kemampuan model Claude untuk melatih model mereka sendiri agar dapat melakukan apa pun yang mereka inginkan. Dengan demikian, setiap permintaan ini di-boot ke model yang berperforma lebih rendah. Anthropic juga melakukan perubahan pada kebijakan penyimpanan datanya untuk Fable 5 dan Mythos 5. Dengan model ini, perusahaan akan menyimpan data Anda selama 30 hari—bukan untuk pelatihan, namun untuk membantu melindungi dari serangan siber dan jailbreak di masa mendatang. Fable 5 dan Mythos 5 keduanya dihargai sama: $10 per juta token masukan, dan $50 per juta token keluaran, yang menurut Anthropic kurang dari setengah harga Pratinjau Mythos.
Diterbitkan : 2026-06-09 20:00:00
sumber : lifehacker.com



