Kebijakan Anthropic Walks Back yang Dapat ‘Menyabotase’ Peneliti AI yang Menggunakan Claude

Anthropic menarik kembali kebijakan yang secara diam-diam membatasi pesaing untuk menggunakan model AI barunya, Claude Fable 5, untuk mengembangkan model AI lainnya. Perusahaan mengubah arah setelah langkah tersebut mendapat reaksi keras dari komunitas riset AI. “Kami mengubah perlindungan Fable 5 untuk pengembangan LLM perbatasan agar dapat terlihat,” kata Anthropic dalam sebuah pernyataan kepada WIRED. “Kami melakukan pengorbanan yang salah dan kami mohon maaf karena tidak mendapatkan keseimbangan yang benar.” Anthropic merilis Claude Fable 5, versi model AI terbaru dengan pagar pengaman tambahan yang dirancang untuk mencegah penyalahgunaan, awal pekan ini. Beberapa perlindungan yang diputuskan oleh Anthropic tidaklah mengejutkan: Perusahaan mengatakan akan mengalihkan pengguna yang mengajukan pertanyaan tentang keamanan siber, biologi, atau kimia ke model AI yang kurang mampu guna mengurangi kemungkinan seseorang menggunakan AI canggih untuk melakukan serangan siber atau membuat senjata biologis. Namun bagi para peneliti yang mencoba menggunakan Claude Fable 5 untuk pengembangan AI terdepan, Anthropic menguraikan pendekatan yang berbeda. Perusahaan tersebut dengan sengaja menurunkan kinerja model dengan cara yang tidak terlihat oleh pengguna. Langkah ini akan secara efektif menyabotase peneliti yang mencoba menggunakan Claude untuk melatih model AI yang bersaing, yang secara eksplisit dilarang oleh Anthropic dalam persyaratan layanannya. Anthropic sekarang mengatakan bahwa pihaknya mengubah arah, dan bahwa perlindungan Claude Fable 5 untuk pengembangan AI akan terlihat oleh pengguna. Jika perusahaan mencurigai pengguna mencoba menggunakan Claude untuk membuat AI berkemampuan tinggi, perusahaan akan memperingatkan mereka bahwa perusahaan tersebut menolak permintaan tersebut, atau mengalihkan pengguna ke model yang kurang berkemampuan. Anthropic membatalkan kebijakan tersebut setelah menerima reaksi keras dari komunitas riset AI. Anthropic telah mengambil langkah-langkah untuk membatasi pesaing menggunakan Claude untuk membangun model AI sumber tertutup dan terbuka, namun para kritikus mengatakan bahwa secara diam-diam menurunkan kinerja model untuk pengguna tertentu sudah merupakan langkah yang terlalu jauh. Agen pengkodean Claude telah menjadi alat yang disukai di kalangan pengembang, termasuk mereka yang bekerja pada proyek penelitian AI sumber terbuka, dan para peneliti mengatakan kepada WIRED bahwa kebijakan terbaru perusahaan tersebut dapat menyebabkan masa depan yang sulit di mana hanya segelintir laboratorium AI terkemuka yang dapat melakukan penelitian AI tingkat lanjut. Dean Ball, rekan senior di Foundation for American Innovation dan mantan penasihat Gedung Putih tentang AI, menulis dalam sebuah postingan di X bahwa “menurunkan kinerja penelitian ML *tanpa memberi tahu pengguna* adalah tindakan yang sangat bermusuhan dan mengerikan lihat.” Dia melanjutkan di postingan lain bahwa kebijakan “sabotase rahasia” melemahkan pendirian Anthropic secara keseluruhan, karena membatasi peneliti AI untuk berkolaborasi dalam keamanan AI. “Rasanya seperti Anthropic mengatakan kepada publik, ‘Kami tidak mempercayai orang lain untuk melakukan penelitian AI. Hanya kami yang harus melakukan penelitian AI,” kata Will Brown, pemimpin penelitian di startup AI open source Prime Intellect. “Rasanya seperti mereka mulai mengambil langkah maju.” Brown mengatakan kebijakan tersebut juga akan membuat pengembang tidak mengetahui apakah mereka melanggar aturan Anthropic, karena perusahaan tidak akan memberi tahu mereka ketika tindakan pengamanannya dipicu. Dia menambahkan bahwa pembatasan tersebut bisa berdampak luas. Misalnya, ia menunjuk pada berkembangnya ekosistem perusahaan evaluasi pihak ketiga yang menguji model terdepan dalam hal keselamatan, kinerja, dan keandalan—pekerjaan yang dapat terhambat jika Anthropic secara diam-diam menurunkan modelnya.


Diterbitkan : 2026-06-11 03:11:00

sumber : www.wired.com