Sekarang Anda Dapat Membunyikan Alarm tentang AI yang Berperilaku Buruk
Menulis AI Lab setiap minggu berarti saya terkadang menemukan model AI yang berperilaku buruk dan aneh. Biasanya, tidak ada yang bisa dilakukan mengenai hal itu, kecuali berbagi cerita tersebut dengan Anda. Namun hal ini bisa segera berubah. Sekelompok peneliti AI telah membuat situs web crowdsourced, Flaw Reporting for AI (FLARE-AI), untuk melaporkan dan melacak bahaya AI. Jika, misalnya, chatbot menghasilkan malware atau resep pembuatan bom, membocorkan informasi pribadi, atau memicu pemikiran delusi pada pengguna, FLARE-AI dapat digunakan untuk membunyikan alarm. Kode sumber terbuka di balik sistem memungkinkan orang lain memverifikasi suatu masalah dan meneruskan laporan ke pembuat model, serta organisasi seperti MITRE, sebuah organisasi nirlaba yang melacak masalah pada sistem teknis. Ini mirip seperti Downdetector, yang mengumpulkan laporan pengguna real-time untuk pemadaman layanan global yang memengaruhi hal-hal seperti aplikasi dan situs web. Situs web ini merupakan langkah lain dalam pekerjaan berkelanjutan grup ini dengan pelaporan AI, yang pertama kali saya tulis tahun lalu. Anggota kelompok tersebut juga berkonsultasi mengenai rancangan undang-undang kongres yang diumumkan pada bulan Juni, yang mengharuskan pemerintah AS mengambil peran penting dalam melacak perilaku buruk AI semacam ini. “Saat ini, tidak ada cara terpusat dan akuntabel untuk melaporkan kelemahan dalam sistem AI,” kata Avijit Ghosh, peneliti kebijakan kecerdasan buatan di HuggingFace yang memimpin pengembangan FLARE-AI bersama ilmuwan komputer Elaine Zhu dan Shayne Longpre. Sistem alarm ini dikembangkan bekerja sama dengan 49 pakar AI dari 32 organisasi berbeda. Dalam makalah yang menguraikan pekerjaan tersebut, para peneliti berpendapat bahwa inisiatif mereka terbukti penting karena AI diadopsi secara lebih luas dan ketika sistem agen mendapatkan kekuatan yang lebih besar. Kurangnya cara yang konsisten untuk melaporkan kelemahan AI merupakan masalah yang signifikan, mereka yakin. “Saya pikir ini adalah inisiatif yang sangat bagus,” kata Jessica Ji, peneliti di lembaga think tank Center for Security and Emerging Technology. Ji mengatakan para peneliti benar bahwa mekanisme pelaporan yang ada saat ini terfragmentasi dan model AI hanyalah kotak hitam. “Saya mendukung apa pun yang membuat AI lebih transparan,” katanya. Meskipun masalah bug dan keamanan siber mendapat banyak perhatian—terutama akhir-akhir ini—Ghosh memberi tahu saya bahwa masalah dengan sistem AI mencakup topik seperti kerugian psikologis, diskriminasi atau bias, dan misinformasi. Ia menambahkan bahwa setiap perusahaan mempunyai standar yang berbeda mengenai permasalahan tersebut, sehingga ada beberapa permasalahan yang tidak diketahui. “Tanpa adanya sistem pengungkapan yang terkoordinasi, tidak ada mekanisme eksternal untuk menegakkan transparansi,” kata Ghosh. Serangkaian insiden baru-baru ini yang melibatkan alat-alat AI yang populer menunjukkan betapa mudahnya teknologi tersebut menjadi buruk. Minggu ini, sebuah perusahaan bernama LayerX mengungkapkan cara untuk menipu browser web yang dilengkapi dengan AI, termasuk Atlas OpenAI dan Komet Perplexity, agar melanggar batasan mereka. Meyakinkan model AI di belakang browser bahwa ia sedang bermain game, misalnya, dapat menyebabkan browser menjadi nakal dan mencoba meretas situs web. (Perusahaan yang bertanggung jawab atas browser yang terkena dampak telah memperbaiki masalah ini, kata LayerX.) Dan pada bulan April ini, Johann Rehberger, seorang peneliti keamanan, menemukan cara untuk mengelabui Claude agar membocorkan data pribadi menggunakan gambar yang dihasilkan oleh ChatGTP.AI juga menimbulkan jenis masalah baru yang aneh. Tahun lalu, OpenAI terpaksa memperbarui modelnya setelah diketahui bahwa model tersebut terlalu penjilat, yang terkadang tampak mendorong pemikiran delusi. Rumman Chowdhury, CEO dan pendiri Humane Intelligence PBC, mengatakan FLARE-AI dapat menjadi cara yang berguna bagi banyak pengembang AI untuk menerapkan cara melaporkan masalah dengan alat mereka. Namun dia menambahkan bahwa inisiatif seperti itu seringkali mempunyai tantangan yang serius.
Diterbitkan : 2026-07-01 18:10:00
sumber : www.wired.com



