Claude Mythos mengungkap kenyataan pahit: Proses patching perusahaan Anda terlalu lambat

Pada tahun 2024, para peneliti dari University of Illinois menemukan bahwa GPT-4, jika dilengkapi dengan deskripsi kerentanan dan paparan umum (CVE), dapat secara mandiri mengeksploitasi 87% dari 15 kumpulan data satu hari yang berisi 15 kerentanan. Tanpa penjelasan, hanya bisa mengeksploitasi 7%. Hal ini memberikan “margin of safety” bagi industri karena meskipun AI dapat mengeksploitasi kerentanan yang diketahui, AI tidak dapat menemukannya. Namun, pada tanggal 7 April, Anthropic mengumumkan bahwa Claude Mythos Preview telah menutup margin tersebut, dengan model tersebut secara mandiri menemukan ribuan kerentanan zero-day di seluruh sistem operasi dan browser utama. Secara terpisah, Mythos mendapat skor 83,1% pada tolok ukur reproduksi kerentanan CyberGym. Dalam satu kampanye yang menargetkan OpenBSD pada 1.000 scaffold yang dijalankan, total biaya komputasi kurang dari $20.000. Garis waktu eksploitasi telah runtuh. CVE-2026-33017 Langflow (CVSS 9.8) dieksploitasi 20 jam setelah pengungkapan tanpa bukti konsep publik. CVE-2026-39987 (CVSS 9.3) Marimo diserang dalam waktu 9 jam 41 menit. Infrastruktur pertahanan yang diandalkan sebagian besar organisasi tidak dirancang untuk ini. Laporan lanskap ancaman Rapid7 tahun 2026 menyatakan bahwa waktu rata-rata dari publikasi CVE hingga daftar kerentanan yang dieksploitasi (KEV) yang diketahui oleh CISA adalah lima hari. Laporan Google M-Trends 2026 menemukan bahwa eksploitasi terjadi bahkan sebelum patch dirilis. Ketika nasihat Langflow diterbitkan, eksploitasi pertama tiba dalam 20 jam. Ketika nasihat Marimo diterbitkan, dibutuhkan waktu kurang dari 10 jam. Anggapan bahwa jendela patch Anda aman karena eksploitasi membutuhkan waktu tidak lagi benar. Berikut adalah elemen dasar Anda. Gantikan prioritas hanya CVSS dengan filter tiga lapis. Sebagian besar program manajemen kerentanan masih memprioritaskan berdasarkan skor CVSS saja. CVSS mengkuantifikasi tingkat keparahan “teoretis” suatu kerentanan tanpa mempertimbangkan apakah kerentanan tersebut dieksploitasi secara liar atau seberapa cepat seseorang dapat menggunakannya sebagai senjata. Kerentanan CVSS 8.8 dengan riwayat eksploitasi aktif (seperti CVE-2026-34040 Docker) mendapat prioritas lebih rendah dibandingkan kerentanan CVSS 9.8 yang mungkin tidak akan pernah dieksploitasi secara liar. Sebuah studi baru-baru ini yang divalidasi terhadap 28.377 kerentanan di dunia nyata menawarkan pengganti yang nyata: Pohon keputusan tiga lapis yang menggabungkan status CISA KEV, skor Exploit Prediction Scoring System (EPSS), dan CVSS, sehingga membentuk filter prioritas tunggal. Filter Prioritas Kerentanan Tiga LapisanLayerData sourceThresholdActionSLA1. Eksploitasi aktifKatalog CISA KEVTerdaftarPatching segeraJam2. Eksploitasi yang diprediksiEPSS melalui FIRST.orgSkor ≥ 0,088Eskalasi ke pipeline Tier 024 jam3. Garis dasar tingkat keparahanCVSS melalui NVDScore ≥ 7,0 Remediasi tipikal Per kebijakan Hasil yang divalidasi: peningkatan efisiensi 18x, cakupan kerentanan yang dieksploitasi sebesar 85,6%, pengurangan beban kerja remediasi yang mendesak sebesar ~95%. Ketiga sumber data tersebut terbuka dan gratis. Integrasi yang dijelaskan sepenuhnya dapat dilakukan secara otomatis. Anda dapat membuat skrip untuk menanyakan CISA KEV API, EPSS API dari FIRST.org, dan NVD, dan menjalankan skrip tersebut pada inventaris aset Anda untuk setiap CVE yang diterbitkan. Manusia dalam proses ini harus tetap berada dalam lingkaran sebagai pemberi persetujuan, namun bukan sebagai pemicu. Menutup kesenjangan otorisasi agen Membuat eksploitasi dengan cepat tidak hanya mengubah cara patch diprioritaskan, namun juga cara kontrol dikonfigurasi untuk semua sistem berbasis agen yang kini memiliki kredensial istimewa. Kebijakan otorisasi Anda belum dinilai berdasarkan perilaku agen AI, dan hal tersebut kini menjadi risiko yang dapat diukur. CVE-2026-34040 menunjukkan bahwa arsitektur plugin otorisasi Docker secara diam-diam melewati setiap plugin ketika isi permintaan melebihi 1MB. Plugin AuthZ umum (OPA, Casbin, Prisma Cloud) tidak mengetahui jenis bypass ini, yang terjadi di middleware Docker sebelum permintaan mencapai plugin. Ketika Cyera mendemonstrasikan kerentanan ini, mereka menunjukkan bahwa infrastruktur debugging agen AI dapat menyimpulkan jalur bypass saat menyelesaikan tugas yang sah, tanpa instruksi apa pun untuk mengeksploitasi apa pun. Internet Engineering Task Force (IETF) sedang mengerjakan model otorisasi untuk agen. Dokumen draft-klrc-aiagent-auth-01, yang diterbitkan pada bulan Maret oleh peserta dari AWS, Zscaler, Ping Identity, dan OpenAI, mengusulkan penggunaan Secure Production Identity Framework for Everyone (SPIFFE) dan OAuth 2.0 saat ini bagi agen AI untuk mendapatkan kredensial yang disediakan secara dinamis dan berumur pendek. Secara terpisah, rancangan Protokol Identitas Agen IETF (draft-prakash-aip-00) melaporkan bahwa dari sekitar 2.000 server protokol konteks model (MCP) yang disurvei, tidak ada yang memiliki otentikasi. Namun standar-standar ini masih memerlukan waktu berbulan-bulan hingga bertahun-tahun untuk diterapkan. Untuk saat ini, tim keamanan harus secara proaktif memasukkan skenario pengujian tingkat agen untuk semua batas otorisasi, seperti permintaan yang terlalu besar, frekuensi burst, dan eskalasi permintaan istimewa dalam beberapa langkah. Petakan radius ledakan kredensial Anda Dalam survei yang dilakukan oleh CSA/Zenity dan dipublikasikan pada 16 April, 53% organisasi mengatakan bahwa mereka telah melihat kasus di mana agen AI melampaui izin yang dimaksudkan, dan 47% mengalami insiden keamanan yang melibatkan agen. Ketika alat pembuat AI seperti Flowise (CVE-2025-59528, CVSS 10.0), Langflow, atau n8n disusupi, radius ledakan akan meluas jauh melampaui hostnya. Alat-alat ini berisi kunci API untuk model frontier, kredensial database, token penyimpanan vektor, dan token OAuth untuk sistem bisnis. Host pembuat AI yang disusupi bukan hanya pelanggaran sistem tunggal. Ini adalah pengambilan kredensial yang membuka akses terautentikasi ke setiap layanan yang terhubung. Tanpa peta ketergantungan kredensial untuk setiap host alat AI, respons insiden terhadap penyusupan agen hanya berupa dugaan. Untuk setiap contoh, dokumentasikan setiap kredensial, tingkat aksesnya, dan proses rotasi kredensial yang relevan. Mulailah juga memigrasikan kunci API statis ke token berumur pendek jika layanan downstream mengizinkannya. Lima tindakan untuk kuartal pertama ini. Terapkan filter KEV-EPSS-CVSS tiga lapisGanti prioritas khusus CVSS sesuai tabel di atas. Otomatiskan pengumpulan data dari ketiga API sebagai bagian dari skrip terjadwal terhadap inventaris aset Anda. Hasil yang diinginkan: 18 kali lebih efisien, cakupan kerentanan yang dieksploitasi sebesar 85,6%, pengurangan beban kerja remediasi yang mendesak sebesar 95%.2. Menerapkan patching berbasis peristiwa untuk layanan Tingkat 0. Tentukan layanan mana yang termasuk dalam tingkat paparan kritis: Layanan yang diekspos langsung ke pengguna internet, host pembuat AI, dan bidang kontrol orkestrasi kontainer. Memicu patching berbasis peristiwa pada publikasi CVE alih-alih menunggu jendela pemeliharaan berikutnya untuk tingkat ini. Sasaran: menerapkan patch ke canary dalam waktu empat jam setelah CVE dinyatakan kritis. Gunakan feed CISA KEV dan EPSS untuk memicu patching berbasis peristiwa. Dalam situasi di mana tidak mungkin untuk memenuhi tujuan patching empat jam karena ketergantungan warisan, jendela pembekuan perubahan, atau risiko rollback, segera terapkan kontrol kompensasi seperti menghapus paparan internet ke layanan yang rentan, merotasi kredensial untuk layanan yang rentan, menonaktifkan fungsi layanan yang terpengaruh (jika berlaku), dan mengidentifikasi pemilik pengecualian untuk paparan tersebut hingga patch dapat diterapkan. Tidak diperbolehkan membiarkan eksposur tanpa batas dalam jangka waktu lama sambil menunggu jangka waktu pemeliharaan.3. Uji batas otorisasi pada skala agen. Buat kasus pengujian untuk setiap API yang dapat berkomunikasi dengan agen AI melalui kebijakan AuthZ. Secara khusus, sertakan kasus pengujian untuk permintaan yang melebihi ukuran isi 1 MB, 5 MB, dan 10 MB. Hal ini mencakup kasus pengujian untuk laju burst > 100 permintaan per detik dan kasus pengujian untuk kombinasi parameter yang tidak biasa (bendera istimewa, pemasangan host, penambahan kemampuan). Selain itu, patch ke Docker Engine 29.3.1 untuk memperbaiki CVE-2026-34040.4. Pemetaan radius ledakan kredensial untuk semua host pembuat AI. Dokumentasikan setiap kredensial untuk setiap instans pipeline Langflow, Flowise, n8n, dan AI kustom. Klasifikasikan setiap kredensial berdasarkan umurnya (kunci statis vs. token berumur pendek). Identifikasi apa yang dapat diakses oleh setiap kredensial. Siapkan peringatan untuk IP atau identitas anomali untuk akses kredensial apa pun.5. Pemindaian penemuan Shadow AI untuk minggu ini. Menurut data CSA, terdapat kemungkinan lebih dari 50% bahwa agen Anda telah melampaui batas yang diharapkan. Periksa Informasi Keamanan dan Manajemen Peristiwa (SIEM) dan alat pemantauan jaringan Anda untuk komunikasi ke port default pembuat AI: Langflow 7860, Flowise 3000, dan n8n 5678. Setiap kejadian yang tidak sah merupakan permukaan serangan yang tidak terpantau. Agen takeawayAI bermunculan, dan badan standar merespons. IETF memiliki banyak konsep yang terkait dengan otentikasi dan otorisasi agen. Koalisi untuk AI Aman telah menerbitkan taksonomi Keamanan MCP dan prinsip-prinsip Secure-by-Design. Namun standar-standar ini bergerak sesuai kecepatan standar, dan jendela eksploitasi kini diukur dalam hitungan jam. Organisasi yang menerapkan filter tiga lapis dan patching berbasis peristiwa pada kuartal ini akan mengalami pengurangan paparan yang terukur. Mereka yang menunggu akan menjalankan siklus patch berbasis kalender melawan musuh yang beroperasi dalam waktu kurang dari 20 jam. Nik Kale adalah insinyur utama yang berspesialisasi dalam platform dan keamanan AI perusahaanSelamat datang di komunitas VentureBeat! Program posting tamu kami adalah tempat para pakar teknis berbagi wawasan dan memberikan penjelasan mendalam yang netral dan tidak terikat pada AI, infrastruktur data, keamanan siber, dan teknologi mutakhir lainnya yang membentuk masa depan perusahaan.Baca lebih lanjut dari program posting tamu kami — dan lihat pedoman kami jika Anda tertarik untuk menyumbangkan artikel Anda sendiri!
Diterbitkan : 2026-05-31 16:30:00
sumber : venturebeat.com



