Injeksi cepat mengeksploitasi kelemahan desain terbesar AI perusahaan dengan menargetkan agen, saluran RAG, dan router model


Dalam dua tahun terakhir, bisnis telah mencoba menyesuaikan model bahasa besar (LLM) ke dalam dukungan, analisis, pengembangan, dan otomatisasi internal dengan cara yang belum pernah dilakukan sebelumnya. Seiring dengan meningkatnya adopsi teknologi AI, tren lain juga mendapatkan momentumnya – penjahat dunia maya memanfaatkan kesenjangan antara asumsi tentang LLM dan karakteristik sebenarnya. Pada tahun 2025 dan 2026, beberapa sumber independen menyoroti tren yang sama: Injeksi cepat tetap menjadi salah satu vektor serangan yang paling berdampak dan terbukti secara luas terhadap sistem LLM. OWASP LLM Top 10 (2025) mencantumkan injeksi cepat sebagai LLM01, yang mengidentifikasinya sebagai kategori kerentanan spesifik LLM yang paling kritis, untuk edisi kedua berturut-turut. Pemeringkatan OWASP mencerminkan fakta bahwa LLM masih kesulitan memisahkan instruksi dari data secara andal, membuatnya rentan terhadap manipulasi melalui masukan yang dibuat. Laporan Ancaman Global CrowdStrike tahun 2026 — yang dibuat berdasarkan intelijen garis depan di lebih dari 280 musuh yang terlacak — mendokumentasikan bahwa pelaku ancaman memasukkan perintah jahat ke dalam alat AI generatif yang sah di lebih dari 90 organisasi pada tahun 2025. Mereka kemudian menggunakan suntikan tersebut untuk menghasilkan perintah yang mencuri kredensial dan mata uang kripto. Laporan tersebut menyatakannya dengan jelas: “Permintaan adalah malware baru.” Musuh yang didukung AI meningkatkan keseluruhan volume serangan mereka sebesar 89% dari tahun ke tahun, dengan injeksi cepat yang berfungsi sebagai titik masuk dan pengganda kekuatan. Insiden di dunia nyata menggambarkan dampak operasional. Pada bulan Agustus 2024, para peneliti di PromptArmor mengungkapkan kerentanan injeksi cepat di Slack AI yang memungkinkan penyerang mengambil data dari saluran Slack pribadi yang tidak dapat mereka akses — termasuk kunci API yang dibagikan di saluran pengembang swasta — dengan menempatkan instruksi jahat di saluran publik atau menyematkannya ke dalam dokumen yang diunggah. Pada bulan Juni 2025, para peneliti di Aim Security mengungkapkan EchoLeak (CVE-2025-32711, CVSS 9.3), eksploitasi injeksi cepat zero-click yang pertama kali didokumentasikan terhadap sistem AI produksi, yang menargetkan Microsoft 365 Copilot. Dengan mengirimkan satu email buatan, tidak diperlukan interaksi pengguna, penyerang dapat menyebabkan Copilot mengakses file internal dan mengirimkan kontennya ke server yang dikendalikan penyerang. Kedua kerentanan telah ditambal. Insiden-insiden ini menggarisbawahi fakta bahwa injeksi cepat bukanlah kelemahan teoritis namun merupakan ancaman praktis dan berulang yang harus diatasi oleh organisasi saat mereka menerapkan sistem AI dalam skala besar. Teknik injeksi cepat telah mengalami evolusi besar dalam beberapa tahun terakhir, kini menargetkan arsitektur multi-agen, pipeline retrieval-augmented generation (RAG), router model, dan kemampuan memori jangka panjang. Tantangan perusahaan: Terlalu banyak kepercayaan Bisnis menerapkan LLM untuk memproses instruksi, meringkas informasi, dan memicu alur kerja otomatis, namun sulit untuk dilakukan. LLM yang perlu diketahui: Hal ini menciptakan peluang bagi penyerang untuk memanipulasi dan memengaruhi perilaku model, baik secara langsung maupun tidak langsung. Injeksi cepat modern Injeksi cepat lintas model Penggunaan LLM adalah praktik umum di kalangan perusahaan. Penyerang merusak keluaran model tertentu, mengetahui dengan baik bahwa model lain akan memproses konten tersebut. Oleh karena itu, korupsi menyebar ke seluruh sistem AI. Keracunan rantai pasokan RAGPenyerang membuat informasi berbahaya — dokumentasi, artikel blog, GitHub README. Kemudian mereka menunggu hingga informasi berbahaya ini diserap ke dalam saluran RAG perusahaan, lalu menggunakannya sebagai vektor serangan. Pembajakan agenAgen AI telah berevolusi hingga mereka dapat mengirim email, memodifikasi infrastruktur cloud, mengeksekusi cuplikan kode, dan berinteraksi dengan sistem internal perusahaan. Hanya dibutuhkan satu instruksi untuk membuat agen bertindak berbeda dengan cara yang berbahaya. Serangan luapan konteks Dengan bantuan jendela konteks jutaan token, penyerang menempatkan kode berbahaya di dalam dokumen dan berharap bahwa LLM akan tersandung dan mengeksekusinya, sehingga mengesampingkan semua instruksi sebelumnya. Keracunan memori Karena penerapan memori jangka panjang di LLM, penyerang dapat memasukkan instruksi yang mengkonfigurasi ulang statusnya secara permanen. Manipulasi model-router Perusahaan semakin banyak menggunakan router model untuk memilih di antara beberapa LLM. Penyerang membuat perintah yang memaksa perutean ke model yang paling lemah atau paling tidak terlindungi. Mengapa hal ini penting bagi para pemimpin bisnisInjeksi cepat bukanlah masalah teoretis. Hal ini berdampak langsung pada: Sistem yang berhubungan dengan pelanggan (chatbot, agen dukungan) Kopilot internal (alat pengembang, asisten keamanan) Alur kerja otomatisasi (tiket, operasi cloud, proses SDM) Tata kelola data (jalur RAG, basis pengetahuan) Risiko tidak lagi terbatas pada “model mengatakan sesuatu yang tidak seharusnya.” Pada tahun 2026, injeksi cepat dapat: Memicu tindakan yang tidak sah Membocorkan data sensitif Alur kerja internal yang rusak Memanipulasi analisis logika bisnisKompromi sistem multi-agenPermukaan serangan telah meluas secara dramatis.Apa yang harus dilakukan perusahaan sekarang1. Batasi izin modelBatasi apa yang dapat dilakukan model, bukan hanya apa yang seharusnya dilakukan.2. Segmentasikan konten yang tidak tepercaya Perlakukan semua data eksternal — termasuk sumber RAG — sebagai data yang berpotensi bermusuhan.3. Pantau pemanggilan alatMembutuhkan persetujuan manusia untuk tindakan berdampak tinggi.4. Validasi asal kontenPastikan saluran pipa RAG tidak menyerap konten eksternal yang beracun.5. Perkuat router modelMencegah penyerang memaksa perutean ke model yang lebih lemah.6. Perlakukan LLM sebagai komponen yang tidak dapat dipercayaPerubahan pola pikir ini adalah dasar dari keamanan AI modern. Intinya Injeksi cepat tetap menjadi cara paling efektif untuk menyusupi sistem AI perusahaan karena mengeksploitasi cara mendasar LLM menafsirkan teks. Hingga organisasi memperlakukan LLM sebagai penerjemah yang tidak tepercaya — bukan pengambil keputusan yang otonom — injeksi cepat akan terus mendominasi lanskap ancaman AI. Julie Brunias adalah Arsitek Keamanan AI. Selamat datang di komunitas VentureBeat! Program postingan tamu kami adalah tempat para pakar teknis berbagi wawasan dan memberikan penjelasan mendalam yang netral dan tidak terikat pada AI, infrastruktur data, keamanan siber, dan teknologi mutakhir lainnya yang membentuk masa depan perusahaan. Baca lebih lanjut dari program postingan tamu kami — dan lihat pedoman kami jika Anda tertarik untuk berkontribusi artikel Anda sendiri!


Diterbitkan : 2026-06-28 18:00:00

sumber : venturebeat.com