
- Magentic Marketplace milik Microsoft mengungkap ketidakmampuan agen AI untuk bertindak secara independen
- Agen sisi pelanggan mudah dipengaruhi oleh agen bisnis selama simulasi transaksi
- Agen AI melambat secara signifikan ketika dihadapkan pada terlalu banyak pilihan
Yang baru Microsoft Studi ini telah menimbulkan pertanyaan tentang kesesuaian agen AI yang beroperasi tanpa pengawasan penuh dari manusia/
Perusahaan baru-baru ini membangun lingkungan sintetis, “Pasar Magentik“, dirancang untuk mengamati kinerja agen AI dalam situasi tanpa pengawasan.
Proyek ini berbentuk simulasi penuh platform e-niaga yang memungkinkan para peneliti mempelajari bagaimana agen AI berperilaku sebagai pelanggan dan bisnis – dengan kemungkinan hasil yang dapat diprediksi.
Menguji batasan model AI saat ini
Proyek ini mencakup 100 agen sisi pelanggan yang berinteraksi dengan 300 agen sisi bisnis, memberikan tim pengaturan terkendali untuk menguji keterampilan pengambilan keputusan dan negosiasi agen.
Kode sumber untuk pasar adalah sumber terbuka; oleh karena itu, peneliti lain dapat mengadopsinya untuk mereproduksi eksperimen atau mengeksplorasi variasi baru.
Ece Kamar, CVP dan direktur pelaksana AI Frontiers Lab di Microsoft Research, menyatakan bahwa penelitian ini sangat penting untuk memahami bagaimana agen AI berkolaborasi dan mengambil keputusan.
Pengujian awal menggunakan campuran model terkemuka, termasuk GPT-4o, GPT-5, dan Gemini-2.5-Flash.
Hasilnya tidak sepenuhnya tidak terduga, karena beberapa model menunjukkan kelemahan.
Agen pelanggan dapat dengan mudah dipengaruhi oleh agen sisi bisnis dalam memilih produk, sehingga mengungkap potensi kerentanan ketika agen berinteraksi dalam lingkungan yang kompetitif.
Efisiensi para agen menurun tajam ketika dihadapkan pada terlalu banyak pilihan, sehingga membebani rentang perhatian mereka dan menyebabkan pengambilan keputusan menjadi lebih lambat atau kurang akurat.
Agen AI juga mengalami kesulitan ketika diminta untuk bekerja mencapai tujuan bersama, karena model tersebut sering kali tidak yakin agen mana yang harus mengambil peran tertentu, sehingga mengurangi efektivitas mereka dalam tugas bersama.
Namun, kinerjanya hanya meningkat jika petunjuk langkah demi langkah diberikan.
“Kami dapat memberikan instruksi kepada para model – seperti yang dapat kami sampaikan kepada mereka, langkah demi langkah. Namun jika kami menguji kemampuan kolaborasi mereka secara inheren, saya berharap model-model ini memiliki kemampuan ini secara default,” kata Kamar.
Hasilnya menunjukkan alat AI masih memerlukan bimbingan manusia yang substansial agar dapat berfungsi secara efektif di lingkungan multi-agen.
Seringkali dipromosikan sebagai agen yang mampu mengambil keputusan dan berkolaborasi secara independen, hasilnya menunjukkan bahwa perilaku agen tanpa pengawasan masih tidak dapat diandalkan, sehingga manusia harus meningkatkan mekanisme koordinasi dan menambahkan perlindungan terhadap manipulasi AI.
Simulasi Microsoft menunjukkan bahwa agen AI masih belum dapat beroperasi secara independen dalam skenario kompetitif atau kolaboratif dan mungkin tidak akan pernah mencapai otonomi penuh.
Ikuti TechRadar di Google Berita Dan tambahkan kami sebagai sumber pilihan untuk mendapatkan berita, ulasan, dan opini pakar kami di feed Anda. Pastikan untuk mengklik tombol Ikuti!
Dan tentu saja Anda juga bisa Ikuti TechRadar di TikTok untuk berita, review, unboxing dalam bentuk video, dan dapatkan update rutin dari kami Ada apa juga.



