Microsoft menawarkan kepada pengembang cara yang lebih baik untuk mengontrol perilaku agen AI

Ketika agen AI semakin mampu, perusahaan berlomba untuk menerapkannya di berbagai aplikasi, alur kerja, dan produk menghadapi tantangan baru: memastikan agen melakukan apa yang seharusnya dilakukan ketika diterapkan di lingkungan yang berbeda. Microsoft mencoba mengatasi masalah ini dengan standar sumber terbuka baru yang disebut Spesifikasi Kontrol Agen, atau ACS, yang bertujuan memberi pengembang cara yang lebih konsisten dan terperinci untuk mengontrol apa yang boleh dilakukan oleh agen AI. Spesifikasi ini pada dasarnya memungkinkan tim pengembang, kepatuhan, dan keamanan menentukan kebijakan mereka sendiri untuk diikuti oleh agen. Aturan tersebut dapat menentukan apa yang boleh dilakukan agen, apa yang tidak boleh dilakukan, kapan manusia harus menyetujui suatu tindakan, dan bukti apa yang harus dicatat untuk ditinjau nanti. File kebijakan ini diperiksa di beberapa “titik intersepsi” ketika agen tidak melakukan tugas untuk memastikannya tetap berada dalam pagar pembatas. Spesifikasi ini muncul ketika pengembang melakukan improvisasi cara untuk mengontrol apa yang dilihat dan dilakukan AI mereka, terutama ketika percakapan berfokus pada alur kerja AI yang salah karena penyalahgunaan alat, atau tindakan tidak disengaja yang mengakibatkan kegagalan berjenjang. Saat ini, pengembang mungkin menentukan instruksi dalam prompt sistem, menambahkan pemeriksaan khusus dalam kode aplikasi, atau menggunakan pengklasifikasi untuk menangkap masukan dan keluaran yang bermasalah. Pendekatan tersebut berhasil, namun sering kali membuat perusahaan memiliki kontrol yang terfragmentasi sehingga sulit diaudit dan digunakan kembali di berbagai kerangka kerja, antarmuka, dan sistem. Kredit Gambar: Microsoft ACS bertujuan untuk mengintegrasikan kontrol tersebut ke dalam lapisan tata kelola umum. Microsoft mengatakan spesifikasi tersebut dapat digunakan untuk memeriksa apakah agen mematuhi batasan di beberapa titik dalam alur kerjanya — sebelum menerima masukan, sebelum memanggil alat, setelah alat mengembalikan hasil, dan sebelum respons akhir dikirim ke pengguna. Sebuah kebijakan mungkin memperbolehkan suatu tindakan, memblokirnya, menyunting informasi sensitif, atau bahkan meminta seseorang untuk menyetujuinya. Pengembang juga dapat memasukkan pengklasifikasi masukan dan keluaran guna mengkategorikan informasi, memprediksi hasil, atau menentukan bagaimana agen harus merespons; menambahkan LLM dengan petunjuk untuk bertindak sebagai “hakim” kebijakan; dan logika untuk memeriksa panggilan alat, pemilihan alat, keakuratan masukan, penggunaan keluaran, dan respons. Dan karena kebijakan ini dapat ditulis sebagai file tunggal, maka kebijakan tersebut dapat digabungkan dengan agen, sehingga memungkinkan kebijakan keamanan mengikuti agen di berbagai kerangka kerja dan lingkungan. ACS dikirimkan sebagai SDK dengan plugin untuk LangChain, OpenAI Agents SDK, Anthropic Agents SDK, AutoGen, CrewAI, Semantic Kernel, Microsoft.Extensions.AI, alat MCP, dan banyak lagi. Saat Anda membeli melalui tautan di artikel kami, kami mungkin mendapat komisi kecil. Hal ini tidak mempengaruhi independensi editorial kami.


Diterbitkan : 2026-06-02 18:00:00

sumber : techcrunch.com