Amazon akan mempresentasikan kerangka kerjanya untuk merekayasa agen AI yang tepercaya di VB Transform 2026

Agen AI semakin mahir dalam menjalankan tugas bisnis secara mandiri, namun para pemimpin TI berhati-hati dalam memberikan izin untuk mengakses sistem perusahaan. Tantangannya terletak pada bagaimana keandalan AI diukur. Standar industri sering kali mengandalkan skor EVAL, yang memberikan gambaran kinerja statis, bukan ukuran keandalan secara keseluruhan. Metrik ini bisa saja gagal menangkap prediktabilitas di seluruh perintah, lingkungan, dan jenis masukan, kata Bryan Silverthorn, direktur laboratorium penelitian Otonomi AGI di Amazon. Laboratorium penelitian otonomi AGI Amazon bergerak melampaui tolok ukur kinerja mentah, dan berfokus pada kerangka kerja terstruktur yang berpusat pada konsistensi, ketahanan, prediktabilitas, dan keamanan, kata Silverthorn kepada VentureBeat saat wawancara menjelang sesinya di VB Transform 2026. Daripada berasumsi bahwa model dapat dimanfaatkan untuk keselamatan, pendekatan Amazon menekankan sistem yang terpisah, seperti lingkungan sandbox di mana agen mengusulkan perubahan yang ditinjau oleh manusia sebelum diterapkan. Strategi ini bertujuan untuk menjembatani kesenjangan kepercayaan dengan memprioritaskan interaksi yang dapat diverifikasi, bahkan dalam domain yang sangat sensitif seperti keuangan, di mana potensi kerugian yang dapat ditimbulkan oleh agen sangatlah besar. Dalam survei Q2 Pulse Research yang dilakukan VentureBeat terhadap lebih dari 100 pemimpin teknologi senior dan pembeli, hanya 4% yang mengatakan bahwa mereka merasa nyaman hanya mengandalkan model pagar pembatas. Ketika ditanya apa yang paling mengkhawatirkan mereka tentang model pagar pembatas, 40% mengatakan akses tidak sah ke alat atau data dan 27% menyebutkan manipulasi atau injeksi yang cepat. Di VB Transform, Silverthorn akan berbagi rincian pendekatan Amazon terhadap AI agen yang dapat dipercaya dan bagaimana perusahaan dapat beralih dari pembungkus agen tunggal ke arsitektur multi-alat yang dapat melakukan koreksi mandiri di tengah eksekusi dalam sesinya yang bertajuk Menutup kesenjangan kemampuan-keandalan: Di dalam kerangka kerja Amazon untuk merekayasa agen yang dapat dipercaya. Operasi agen lainnya dan Sesi yang berfokus pada evals di konferensi andalan VentureBeat, yang diadakan pada tanggal 14 dan 15 Juli di Menlo Park, membahas tentang Intelijen dalam skala besar: Bagaimana Waymo membangun AI yang aman dan efisien untuk dunia fisik dengan pembicara Manasi Joshi, direktur kecerdasan sistem dan pembelajaran mesin di Waymo. Tertarik untuk mengikuti VB Transform 2026? Sejumlah tiket gratis tertentu juga tersedia bagi para pemimpin teknologi senior. Hubungi kami untuk mendapatkan milik Anda. Anda juga dapat membeli tiket di sini.
Diterbitkan : 2026-06-24 16:30:00
sumber : venturebeat.com



