Beranda Teknologi Kerangka kerja memori agen baru menggunakan 118 ribu token per kueri. LangMem...

Teknologi

Kerangka kerja memori agen baru menggunakan 118 ribu token per kueri. LangMem membakar hingga 3,26M. | beritakitanih

Penulis

Juni 27, 2026

Kerangka kerja memori agen baru menggunakan 118 ribu token per kueri. LangMem membakar hingga 3,26M.

Penalaran jangka panjang mengungkap kelemahan utama dalam agen AI: jendela konteks terisi dengan cepat, dan jalur pengambilan mengembalikan kebisingan, bukan sinyal. Untuk mengatasi hal ini, para peneliti di Universitas Nasional Singapura mengembangkan MRAgent, sebuah kerangka kerja yang mengabaikan pendekatan statis “pengambilan lalu alasan”. Sebaliknya, ia menggunakan mekanisme yang memungkinkan agen mengembangkan ingatannya secara dinamis berdasarkan akumulasi bukti. Rekonstruksi memori multi-langkah ini diintegrasikan ke dalam proses penalaran model bahasa besar (LLM). Meskipun bukan satu-satunya kerangka kerja dalam bidang ini, MRAgent secara signifikan mengurangi konsumsi token dan biaya runtime dibandingkan dengan pendekatan manajemen memori agen lainnya. Batasan pengambilan pasif dalam tugas jangka panjang Dalam jalur pengambilan klasik, dokumen diambil melalui pencarian vektor atau traversal grafik dan diteruskan ke LLM untuk alasan. Pendekatan pasif ini gagal karena tidak dapat menggabungkan penalaran dengan akses memori, sehingga menciptakan tiga hambatan utama: Sistem ini tidak dapat merevisi strategi pengambilannya di tengah-tengah penalaran. Jika agen mengambil dokumen dan menemukan petunjuk penting yang hilang – tanggal atau orang tertentu – agen tidak dapat mengeluarkan kueri baru berdasarkan temuan tersebut. Skor kesamaan yang tetap dan perluasan grafik yang telah ditentukan mengembalikan kecocokan tingkat permukaan yang membanjiri jendela konteks LLM dengan kebisingan yang tidak relevan, sehingga menurunkan alasan. Sistem saat ini sangat bergantung pada struktur yang telah dibangun sebelumnya seperti hasil top-k dan fungsi relevansi statis, sehingga membatasi fleksibilitas yang diperlukan untuk menskalakan interaksi pengguna dalam jangka waktu yang tidak dapat diprediksi dan jangka panjang. Para peneliti berpendapat bahwa untuk mengatasi keterbatasan ini, pengembang harus beralih ke “proses rekonstruksi aktif dan asosiatif,” sebuah konsep yang terinspirasi oleh ilmu saraf kognitif. Pengambilan pasif vs rekonstruksi memori aktif (sumber: arXiv) Di bawah paradigma ini, penarikan memori terjadi secara berurutan, bukan beroperasi sebagai pembacaan pasif dari database statis. Sistem dimulai dengan pemicu kecil dan spesifik dari perintah pengguna, seperti nama seseorang, tindakan, atau tempat. Petunjuk awal ini menunjuk pada konsep atau kategori yang saling terhubung, bukan kumpulan teks yang sangat banyak. Dengan mengikuti batu loncatan metadata ini, agen mengumpulkan bukti-bukti kecil satu per satu. Ia menggunakan setiap informasi baru untuk memandu langkah selanjutnya hingga berhasil menyatukan cerita yang lengkap dan akurat. Bagaimana MRAgent mengimplementasikan rekonstruksi memori aktif Daripada melihat memori sebagai database statis, MRAgent (Memory Reasoning Architecture for LLM Agents) memperlakukannya sebagai lingkungan interaktif. Saat memproses kueri yang kompleks, agen menggunakan kemampuan penalaran LLM tulang punggung untuk menjelajahi beberapa jalur pengambilan kandidat di seluruh grafik memori terstruktur. Pada setiap langkah, LLM mengevaluasi bukti perantara yang telah dikumpulkannya dan menggunakannya untuk mengoptimalkan pencariannya secara berulang. Ini menyimpulkan batasan pencarian baru, mencari jalur dengan informasi terbaik, dan memangkas cabang yang tidak relevan. Hal ini memungkinkan MRAgent mengumpulkan informasi yang terkubur dalam-dalam tanpa mengisi konteks LLM dengan noise. Arsitektur MRAgent (sumber: arXiv) Untuk menjadikan eksplorasi aktif ini efisien secara komputasi dan terukur, kerangka kerja mengatur database-nya menggunakan mekanisme “Isyarat-Tag-Konten”. Ini beroperasi sebagai grafik asosiatif berlapis-lapis dengan tiga jenis simpul: Isyarat: Kata kunci terperinci, seperti entitas atau atribut kontekstual yang diambil dari interaksi pengguna. Konten: Unit memori sebenarnya yang disimpan. Ini dibagi menjadi lapisan multi-butiran, seperti memori episodik untuk peristiwa konkret dan memori semantik untuk fakta stabil dan preferensi pengguna. Tag: Jembatan semantik yang merangkum hubungan relasional antara Isyarat dan Konten tertentu. Struktur ini memungkinkan proses pengambilan dua tahap yang sangat efisien. LLM pertama-tama bernavigasi dari Isyarat ke Tag kandidat. Karena Tag secara eksplisit memaparkan hubungan semantik dan asosiasi struktural data, agen mengevaluasi ringkasan singkat ini untuk menilai relevansinya. LLM mengidentifikasi jalur traversal yang menjanjikan dan membuang cabang yang tidak relevan sebelum menggunakan komputasi dan meminta token untuk mengakses konten memori yang terperinci dan berat. Misalnya, pengguna mungkin bertanya kepada agen AI, “Bagaimana Nate menggunakan hadiah uang ketika dia memenangkan turnamen video game ketiganya?” Agen MRA pertama-tama mengekstrak isyarat awal yang terperinci dari perintah, seperti “Nate”, “turnamen video game”, dan “menang”. Agen melihat tag seperti “Kemenangan Turnamen” dan “Partisipasi Turnamen”. Karena hanya berkaitan dengan apa yang dilakukan orang tersebut setelah mereka memenangkan kejuaraan, MRAgent menghilangkan tag partisipasi turnamen dan mengejar tag kemenangan. Agen mengambil konten episodik yang terkait dengan pasangan Cue-Tag yang dipilih, mengambil tiga episode memori berbeda saat Nate memenangkan turnamen. MRAgent melihat tiga memori, memutuskan salah satunya relevan dengan kueri, dan membuang dua lainnya. Dengan informasi ini, ia memperbarui isyaratnya dan memulai putaran penemuan dan pemangkasan lainnya. Dari memori episodik baru yang diambilnya, agen menambahkan “pendapatan turnamen” ke dalam isyaratnya dan menggunakannya untuk menelusuri tag baru dan memasukkan memori baru. Ini mengulangi proses ini sampai mengumpulkan cukup informasi untuk menjawab pertanyaan, yang bisa berupa “Nate menghemat uang.” Kinerja MRAgent pada tolok ukur industriMRAgent beroperasi bersama beberapa kerangka kerja lain yang menangani pembangunan memori agen. Alternatifnya termasuk A-MEM, kerangka memori agen berbasis grafik, dan MemoryOS, kerangka memori hierarkis. Kerangka kerja memori persisten lainnya termasuk LangMem dan Mem0. Para peneliti menguji MRAgent pada tolok ukur industri LoCoMo dan LongMemEval. Ini menguji kemampuan agen untuk menyelesaikan pertanyaan tentang tugas-tugas jangka panjang dan percakapan dalam lusinan sesi dan ratusan putaran dialog. Model backbone yang digunakan adalah Gemini 2.5 Flash dan Claude Sonnet 4.5. Sistem diuji terhadap RAG standar, A-MEM, MemoryOS, LangMem, dan Mem0. MRAgent secara konsisten mengungguli setiap baseline di kedua model dan semua jenis pertanyaan dengan selisih yang signifikan. Namun, bagi pengembang perusahaan, metrik yang paling penting sering kali adalah biaya komputasi. Dalam pengujian LongMemEval, MRAgent memangkas konsumsi token cepat menjadi hanya 118 ribu per sampel. Sebagai perbandingan, A-Mem menggunakan 632 ribu token, dan LangMem membakar 3,26 juta token per kueri. MRAgent juga secara efektif mengurangi separuh waktu proses dibandingkan dengan A-Mem, turun dari 1.122 detik menjadi 586 detik. Performa MRAgent (sumber: arXiv) Yang membuat MRAgent efisien dalam praktiknya adalah perilaku sesuai permintaannya. Mengevaluasi tag dan memangkas jalur yang tidak relevan sebelum pengambilan akan menghemat uang dan ruang konteks. Selain itu, sistem secara mandiri mengevaluasi konteks yang terakumulasi dan secara inheren mengetahui kapan harus berhenti mencari, sepenuhnya menghindari eksplorasi data yang berlebihan. Implementasi dan pengembangan Meskipun MRAgent sangat efektif, struktur Cue-Tag-Content perlu disiapkan sebelum agen dapat menanyakannya. Pengembang harus mencari cara untuk merancang basis data memori yang mendasarinya agar LLM dapat menavigasi item asosiatif secara efisien dan memangkas jalur yang tidak relevan tanpa membebani biaya komputasi. Untungnya, pengembang tidak perlu memberi label atau menyusun data ini secara manual. Penulis merancang MRAgent dengan jalur distilasi otomatis yang menggunakan LLM untuk memproses riwayat interaksi mentah dan secara otomatis mengisi grafik memori. Bagi pengembang, tugasnya adalah menerapkan dan mengatur alur penyerapan otomatis ini, bukan memberi tag pada data secara manual. Anda perlu menyiapkan tugas latar belakang atau alur streaming yang meneruskan interaksi pengguna mentah melalui templat cepat untuk mengekstrak metadata ini sebelum menyimpannya dalam database grafik Anda. Namun, penulis menekankan bahwa ini adalah fase konstruksi yang ringan dan MRAgent sengaja membuat penyerapan tetap sederhana. Penulis telah merilis kode di GitHub.

Diterbitkan : 2026-06-26 22:58:00

sumber : venturebeat.com

Kerangka kerja memori agen baru menggunakan 118 ribu token per kueri. LangMem membakar hingga 3,26M. | beritakitanih

Kerangka kerja memori agen baru menggunakan 118 ribu token per kueri. LangMem membakar hingga 3,26M.

MOST COMMENTED

Pengguna TikTok TERHANCUR mengetahui kebenaran tentang ‘lagu terbaik tahun ini’ – ketika seseorang mengungkapkan...

Mengapa beberapa hewan memakan anaknya? Alasannya lebih dari banyak…

Insinyur Jerman menjadi astronot lumpuh pertama yang pergi ke luar angkasa

POPULAR CATEGORY

Calvin dan Hobbes Lengkap adalah hadiah Hari Ayah yang luar biasa...