Model terkecil Liquid AI namun LFM2.5-230M mengalahkan model berukuran 4X lipat dalam ekstraksi data, dapat berjalan ‘di mana saja’


Liquid AI, yang didirikan oleh mantan ilmuwan komputer MIT, hari ini merilis model bahasa AI terkecilnya, LFM2.5-230M, dan perusahaan sebaiknya mempertimbangkannya untuk digunakan dalam ekstraksi data dan penerapan lokal pada ponsel cerdas, laptop, dan robotika. Ini adalah model dasar dengan 230 juta parameter yang secara eksplisit dirancang untuk alur kerja agen pada perangkat, dan seperti yang dinyatakan Liquid dalam postingan blog rilisnya, ukuran kecil tersebut memungkinkan untuk dijalankan hampir “di mana saja”. Menurut Liquid, performanya juga mengungguli model yang ukurannya lebih dari 4X lipat pada tolok ukur tertentu, khususnya lebih baik dalam ekstraksi data dibandingkan dengan 800 juta jumlah parameter Alibaba Qwen3.5-0.8B (Instruct) dan 1 miliar parameter Google Gemma 3 1B.Liquid AI LFM2.5-230M grafik perbandingan benchmark. Kredit: AI CairModel ini menargetkan pengembang dan insinyur yang membangun jalur ekstraksi data ringan dan sistem edge otonom. Beroperasi di bawah lisensi komersial penggunaan ganda, model ini tetap gratis untuk individu dan perusahaan yang menghasilkan pendapatan tahunan kurang dari $10 juta, namun memerlukan perjanjian perusahaan berbayar untuk perusahaan besar. Rilisan ini membedakan dirinya dari model AI kecil lainnya dengan memanfaatkan arsitektur LFM2 untuk mencapai kecepatan inferensi tinggi tanpa overhead memori besar yang khas dari transformator dengan parameter berat. Sementara perusahaan AI besar Anthropic, OpenAI, Google, Microsoft, Meta, dan lainnya mendorong jumlah parameter hingga ratusan miliar atau triliunan untuk mencapai kinerja terdepan, persaingan paralel berfokus sepenuhnya pada penerapan edge dan lokal. Peluncuran LFM2.5-230M oleh Liquid AI menandakan perubahan penting menuju efisiensi arsitektur dibandingkan penskalaan brute force. Dengan memasukkan 19 triliun token pra-pelatihan ke dalam 230 juta parameter, perusahaan menunjukkan bahwa perangkat edge tidak memerlukan daya komputasi yang besar atau koneksi cloud yang persisten untuk menjalankan alur kerja agen multi-langkah yang kompleks. Cara kerja LFM2.5-230MModel LFM2.5-230M berbeda dari arsitektur trafo standar, dan mengandalkan kerangka kerja LFM2. Arsitektur ini berfungsi sebagai sistem hibrid, menyisipkan konvolusi jarak pendek yang terjaga keamanannya dengan perhatian kueri yang dikelompokkan untuk memproses informasi secara efisien. Bagi mereka yang melacak evolusi arsitektur yang efisien, pendekatan Liquid memiliki tujuan konseptual yang serupa: mengelola konteks panjang dan data sekuensial secara efektif pada perangkat keras edge tanpa biaya memori kuadratik dari mekanisme perhatian murni. Model ini mendukung jendela konteks 32K yang luas, memungkinkannya menyerap dokumen penting atau aliran telemetri robotik yang berkelanjutan. Saat menganalisis bagan kinerja yang disediakan dalam rilis, efisiensi arsitektur menjadi jelas secara visual. Model ini mempertahankan jejak memori di bawah 400MB sekaligus mencapai kecepatan pra-pengisian dan dekode yang melampaui model sebanding seperti Gemma 3 1B IT dan Granite 4.0-H-350M. Pada Samsung Galaxy S25 Ultra yang dilengkapi dengan CPU Qualcomm Snapdragon Gen4, model ini mencapai kecepatan dekode 213 token per detik. Bahkan pada Raspberry Pi 5 yang sangat terbatas, model ini mempertahankan kecepatan dekode sebesar 42 token per detik. Selain itu, benchmarking internal menunjukkan bahwa tumpukan inferensi GPU memberikan latensi end-to-end yang lebih rendah dibandingkan model kecil pesaingnya di semua tingkat konkurensi. Mengapa hal ini penting bagi perusahaan Untuk memahami mengapa model dengan 230 juta parameter diperlukan, kita harus melihat bagaimana perusahaan saat ini mengelola data. Organisasi secara tradisional mengandalkan skrip Ekstrak, Transformasi, Muat (ETL) yang kaku dan berbasis aturan untuk memindahkan dan memproses data. Namun, sistem warisan ini terkenal rapuh; perubahan sederhana pada tata letak dokumen atau pembaruan skema dapat merusak keseluruhan alur. Untuk mengatasi hal ini, industri beralih ke “AI ETL”, di mana pembelajaran mesin menyimpulkan pemetaan, mendeteksi penyimpangan skema, dan beradaptasi terhadap perubahan secara otomatis. Dalam pipeline ekstraksi data modern yang ringan, model AI terhubung ke sumber tidak terstruktur—seperti PDF, email, atau formulir web—dan menyusun data ke dalam format seperti JSON tanpa memerlukan aturan hardcode. Bagi perusahaan, menggunakan model unggulan besar seperti Claude Opus 4.6 (dengan biaya $5,00 per juta token masukan) untuk mengurai faktur rutin, memformat alamat, atau data telemetri rute tidak layak secara ekonomi. Di sinilah model seperti LFM2.5-230M menjadi penting. Didesain secara eksplisit sebagai mesin ekstraksi yang ringan, mesin ini memungkinkan perusahaan untuk mengotomatiskan pemformatan berulang dan penguraian data dengan biaya komputasi dan latensi yang lebih rendah, berjalan langsung pada perangkat keras lokal dibandingkan mengandalkan panggilan API cloud yang mahal dan berkelanjutan. Tolok Ukur Model Kecil: LFM vs. Kelas 3BIndustri AI pada pertengahan tahun 2026 mengalami kebangkitan dalam model “kecil”, namun definisi “kecil” sangat bervariasi. Baru-baru ini, komunitas open-weight dikejutkan oleh VibeThinker-3B dari Weibo, model dengan 3 miliar parameter yang dibangun di atas tulang punggung gaya Qwen2, mencapai nilai luar biasa sebesar 94,3 pada benchmark matematika AIME 2026, menyaingi raksasa dengan 600 miliar parameter melalui kurasi data yang agresif dan pembelajaran penguatan. Demikian pula, rangkaian Gemma 4 Google — yang baru-baru ini melampaui 200 juta unduhan — mendorong AI terdepan, termasuk E2B (2 miliar parameter) yang dirancang khusus untuk penerapan seluler dan IoT. Sebaliknya, LFM2.5-230M Liquid AI beroperasi pada kelas bobot yang benar-benar berbeda. Dengan hanya 230 juta parameter, ini kira-kira sepersepuluh ukuran model Gemma 4 terkecil Google dan VibeThinker-3B. Karena jejak mikroskopisnya, LFM2.5-230M tidak dirancang untuk bersaing pada beban kerja yang berat seperti matematika tingkat lanjut, pengkodean, atau penulisan kreatif—sebuah kendala yang secara eksplisit diakui oleh Liquid AI. Namun, dalam domain yang dimaksudkan yaitu ekstraksi data dan pemanggilan alat, model ini jauh melampaui kelas bobotnya. Tolok ukur yang dirilis oleh Liquid AI menunjukkan LFM2.5-230M mendapat skor 43,26 pada tolok ukur penggunaan alat BFCLv3, mendominasi Granite 4.0-350M milik IBM (39,58) dan benar-benar melampaui model 1 miliar parameter yang lebih besar seperti Gemma 3 1B IT milik Google (16,61). Bagan batang perbandingan benchmark Liquid AI LFM2.5-230M. Kredit: Liquid AIOn CaseReportBench untuk ekstraksi data, skornya 22,51, menghancurkan Qwen3.5-0.8B (Instruksikan). LFM2.5-230M membuktikan bahwa meskipun model dengan 3 miliar parameter seperti VibeThinker memecahkan kalkulus tingkat lanjut, model dengan 230 juta parameter adalah pilihan yang unggul dan sangat optimal untuk mengeksekusi pemanggilan alat terstruktur dan menjaga pipeline agen berjalan secara efisien pada perangkat keras yang terbatas. Penggunaan penelitian tingkat lanjutKarena unggul dalam pemanggilan alat, LFM2.5-230M berfungsi terutama sebagai lapisan pemilihan keterampilan. Liquid AI mendemonstrasikan kemampuan ini dengan menerapkan model pada robot humanoid Unitree G1. Berjalan sepenuhnya pada perangkat melalui modul komputasi NVIDIA Jetson Orin yang terpasang pada robot, model ini berhasil memproses perintah lingkungan yang kompleks. Sebagaimana dicatat dalam blog teknis perusahaan, model ini mengambil instruksi bentuk bebas seperti, *”Diam selama 2 detik, lalu berjalan maju dengan kecepatan 1 meter per detik selama 3 meter, berlutut dengan satu kaki ke depan selama 5 detik, dan berjalan mundur dengan kecepatan 0,5 meter per detik selama 3 meter,”* dan secara otomatis menerjemahkannya ke dalam rencana multi-langkah terstruktur yang memanggil keterampilan tingkat rendah terlatih yang disediakan oleh kerangka SONIC NVIDIA. Model dasar dan pasca-pelatihan segera tersedia di Hugging Face, dengan dukungan asli sehari-hari di seluruh ekosistem inferensi untuk llama.cpp (GGUF), MLX, vLLM, SGLang, dan ONNX. Lisensi Terbuka LFM khusus penggunaan ganda, Liquid AI mengirimkan LFM2.5-230M di bawah LFM Open License v1.0. Meskipun terdapat kata “terbuka” pada judulnya, ini bukanlah lisensi yang sesuai dengan Open Source Initiative (OSI); lisensi ini beroperasi sebagai kerangka kerja komersial yang terbatas dan dapat digunakan ganda. Untuk pengembang independen, peneliti, dan perusahaan rintisan tahap awal, lisensi ini berfungsi sama dengan perangkat lunak sumber terbuka. Pengguna menerima lisensi bebas royalti yang berlaku selamanya, di seluruh dunia, untuk mereproduksi, memodifikasi, dan mendistribusikan model, asalkan mereka mempertahankan pemberitahuan hak cipta asli dan dengan jelas menyatakan setiap modifikasi. Namun, lisensi tersebut mencakup “Batasan Penggunaan Komersial” yang ketat. Badan hukum mana pun yang menghasilkan pendapatan tahunan sebesar $10 juta atau lebih akan kehilangan hak untuk menggunakan model tersebut secara komersial berdasarkan perjanjian ini. Perusahaan besar yang melewati ambang batas finansial ini harus menegosiasikan perjanjian komersial terpisah dan berbayar dengan Liquid AI untuk menerapkan model tersebut dalam produksi. Strategi ini melindungi perusahaan agar kekayaan intelektualnya tidak diserap oleh konglomerat teknologi besar secara gratis, sambil tetap menyebarkan model tersebut di tingkat pengembang akar rumput.


Diterbitkan : 2026-06-25 23:31:00

sumber : venturebeat.com