Model Gemma 4 12B baru Google dirancang untuk dijalankan di laptop apa pun dengan RAM 16 GB

Gemma 4 12B hampir sama mumpuninya dengan versi dengan 26 miliar parameter. Kredit: Google Gemma 4 12B hampir sama mumpuni dengan versi dengan 26 miliar parameter. Kredit: Google Google mengatakan model baru ini mampu melakukan penalaran multilangkah yang kompleks dan alur kerja agen yang sebelumnya membutuhkan varian Gemma yang lebih besar. Meskipun jumlah parameternya lebih kecil, Gemma 4 12B hadir dengan perancang Multi-Token Prediction (MTP) yang baru, yang memanfaatkan siklus pemrosesan yang tidak terpakai untuk menghitung kemungkinan token di masa depan. Hasilnya adalah kecepatan dan efisiensi yang lebih besar. Google telah merilis versi MTP opsional dari model Gemma 4 lainnya, tetapi ini adalah model pertama yang memiliki MTP. Gemma 4 12B juga lebih efisien berkat pendekatan multimodalitas baru. Keluarga Gemma 4 pada dasarnya bersifat multimodal, menerima teks, audio, atau gambar sebagai masukan. Sebagian besar model AI generasi—termasuk varian Gemma 4 lainnya—menggunakan encoder khusus untuk memproses input non-teks dan meneruskan data tersebut ke LLM. Ini berfungsi cukup baik, tetapi meningkatkan latensi dan penggunaan memori. Dengan model kelas menengah yang baru, Google telah menerapkan modul penyematan yang disederhanakan untuk visi, yang menampilkan perkalian matriks tunggal dan penyematan posisi, yang memungkinkan data diteruskan ke LLM dengan kesadaran spasial yang tepat. Hal ini menghilangkan kebutuhan akan encoder perantara yang besar. Untuk audio, tidak ada coding sama sekali. Para pengembang mengembangkan metode memproyeksikan sinyal audio mentah ke dalam vektor yang sama yang digunakan untuk token teks. Jika Anda ingin melihat model Gemma 4 yang baru, model ini dapat diakses tanpa mengunduh melalui alat seperti LM Studio, Google AI Edge Gallery, dan banyak lagi. Namun inti dari Gemma 4 12B adalah Anda dapat menjalankannya secara lokal dan sesuai keinginan Anda sendiri. Jika Anda memiliki RAM, bobot model tersedia untuk diunduh segera di Kaggle dan Hugging Face. Hanya kurang dari 18GB.


Diterbitkan : 2026-06-03 19:10:00

sumber : arstechnica.com