Bobot terbuka Z.ai GLM-5.2 mengalahkan GPT-5.5 pada beberapa tolok ukur pengkodean cakrawala panjang dengan biaya 1/6

Hari ini, startup AI Tiongkok Z.ai (sebelumnya Zhipu AI) segera mengumumkan peluncuran GLM-5.2, model bahasa besar (LLM) berbobot terbuka dengan 753 miliar parameter yang dirancang khusus untuk mendominasi tugas-tugas pengkodean dan rekayasa otonom “cakrawala panjang”. Tersedia segera di Hugging Face, Z.ai API, dan lebih dari 20 lingkungan pengkodean pihak ketiga, model ini menawarkan jendela konteks 1 juta token yang sangat stabil bersama dengan tingkat langganan perusahaan mulai dari $12,60 per bulan. Sebagai kabar baik bagi bisnis yang sadar akan biaya dan keamanan, z.ai telah merilis bobot inti GLM-5.2 di bawah lisensi sumber terbuka MIT yang tidak terbatas, sehingga perusahaan dapat mengunduh model secara bebas dari Hugging Face, menyesuaikan atau menyempurnakannya sesuai keinginan mereka, dan menjalankannya secara lokal atau melalui mesin virtual hanya dengan biaya komputasi dan listrik. Ini adalah opsi yang semakin menarik bagi perusahaan, karena model kepemilikan Amerika yang canggih menghadapi masa depan peraturan yang tidak pasti dan berpotensi terganggu, menyusul kebijakan Trump Arahan kontrol ekspor pemerintah minggu lalu melarang warga negara asing menggunakan model baru Claude Fable 5 dari Anthropic (yang ditanggapi oleh perusahaan tersebut dengan membuat model tersebut sepenuhnya offline untuk semua pengguna). Bagi pengambil keputusan teknis di perusahaan, GLM-5.2 dari z.ai menyediakan jalur berkemampuan tinggi untuk menghosting AI tingkat terdepan secara lokal, sepenuhnya melewati batasan geografis dan komersial. IndexShare menggunakan kembali satu pengindeks untuk setiap empat lapisan perhatian yang jarang, sehingga mengurangi kebutuhan komputasi. Di balik itu, GLM-5.2 beroperasi dengan 753 miliar parameter dan memperkenalkan pengoptimalan arsitektur utama yang disebut “IndexShare”. Dalam model bahasa masif standar, menghitung ulang mekanisme perhatian pada dokumen yang panjang memerlukan biaya komputasi yang sangat tinggi. IndexShare memecahkan masalah ini dengan menggunakan kembali pengindeks yang sama di setiap empat lapisan perhatian yang jarang. Dengan panjang konteks maksimum 1 juta token, inovasi tunggal ini mengurangi FLOP komputasi per token sebanyak 2,9 kali lipat. Model ini juga dilengkapi lapisan Multi-Token Prediction (MTP) yang ditingkatkan untuk decoding spekulatif, yang meningkatkan panjang token yang diterima hingga 20% selama inferensi. Selain itu, Z.ai telah menerapkan “Mode Berpikir” yang fleksibel dan dapat dipilih. Pengguna dapat mengalihkan upaya penalaran model antara “Maks”, yang dirancang untuk mendorong batas pemecahan masalah logis, atau “Tinggi”, yang memberikan keseimbangan cermat antara kinerja kelas atas dan efisiensi token yang peka terhadap latensi. Tolok ukur canggih untuk model terbuka, dan pencocokannya, bahkan mengalahkan pemimpin kepemilikan dalam beberapa kategori Pada pengujian benchmark pihak ketiga standar industri, GLM-5.2 berkinerja di atas sebagian besar model andalan sumber terbuka, bahkan DeepSeek v4 dan mendapat skor mendekati atau di atas pesaingnya yang berbobot tertutup. GPT-5.5 OpenAI dan Claude Opus 4.8 dari Anthropic. Grafik batang perbandingan benchmark GLM-5.2. Kredit: z.aiModel ini sangat unggul dalam penggunaan alat agen dan tugas rekayasa perangkat lunak jangka panjang:SWE-bench Pro: GLM-5.2 mendapat skor 62,1, secara meyakinkan mengalahkan GPT-5.5 (58,6) dan pendahulunya sendiri, GLM-5.1 (58,4).FrontierSWE (Dominasi): Dirancang untuk menguji penyelesaian tugas jangka panjang, GLM-5.2 mencapai 74,4%, melampaui GPT-5.5 (72.6%) dan hampir setara dengan Claude Opus 4.8 (75.1%).Tolok ukur tugas jangka panjang GLM-5.2. Kredit: z.ai MCP-Atlas: Pada evaluasi penggunaan alat ini, GLM-5.2 memperoleh nilai 77,0, mengungguli GPT-5.5 (75,3) dan hanya sedikit tertinggal dari Claude Opus 4.8 (77,8). Ujian Terakhir Kemanusiaan (dengan Alat): Ketika dilengkapi dengan alat eksternal, GLM-5.2 mencapai skor 54,7, mengungguli GPT-5.5 (52.2) dan mengikuti di belakang Claude Opus 4.8 (57.9).PostTrainBench & SWE-Marathon: Dalam beban kerja teknik multi-jam yang diperpanjang, GLM-5.2 secara konsisten mengungguli GPT-5.5, dengan skor 34,3% dibandingkan 25,0% GPT-5,5 di PostTrainBench, dan 13,0% dibandingkan 12,0% GPT-5.5 di PostTrainBench SWE-Marathon. Meskipun GLM-5.2 tertinggal sedikit dari Claude Opus 4.8 dan GPT-5.5 pada skor mentah Terminal-Bench 2.1 (masing-masing 81,0 berbanding 85,0 dan 84,0), skor ini secara signifikan mengungguli Google Gemini 3.1 Pro (74,0). Di luar metrik pengkodean tradisional, GLM-5.2 menempati posisi pertama yang mengesankan pada tolok ukur tugas desain crowdsourcing Design Arena, bahkan mengalahkan Claude Fable 5 yang canggih dengan skor ELO 1360. Selain itu, dampak “mode berpikir” baru Z.ai yang dapat dipilih terlihat jelas dalam data: di bawah tingkat upaya “Maks”, GLM-5.2 mendorong ke kecerdasan puncak, tetapi menggunakan hampir 85 ribu token keluaran per tugas. Beralih ke pengaturan upaya “Tinggi” hanya mengorbankan beberapa poin dalam kinerja sekaligus secara efektif mengurangi separuh output token yang diperlukan, memberikan tuas pengoptimalan penting untuk aplikasi yang sensitif terhadap latensi. Tersedia melalui Coding Plans dan APIUntuk mengoperasionalkan model, Z.ai meluncurkan GLM Coding Plan, yang ditujukan langsung pada alur kerja pengembang daripada antarmuka obrolan sederhana. Paket ini menawarkan dukungan out-of-the-box untuk memanfaatkan dan alat pengkodean agen pihak ketiga AS dan global termasuk Claude Code, OpenClaw, Cline, Kilo Code, Crush, dan Factory, dan masih banyak lagi. Tingkat harga Coding Plan (bila ditagih setiap tahun) sangat kompetitif: Lite: $12,60 per bulan ($151,20 per tahun mulai tahun ke-2), ditujukan untuk iterasi ringan pada repositori kecil. Pro: $50,40 per bulan untuk pengembangan sehari-hari pada repositori berukuran sedang, menawarkan 5x tunjangan penggunaan paket Lite. Maks: $112,00 per bulan untuk beban kerja berat, menawarkan 20x Lite penggunaan dan sumber daya khusus selama jam sibuk. Bagi pengembang perusahaan yang mengintegrasikan model mentah ke dalam aplikasi mereka sendiri, harga API Z.ai jauh lebih rendah daripada pesaingnya di Barat, sekaligus menyamai harga yang sama dengan generasi GLM-5.1 sebelumnya. Akses API GLM-5.2 dihargai $1,40 per juta token masukan dan $4,40 per juta token keluaran, menjadikannya model dengan harga menengah secara global, tetapi diurutkan berdasarkan total biaya (masukan + keluaran) dari yang paling murah hingga yang paling mahal. Harga yang ditampilkan adalah harga standar bayar sesuai penggunaan per 1 juta token.ModelInputOutputTotal CostSourceMiMo-V2.5 Flash$0,10$0,30$0,40Xiaomi MiModeepseek-v4-flash$0,14$0,28$0,42DeepSeekdeepseek-v4-pro$0,435$0,87$1,305DeepSeekMiniMax-M3$0,30$1,20$1,50MiniMaxGemini 3.1 Flash-Lite$0,25$1,50$1,75GoogleQwen3.7-Plus$0,40$1,60$2,00Alibaba CloudMiMo-V2.5$0,40$2,00$2,40Xiaomi MiMoGrok 4.3 (konteks rendah)$1,25$2,50$3,75xAIMiMo-V2.5 Pro (≤256K)$1.00$3.00$4.00Xiaomi MiMoKimi-K2.6$0.95$4.00$4.95Moonshot/KimiGLM-5.2$1.40$4.40$5.80Z.aiGrok 4.3 (konteks tinggi)$2.50$5.00$7.50xAIMiMo-V2.5 Pro (>256K)$2,00$6,00$8,00Xiaomi MiMoQwen3.7-Max$2,50$7,50$10,00Alibaba CloudGemini 3.5 Flash$1,50$9,00$10,50Pratinjau GoogleGemini 3.1 Pro (≤200K)$2.00$12.00$14.00GoogleGPT-5.4$2.50$15.00$17.50OpenAIGemini 3.1 Pro Pratinjau (>200K)$4.00$18.00$22.00GoogleClaude Opus 4.8$5.00$25.00$30.00AnthropicGPT-5.5$5.00$30.00$35.00OpenAIClaude Fable 5 / Claude Mythos 5$10.00$50.00$60.00AnthropicUntuk lebih mengoptimalkan biaya untuk beban kerja konteks panjang, Z.ai menawarkan tingkat input cache hanya $0,26 per juta token, serta tawaran waktu terbatas untuk penyimpanan input cache gratis. Perbedaan mencolok antara inovator open-weight dan laboratorium milik Barat tidak luput dari perhatian komunitas pengembang. Di X, pengamat AI yang produktif, Lisan al Gaib (@scaling01) berpendapat bahwa “laboratorium perbatasan benar-benar menipu Anda mengenai harga API”. Posting tersebut mencatat bahwa meskipun model terbuka besar seperti GLM-5.2 dengan 744 miliar parameter mengenakan biaya $4,40 per juta token keluaran dan DeepSeek-V4-Pro (1,6 triliun parameter) hanya mengenakan biaya $0,87, model berpemilik menuntut premi yang besar: Sonnet 4.6 dan Opus 4.8 dari Anthropic masing-masing mengenakan biaya $15,00 dan $25,00, sedangkan GPT-5.5 OpenAI berharga $30,00 untuk keluaran. Menyoroti bahwa pengembang model terbuka beroperasi secara menguntungkan tanpa bergantung pada “chip Blackwell mewah” terbaru, komentator menyarankan bahwa laboratorium berpemilik terkemuka “mungkin memiliki margin 90%+ pada saat ini”. Keindahan Lisensi MIT yang tidak dimodifikasi untuk penggunaan perusahaan Aspek yang paling mengganggu dari rilis GLM-5.2 adalah perizinannya. Z.ai merilis bobot model di bawah lisensi sumber terbuka MIT, menjadikannya sebagai sistem “Terbuka Murni”. Dokumentasi teknis perusahaan secara eksplisit mencatat bahwa lisensi ini menjamin “tidak ada batasan regional” dan memungkinkan “akses teknis tanpa batas”. Bagi para pemimpin teknologi perusahaan, lisensi MIT berarti perangkat lunak dapat digunakan, dimodifikasi, dan dikomersialkan tanpa membayar royalti atau mematuhi kebijakan tata kelola “penggunaan yang dapat diterima” yang bersifat membatasi yang umum terjadi pada lisensi penggunaan ganda. Hal ini memungkinkan tim teknik untuk menghosting AI tingkat terdepan pada infrastruktur negara mereka sendiri, sehingga sepenuhnya menghilangkan vendor lock-in. Sambutan hangat di kalangan pengembang dan pembuat alat AIReaksi pengembang terhadap rilis ini sangat cepat dan sangat positif. Tim di balik Kilo Code mengonfirmasi integrasi hari pertama, dengan memposting di X: “GLM-5.2 berjalan di Kilo Code pada hari pertama. Jendela konteks 1M dan mode upaya Maks keduanya aktif. Arahkan konfigurasi Anda ke sana dan mulai!”. Lingkungan pengkodean sumber terbuka Cline IDE menggemakan sentimen ini di X, dengan mencatat keuntungan ekonominya: “GLM-5.2 adalah model bobot terbuka pertama yang melampaui 80% di Terminal-Bench, dan mengalahkan setiap model terbuka lainnya yang tersedia. Ia juga mengalahkan Gemini, menjadikannya model tingkat terdepan dengan biaya yang lebih murah. Bobot terbuka telah kembali. Model ini merupakan pengubah permainan. Kini tersedia di Cline!”. Demikian pula, agen desktop pengkodean sumber terbuka saingannya, Eigent AI, juga menguji kemampuan baru model tersebut pada alur kerja agen yang kompleks, dengan mencatat pada X: “melakukan tugas jangka panjang: meneliti 30 perusahaan di 6 sektor tumpukan infrastruktur AI, menyusunnya menjadi JSON, lalu membuat laporan HTML interaktif… 5.2 maju: -> rencana…”.
Diterbitkan : 2026-06-16 21:26:00
sumber : venturebeat.com


