Qwen3.7-Plus dari Alibaba mendukung input teks, video, dan gambar dengan biaya rendah yaitu $0,4/$1,6 per 1 juta token — namun ini merupakan hak milik

Alibaba minggu ini meluncurkan Qwen3.7-Plus, model bahasa besar AI (LLM) terbaru dalam keluarga Qwen yang semakin populer dan semakin luas secara global, menawarkan lebih banyak kemampuan multimoda dan biaya 60% lebih rendah dibandingkan model Qwen3.7-Max yang hanya berisi teks sebelumnya yang dirilis beberapa minggu lalu. Namun, seperti pendahulunya, Qwen3.7-Plus hanya tersedia di bawah lisensi komersial “tertutup” melalui antarmuka pemrograman aplikasi (API) dan Qwen Chat. Hal ini menandai perubahan besar dari strategi Qwen hingga saat ini, yang fokus utamanya adalah merilis model open source yang kuat dan hampir canggih. Perusahaan dan pengguna yang mengandalkan model open source Qwen – di antaranya adalah raksasa AS seperti Airbnb – pasti akan kecewa melihat Alibaba ditutup untuk rilis terbarunya. Namun, model ini layak untuk dilihat karena biayanya yang rendah dan kinerja tinggi pada tugas multimodal seperti membuat visual tingkat perusahaan atau menganalisis video, citra, dan tangkapan layar, yang tidak dapat dilakukan oleh Qwen3.7-Max (hanya teks). Ini adalah salah satu model AI bertenaga yang lebih murah yang tersedia saat ini, dengan harga yang sedikit di atas harga diskon waktu terbatas MiniMax-M3 baru dari pesaingnya di Tiongkok. VentureBeat Frontier AI Model API Harga SnapshotModelInputOutputTotal CostSourceMiMo-V2.5 Flash$0,10$0,30$0,40Xiaomi MiModeepseek-v4-flash$0,14$0,28$0,42DeepSeekdeepseek-v4-pro$0,435$0,87$1,305DeepSeekMiniMax-M3$0,30$1,20$1,50MiniMaxQwen3.7-Plus$0,40$1,60$2,00Alibaba CloudGemini 3.1 Flash-Lite$0,25$1,50$1,75GoogleMiMo-V2.5$0,40$2,00$2,40Xiaomi MiMoGrok 4.3 rendah konteks$1.25$2.50$3.75xAIGLM-5$1.00$3.20$4.20Z.aiKimi-K2.6$0.95$4.00$4.95Moonshot/KimiGLM-5.1$1.40$4.40$5.80Z.aiGrok 4.3 tinggi konteks$2,50$5,00$7,50xAIQwen3,7-Maks$2,50$7,50$10,00Alibaba CloudGemini 3.5 Flash$1,50$9,00$10,50Pratinjau GoogleGemini 3.1 Pro ≤200K$2.00$12.00$14.00GoogleGPT-5.4$2.50$15.00$17.50OpenAIGemini 3.1 Pro Pratinjau >200K$4.00$18.00$22.00GoogleClaude Opus 4.8$5.00$25.00$30.00AnthropicGPT-5.5$5.00$30.00$35.00OpenAIMempertahankan kesinambungan selama putaran eksekusi alat yang kompleks Bagi pengambil keputusan teknis yang menerapkan agen otonom, hambatan utama jarang terjadi pada kecerdasan model awal. Sebaliknya, yang terjadi adalah pembusukan negara—kecenderungan kerangka kerja agen untuk kehilangan lintasan analitisnya pada tugas-tugas multi-langkah dan jangka panjang. Qwen3.7-Plus mengatasi kerentanan arsitektur ini melalui pendekatan gabungan terhadap manajemen konteks dan pelestarian keadaan. Model ini dikirimkan dengan jendela konteks 1 juta token dan mengalokasikan hingga 256 ribu token khusus untuk pemrosesan rantai pemikiran internal. Untuk mengontekstualisasikan kapasitas ini, bayangkan agen migrasi cloud otomatis: agen ini dapat menyerap seluruh basis kode, memetakan dependensi, dan menggunakan ribuan token secara diam-diam untuk mengevaluasi kasus-kasus edge sebelum mengeksekusi satu baris skrip bash. Yang terpenting, API mengekspos parameter yang disebut ‘preserve_thinking.’ Di seluruh ekosistem Alibaba, kemampuan ini berfungsi sebagai jembatan arsitektur terstandarisasi dan bukan sebagai fasilitas berjenjang. Alibaba memperkenalkan fitur ini pada generasi Qwen 3.6 sebelumnya, mengintegrasikannya ke dalam Qwen3.6-27B berbobot terbuka dan model Max yang dipatenkan. Pada intinya, parameter ini beroperasi pada tingkat API dan templat untuk mempertahankan blok internal di seluruh putaran percakapan yang berkelanjutan. Kontinuitas struktural ini memecahkan hambatan penting bagi pengembang yang merekayasa tugas-tugas jangka panjang. Dengan menjaga perulangan logika internal ini tetap utuh, fitur ini mencegah model menghilangkan konteksnya atau menghitung ulang riwayat cache yang tidak perlu di tengah-tengah operasi. Ketika sebuah model menjalankan tugas coding agenik yang kompleks dan multi-langkah, retensi ini memungkinkan sistem untuk mempertahankan alur pemikiran aslinya tanpa kehilangan plot atau melupakan logika yang mendasari tindakan sebelumnya. Alibaba tidak sendirian dalam menyadari kebutuhan teknis ini, karena konsep yang mendasarinya kini menentukan arsitektur hampir semua laboratorium kecerdasan buatan utama. Anthropic menerapkan kemampuan yang tepat ini di bawah julukan “Pemikiran Diperluas” untuk model-model canggihnya, termasuk Claude Opus 4.8 terbaru. Kerangka kerja ini mengharuskan pengembang untuk memasukkan blok pemikiran yang tidak dimodifikasi langsung kembali ke API pada giliran berikutnya untuk mempertahankan rantai pemikiran yang tidak terputus. OpenAI mengatasi tantangan yang sama melalui mekanisme pass-back penalaran terenkripsi untuk model seperti GPT-5.5. Dalam ekosistem OpenAI, pengembang harus mengembalikan item alasan spesifik yang dihasilkan bersamaan dengan pemanggilan fungsi sebelumnya, memastikan model secara eksplisit mengingat alasan di balik eksekusi alatnya. Pada akhirnya, preserve_thinking hanya mewakili terminologi Alibaba atas apa yang dengan cepat menjadi pertaruhan tak terbantahkan dalam penalaran multi-turn modern. Tolok ukur menunjukkan model yang kompetitif namun tidak canggih. Pada metrik kemampuan mentah, arsitektur pemikiran mendalam ini diterjemahkan menjadi keuntungan struktural di seluruh tolok ukur multimodal dan agen. Namun, angka tersebut masih berada di bawah banyak model milik Amerika generasi sebelumnya dan terkemuka seperti Claude Opus 4.6 dari Anthropic dan grafik perbandingan benchmark GPT-5.4.Qwen3.7-Plus dari OpenAI. Kredit: Alibaba QwenOn Terminal Bench 2.0-Terminus, yang mengukur kemampuan model untuk menjalankan kode tingkat terminal aktual dengan aman dan berulang, Qwen3.7-Plus mendapat skor 70,3, mengungguli DeepSeek-V4-Pro Max (67,9) dan Gemini-3.1 Pro (63,5). Pada tolok ukur visi komputer yang menuntut pemahaman antarmuka yang dilokalkan, seperti ScreenSpot Pro, model ini mencapai 79,0, secara signifikan melampaui standar industri lama seperti GPT-5.4 (xhigh) pada 67,4 dan Claude-Opus-4.6 pada 49,5. Metrik Evaluasi Agen (Tolok Ukur yang Dipilih)Untuk apa perusahaan sebaiknya mempertimbangkan Qwen3.7-Plus? Bagi seorang arsitek perusahaan, pertanyaan kunci saat menganalisis Qwen3.7-Plus sudah jelas: Apa yang akan digantikan oleh teknologi kami saat ini? Model ini dirancang untuk menggantikan model frontier premier (seperti model GPT-5-tier atau Claude-Max-tier) dalam alur kerja pengembang frekuensi tinggi, otomatisasi proses robotik (RPA), dan jalur rekayasa data. Daripada menerapkan model andalan yang mahal dan bertujuan umum untuk menangani operasi sistem yang berulang, tim teknis dapat mengarahkan tugas-tugas ini ke Qwen3.7-Plus. Ini menangani interpretasi antarmuka visual, eksekusi perintah, dan pembuatan kode secara bersamaan. Alibaba telah menyusun penyampaian API-nya agar selaras dengan kerangka kerja sumber terbuka dan kepemilikan perusahaan yang ada. Titik akhir sepenuhnya kompatibel dengan OpenAI, yang berarti menukar dependensi yang ada memerlukan sedikit penyesuaian infrastruktur. Untuk kelompok yang memanfaatkan kerangka kerja terminal otonom, integrasi ini didukung secara asli di berbagai lingkungan. Insinyur dapat menjalankan Qwen3.7-Plus langsung melalui pengaturan terminal lokal mereka dengan mengubah target lingkungan dasar. Dari perspektif biaya murni, menjalankan kerangka agen yang terus-menerus merujuk pada repositori kode besar atau riwayat tata letak visual dapat dengan cepat menjadi mahal. Alibaba mengatasi hal ini dengan memaparkan titik harga cache yang terperinci. Pemrosesan input standar bernilai $0,40 per juta token, namun jika agen membaca dari cache yang dibuat secara eksplisit (misalnya, repositori dasar besar atau kit UI perusahaan standar yang tetap statis selama ratusan loop otomatis), biayanya turun tajam menjadi $0,04 per 1 juta token untuk pembacaan selanjutnya. Tingkat ini membuat iterasi agen multi-putaran frekuensi tinggi menjadi praktis secara ekonomi pada skala perusahaan. Tidak ada lisensi sumber terbuka atau bobot terbuka yang menimbulkan pertanyaan kepatuhan bagi perusahaan Saat mengevaluasi model apa pun di ekosistem Qwen, perhatian utama tim hukum dan keamanan adalah kerangka perizinan dan batasan operasional saluran data. Meskipun iterasi keluarga Qwen sebelumnya memperoleh daya tarik perusahaan yang signifikan melalui ketersediaan bobot sumber terbuka sepenuhnya di bawah Apache 2.0 atau lisensi penggunaan terbuka yang disesuaikan, Qwen3.7-Plus dikirimkan secara ketat sebagai API cloud komersial yang dikelola melalui Alibaba Cloud Model Studio. Untuk manajemen risiko perusahaan, perbedaan ini membawa implikasi spesifik: Tidak Ada Penerapan Bobot Lokal: Organisasi tidak dapat mengunduh, melakukan sandbox, atau menghosting bobot Qwen3.7-Plus secara lokal di dalam pusat data internal mereka yang sepenuhnya memiliki celah udara. Semua verifikasi data, pemrosesan visual, dan panggilan eksekusi harus melalui titik akhir internasional Alibaba Cloud (misalnya, contoh Singapura yang disorot dalam dokumentasi pengembang). Kepatuhan dan Kedaulatan: Karena model ini memerlukan inferensi berbasis cloud, perusahaan yang beroperasi di bawah batasan data negara yang ketat (seperti entitas layanan kesehatan yang tunduk pada batasan HIPAA/GDPR lokal atau kontraktor pertahanan) harus secara eksplisit mengevaluasi apakah perutean API eksternal mematuhi kewajiban residensi data spesifik mereka. Mitigasi Risiko Terkelola: Sebaliknya, struktur API terkelola menghilangkan beban infrastruktur internal dalam penyediaan, pengoptimalan, dan pemeliharaan klaster multi-GPU (seperti susunan Nvidia H100 khusus) hanya untuk menghosting jaringan agen internal. Namun, Qwen3.7-Plus menawarkan kecerdasan tinggi di seluruh modalitas dengan biaya rendah. Penerimaan awal dari komunitas pengembang dan modal ventura teknis menyoroti pergeseran ekonomi dalam penerapan agen. Suara industri terkemuka dan pemodal ventura Web3 @Boxmining menyoroti keunggulan biaya strategis, dengan menyatakan:”Qwen 3.7 Plus 40% lebih murah daripada Max mengubah pembicaraan. Jika outputnya cukup dekat untuk sebagian besar pengkodean dan lebih kuat untuk alur kerja visual, apakah Anda benar-benar membutuhkan Max setiap hari atau hanya untuk pekerjaan berat yang hanya terminal?” Perspektif ini sejalan dengan tren pengoptimalan anggaran operasional perusahaan saat ini: beralih dari komputasi mentah dan tidak dibatasi ke otomatisasi tugas yang ditargetkan. Pada saat yang sama, peneliti khusus di dalam ekosistem menunjukkan bahwa ini bukan sekadar pengoptimalan pembuatan teks secara bertahap. Dunjie Lu, peneliti magang di Alibaba Qwen, mengatakan: “Ini menunjukkan peningkatan yang jelas dibandingkan Qwen3.6-Plus dalam kemampuan penggunaan komputer, dengan generalisasi yang lebih kuat di luar tugas desktop umum ke dalam alur kerja profesional seperti rekayasa data dan penelitian ilmiah.” Pada akhirnya, bagi pembeli perusahaan yang memutuskan peta jalan infrastruktur berikutnya, Qwen3.7-Plus menghadirkan alternatif praktis. Jika tujuan utama organisasi Anda adalah membangun loop perangkat lunak otonom yang tangguh dan berkemampuan visual yang berinteraksi langsung dengan lingkungan pengembang dan konsol cloud—tanpa menghabiskan anggaran inferensi Anda—model ini memberikan alasan kuat untuk mengalihkan eksekusi dari alternatif frontier yang lebih mahal.
Diterbitkan : 2026-06-02 22:40:00
sumber : venturebeat.com



