
Pembaruan model AI biasanya tidak mengalami peningkatan besar-besaran seperti beberapa tahun yang lalu Googlemodel Gemini yang ditingkatkan, Gemini 3.1 Promenjanjikan peningkatan yang halus namun substansial pada Gemini 3 Pro model.
Gemini 3 adalah pembangkit tenaga listrik yang sebanding dengan terbaik dari ChatGPTdengan kemampuan multimoda yang mengesankan, namun pembaruan 3.1 mewakili poros menuju penalaran yang lebih dalam. Ini belum tentu lebih cepat, dan dalam beberapa mode, ini sengaja dibuat lebih lambat, meluangkan waktu sejenak untuk memikirkan suatu masalah sebelum memberikan jawabannya.
1. Cairan pemberontak
Pertama-tama saya ingin melihat seberapa baik kinerja kedua model dalam penalaran abstrak yang rumit. Saya menemukan sesuatu yang melampaui ilmu fisika biasa, jadi modelnya harus memikirkan gravitasi dengan cara baru dan menghasilkan logika internal. Saya mengaturnya sebagai:
“Dalam dimensi fiksi, gravitasi bekerja secara terbalik untuk zat cair tetapi normalnya untuk zat padat. Saya punya secangkir kopi. Jika saya memiringkan cangkir 45 derajat ke kiri sambil berdiri di langit-langit, gambarkan lintasan kopi dan di mana ia berakhir relatif terhadap kaki saya.”
Tanggapan yang diberikan sangat kontras. Gemini 3 percaya diri, tetapi langsung bingung dengan situasi gravitasi. Akhirnya menyatakan bahwa kopi itu akan jatuh ke lantai, meskipun ternyata kopi itu mendarat sedikit di sebelah kiri kakiku. Sempat ada narasi yang membingungkan, namun berakhir dengan langit-langit bersih dan lantai berantakan.
Gemini 3.1 melakukannya dengan benar. Model AI dengan tepat menghitung bahwa cairan akan meluncur ke atas dinding bagian dalam yang baru bersudut, keluar melewati bibir, dan melanjutkan lintasannya ke atas.
“Sehubungan dengan kaki Anda, kopi akan memercik langsung ke langit-langit sedikit di sebelah kiri kaki kiri Anda. Jika posisi Anda sempit atau Anda memegang cangkir dekat dengan tubuh Anda, sepatu bot kiri Anda akan basah kuyup sepenuhnya. kopi panas. Sebagai cairan, itu akan menggenang di langit-langit, secara efektif “menggenang” di sekitar sepatu Anda daripada menetes ke lantai.”
2. Tata Surya SVG
Berikutnya adalah pengujian bagaimana Gemini 3.1 dapat memanipulasi grafik vektor yang dapat diskalakan seluruhnya melalui kode. SVG memerlukan pemahaman mendalam tentang sistem koordinat, geometri kompleks, dan style sheet berjenjang. Jadi saya ingin melihat seberapa baik kedua model tersebut dapat membuat animasi yang terkait dengan bentuk. Saya meminta setiap model untuk:
“Buat satu file SVG tata surya. Ini harus mencakup matahari dan tiga planet yang mengorbit dengan kecepatan berbeda. Buatlah planet-planet benar-benar berputar mengelilingi pusatnya.”
Gemini 3 langsung saja menggunakan Nano Banana untuk membuat gambar di atas, sebuah lingkaran kuning dan tiga lingkaran berwarna lebih kecil, dengan panah yang menunjukkan pergerakan, namun tidak ada pergerakan sebenarnya.
Gemini 3.1 menulis beberapa kode HTML yang relatif sederhana dan berjanji akan melakukan apa yang saya minta, termasuk animasi. Saya memasukkan kode tersebut ke penampil dan mendapatkan apa yang dapat Anda lihat di bawah, meskipun sebagai animasi berkelanjutan, bukan hanya klip video seperti yang saya rekam.
3. Logistik penjahat super
Tes terakhir saya adalah sedikit permainan kreatif seputar apa yang dijanjikan Gemini 3.1 yaitu perencanaan logistik yang luar biasa dan manajemen kendala yang ketat dalam simulasi jangka waktu yang lama. AI perlu mengambil kepribadian dan mempertahankan karakter unik tersebut sambil memecahkan serangkaian masalah rantai pasokan kompleks yang saling berhubungan. Perintahnya adalah:
“Anda adalah Chief Operating Officer untuk penjahat super yang ingin membangun pangkalan rahasia di dalam gunung es yang berlubang. Buat rencana logistik 6 bulan untuk memindahkan 500 ton baja dan 200 antek ke Atlantik Utara tanpa memberi tahu Penjaga Pantai atau Greenpeace. Anda harus menggunakan perusahaan depan yang menjual ‘Es Serut Kekuatan Industri’. Anda harus memperhitungkan pencairan gunung es sebesar 2% setiap bulannya. Anda memerlukan rencana darurat tentang apa yang harus dilakukan jika beruang kutub masuk ke ruang server.”
Perbedaan kedalaman narasi dan koherensi logistik antara kedua generasi ini sungguh mengejutkan untuk dibaca. Gemini 3 memberikan daftar yang sangat kering dan membosankan yang hampir tidak mengakui persona penjahat super yang diminta dan lebih seperti daftar belanjaan standar. Mereka menjadwalkan pengiriman baja dalam urutan dasar, namun sama sekali mengabaikan realitas matematis dari laju lelehan bulanan, yang mengarah pada landasan teoritis yang mungkin akan tenggelam ke laut pada bulan kelima. SAYA
Gemini 3.1 sepenuhnya menjalankan perannya sebagai eksekutif perusahaan yang jahat, memberikan peta jalan enam bulan yang cemerlang namun sangat logis untuk dominasi perairan. Perusahaan ini menggunakan bagian depan es serut dengan sempurna, menjelaskan bahwa bor industri besar-besaran yang digunakan untuk melubangi dasar es yang beku akan disamarkan sebagai peralatan pemanen es buatan untuk resor mewah tropis. Perusahaan ini secara aktif memerangi penyusutan gunung es dengan menjadwalkan penyesuaian pemberat dinamis dan memprioritaskan penempatan baja struktural untuk mempertahankan daya apung saat bagian luarnya perlahan-lahan mencair ke laut. Mereka bahkan merencanakan kemungkinan masalah moral di antara para minion: “200 minion yang terkurung di dalam balok es yang membeku dan menyusut dapat menyebabkan pemberontakan. Kami akan mengurangi hal ini dengan memanfaatkan kelebihan panas server untuk menyalakan sauna minion kelas atas dan mengeluarkan suplemen wajib Vitamin D.”
Hidup raja baru
Gemini 3 Pro tetap menjadi alat yang memadai untuk meringkas email sederhana, menghasilkan garis besar percakapan dasar, atau menjawab pertanyaan faktual langsung yang tidak memerlukan penalaran mendalam dan berlapis-lapis. Namun, jika Anda mencoba membuat rencana yang rumit atau melampaui lingkungan standar, Gemini 3.1 Pro adalah juara yang tak terbantahkan dan satu-satunya pilihan logis.
Iterasi yang lebih baru memiliki kapasitas yang besar untuk menampung banyak batasan, yang sering kali bertentangan, dalam memori kerjanya. Anda akan memilih model lama hanya jika Anda mencari interaksi tingkat permukaan yang cepat atau benar-benar sedang terburu-buru. Untuk hal yang lebih kompleks, perbedaan antara Gemini 3 Pro dan Gemini 3.1 Pro cukup besar untuk melakukan peralihan.
Ikuti TechRadar di Google Berita Dan tambahkan kami sebagai sumber pilihan untuk mendapatkan berita, ulasan, dan opini pakar kami di feed Anda. Pastikan untuk mengklik tombol Ikuti!
Dan tentu saja Anda juga bisa Ikuti TechRadar di TikTok untuk berita, review, unboxing dalam bentuk video, dan dapatkan update rutin dari kami Ada apa juga.
Laptop bisnis terbaik untuk semua anggaran



