
Anda tahu bagaimana mereka berkata, “Ini bukan kompetisi!” Nah, jangan biarkan mereka berbohong kepada Anda; semuanya adalah kompetisi, terutama dalam hal AI. Jarang sekali saya tidak menguji kemampuan AI di antara beberapa chatbot, dan saya hampir selalu terkejut dengan hasilnya. Beberapa platform memang lebih baik dari yang lain – setidaknya untuk beberapa tugas.
Perjalanan ini dimulai dengan Catatan saya iPhone 17 Pro Maks. Biasanya saya suka merekam wawancara di smartphone Android seperti itu Google Pixel 10 Pro Lipat, di mana aplikasi Perekam yang luar biasa dengan ahli menangkap setiap ucapan dan, dalam transkripsi, melakukan pekerjaan yang cekatan dalam memisahkan dan memberi label pada setiap pembicara.
Gemini 3 Pro mengenakan sarung tangannya
Dalam beberapa bulan terakhir, saya sudah melakukannya terkesan dengan kemampuan Google Geminiterutama model 3 Pro terbaru, dan bagaimana model ini menangani hampir semua permintaan cepat dengan penuh percaya diri.
Sekarang setelah saya punya ide, saya harus memikirkan cara membuat Gemini mendengarkan rekamannya. Memutar ulang audio di speaker iPhone saya dan meminta Gemini untuk mendengarkan tidak dilakukan karena saya khawatir tentang seberapa baik, katakanlah, mikrofon desktop saya dapat menangkap suara yang keluar dari speaker iPhone. Ditambah lagi, saya berada di kantor dan tidak ingin orang lain mendengar percakapan pribadi tersebut (sampai saya menerbitkan sebuah cerita).
Pertama, saya menemukan bahwa Anda dapat mengunduh file audio dari Notes. Dalam pemutaran, di bawah tiga titik, ada tombol Bagikan yang memungkinkan saya mengirimkan file audio ke udara MacBook Pro 14 inci. Itu muncul sebagai file MPEG-4 (M4A).
Kembali masuk Gemini 3 Prosaya memilih tanda “+” di kolom prompt, memilih file audio M4A, dan menambahkan prompt singkat ini: “Dengarkan ini, transkripsikan dan pastikan untuk mengidentifikasi pembicara yang berbeda.”
Tidak ada bolak-balik. Germini 3 Pro dengan cepat mulai mengeluarkan transkrip lengkap dengan pembicara yang diidentifikasi sebagai “Pewawancara” dan nama serta judul subjek saya. Perlu dicatat di sini bahwa ini adalah satu hal yang secara misterius salah dilakukan oleh Gemini 3 Pro. Meski subjek saya menyebutkan namanya di akhir obrolan, Gemini memilih yang berbeda. Selain itu, Gemini dengan sempurna mengidentifikasi kapan itu adalah saya atau subjek yang berbicara. Dan keakuratannya sungguh mengesankan.
Demi kelengkapan, saya meminta Gemini 3 Pro untuk mengoreksi identifikasi subjek saya dan mencantumkan saya sebagai “pewawancara”. Setelah masalah itu diperbaiki, saya dengan senang hati menggunakan transkripnya untuk membantu mengarahkan cerita saya secara lengkap.
Di sudut ini, ChatGPT
Tentu saja saya penasaran apakah ChatGPT 5.1 (dengan akun Plus) dapat melakukan tugas yang sama.
Di jendela prompt ChatGPT, saya memilih file audio dan memasukkan prompt yang sama persis. ChatGPT memberitahuku, “Saya pasti bisa mentranskripsikan audio, tapi saya tidak bisa mengakses atau memutar file .m4a langsung dari lokasi yang Anda referensikan.”
Yang terjadi selanjutnya adalah percakapan panjang lebar di mana ChatGPT terus menyarankan berbagai cara bagi saya untuk mengunggah file, termasuk mengubahnya menjadi file zip. Apa pun yang saya lakukan, ChatGPT akan menampilkan file audio di jendela prompt, tetapi tidak dapat mendengarkannya.
Dalam kompetisi kecil ini, tampaknya Gemini 3 Pro adalah pemenangnya, mengubah masalah yang membuat frustasi menjadi kemenangan yang mudah. Semakin sedikit yang dikatakan tentang betapa tidak bergunanya ApelTranskrip Catatannya semakin baik.
Laptop bisnis terbaik untuk semua anggaran
Ikuti TechRadar di Google Berita Dan tambahkan kami sebagai sumber pilihan untuk mendapatkan berita, ulasan, dan opini pakar kami di feed Anda. Pastikan untuk mengklik tombol Ikuti!
Dan tentu saja Anda juga bisa Ikuti TechRadar di TikTok untuk berita, review, unboxing dalam bentuk video, dan dapatkan update rutin dari kami Ada apa juga.



