• Gemini 3 Flash sering kali menciptakan jawaban alih-alih mengakui ketika ia tidak mengetahui sesuatu
  • Masalah timbul karena pertanyaan-pertanyaan faktual atau berisiko tinggi
  • Namun model ini masih diuji sebagai model AI yang paling akurat dan mumpuni

Gemini 3 Flash cepat dan pintar. Namun jika Anda menanyakan sesuatu yang sebenarnya tidak diketahuinya – sesuatu yang tidak jelas atau rumit atau di luar pelatihannya – ia hampir selalu mencoba untuk berbohong, menurut evaluasi terbaru dari kelompok pengujian independen Artificial Analysis.

Tampaknya Gemini 3 Flash mencapai 91% pada bagian “tingkat halusinasi” dari benchmark AA-Omniscience. Artinya ketika tidak ada jawabannya, ia tetap memberikan jawaban, hampir sepanjang waktu, jawaban yang seluruhnya fiktif.





Tautan sumber