
- Claude lebih banyak digunakan oleh pengembang daripada layanan pelanggan, penjualan, keuangan, atau e-niaga
- Kini ia bekerja secara mandiri lebih dari sebelumnya, termasuk tugas-tugas kompleks
- Claude mengklarifikasi detail lebih dari yang diinterupsi manusia
Anthropic telah mengungkapkan sekitar setengah dari seluruh panggilan alat API Publik berasal dari rekayasa perangkat lunak, dengan sektor lain seperti layanan pelanggan, penjualan, keuangan, dan e-niaga masing-masing hanya menyumbang beberapa poin persentase.
Selain itu, Claude Code diketahui dapat bekerja secara mandiri lebih lama dibandingkan sebelumnya, kini lebih dari 45 menit dibandingkan dengan di bawah 25 menit pada tiga bulan lalu.
OpenAI mengatakan peningkatan otonomi tidak hanya berkaitan dengan model terbarunya yang berkinerja tinggi, namun juga menunjukkan peralihan yang lebih luas ke AI agen daripada uji coba model terbarunya.
AI Agentik telah hadir, dan ini paling umum dalam pengkodean
Di tempat yang baru postingan blogOpenAI menguraikan bagaimana pengguna mulai membangun kepercayaan terhadap AI seiring dengan semakin ambisiusnya tugas mereka, namun masih terdapat ‘deployment overhang’ yang menyebabkan model masih lebih mampu dibandingkan yang dimungkinkan oleh pengguna saat ini. Evaluasi eksternal juga membuktikan bahwa model dapat menangani tugas yang lebih lama dalam kondisi ideal.
Claude juga membantu dalam hal kepercayaan, lebih sering berhenti sejenak untuk mengajukan pertanyaan klarifikasi daripada manusia yang menyela.
Dalam hal pengkodean, nampaknya semakin kompleks tugasnya, semakin sedikit pengawasan manusia. Yang rumit seperti penemuan eksploitasi dan penulisan kompiler mengalami sekitar 67% pengawasan manusia, dibandingkan dengan 87% pengawasan pada tugas-tugas API sederhana.
Claude juga menanyakan pertanyaan dua kali lebih banyak tentang tugas dengan kompleksitas tinggi dibandingkan pertanyaan sederhana.
Ke depan, Anthropic membahas pentingnya model pelatihan untuk mengenali ketidakpastian dan secara proaktif mengajukan pertanyaan klarifikasi. Perusahaan juga tidak menganjurkan pemberian persetujuan manual untuk setiap tindakan, dengan alasan bahwa hal itu menambah gesekan tanpa perlu meningkatkan keselamatan.
Ikuti TechRadar di Google Berita Dan tambahkan kami sebagai sumber pilihan untuk mendapatkan berita, ulasan, dan opini pakar kami di feed Anda. Pastikan untuk mengklik tombol Ikuti!
Dan tentu saja Anda juga bisa Ikuti TechRadar di TikTok untuk berita, review, unboxing dalam bentuk video, dan dapatkan update rutin dari kami Ada apa juga.



