Anthropic mengatakan 80% kode produksi barunya kini dibuat oleh Claude — bagaimana perusahaan Anda dapat mengimbanginya

Salah satu pendiri dan CEO Anthropic, Dario Amodei, mengatakan bahwa hal ini akan terjadi, namun hal ini tetap terasa seperti sebuah tonggak sejarah: Lebih dari 80% kode yang digabungkan ke dalam basis kode produksi Anthropic pada bulan Mei tidak dibuat oleh manusia, namun oleh model AI miliknya sendiri, Claude, menurut laporan baru yang dibagikan oleh startup AI pemecah rekor tersebut hari ini. Transformasi ini telah memicu peningkatan 8x dalam volume kode yang dikirimkan per teknisi per kuartal dibandingkan dengan yang dilakukan perusahaan pada tahun 2021–2025. baseline, yang menurut catatan perusahaan berarti semakin banyak kode yang harus ditinjau oleh seseorang atau sesuatu. Bagi para pemimpin teknis perusahaan, ini bukan lagi keingintahuan penelitian lokal; ini adalah dasar persaingan yang baru dan agresif. Jika laboratorium AI terdepan berhasil memindahkan sebagian besar hasil tekniknya ke agen otonom – yang menunjukkan tanda-tanda AI Holy Grail yang telah lama dicari yaitu “perbaikan diri secara rekursif,” model yang dapat melakukan penelitian dan peningkatan secara mandiri – apa yang juga menghalangi perusahaan di sektor lain untuk mengotomatiskan lebih banyak pengembangan perangkat lunak internal mereka dengan agen AI? Jelas sekali, ini lebih mudah diucapkan daripada dilakukan. Anthropic adalah salah satu pencipta utama booming AI generasi saat ini, jadi Anda pasti berharap mereka mengetahui cara menerapkan teknologi secara efektif. Namun bagi perusahaan lain yang ingin meningkatkan jumlah kode dan alur kerja yang ditangani oleh agen, postingan blog baru Anthropic merinci garis besar rencana umum yang juga dapat mereka terapkan untuk merekayasa ulang operasi dan alur kerja mereka guna memanfaatkan kemajuan AI terkini. Peta jalan Anthropic yang dapat diikuti oleh perusahaan lain Transisi dari pengkodean yang berpusat pada manusia ke orkestrasi otonom memerlukan pemahaman tentang evolusi kemampuan AI. Anthropic menguraikan rangkaian sejarah yang jelas yang dapat dipetakan oleh perusahaan ke dalam peta jalan transformasi digital mereka: 2021–2023 (Penulisan Manual): Para insinyur menulis kode dan dokumentasi secara asli dalam editor teks lokal. 2023–2025 (Bantuan Chatbot): Pengembang menggunakan model awal untuk menghasilkan cuplikan kode singkat, menyalin dan menempelkan keluaran secara manual ke lingkungan mereka. 2025–2026 (Agen Pengkodean): Agen yang mampu secara aktif menulis dan mengedit seluruh file secara mandiri. Saat Ini (Agen Otonom): Agen mengeksekusi kode secara independen, melakukan debug pada lingkungan langsung, dan mendelegasikan aliran kerja multi-jam ke sub-agen khusus. Evolusi yang cepat ini dibuktikan dengan tolok ukur eksternal. Kerangka kerja evaluasi rekayasa perangkat lunak seperti SWE-bench—yang menugaskan model untuk menyelesaikan laporan bug nyata dalam basis kode sumber terbuka yang kompleks—telah jenuh dalam jangka waktu dua tahun. Selain itu, evaluasi kemampuan jangka panjang menunjukkan bahwa model seperti Claude Opus 4.6 dapat secara andal mempertahankan operasi pada tugas-tugas 12 jam, sementara Pratinjau Claude Mythos melampaui 16 jam penyelesaian masalah terus-menerus. Secara internal, lompatan teknologi bahkan lebih parah lagi. Pada masalah teknik yang sangat kompleks dan terbuka dimana spesifikasi yang jelas pada awalnya tidak ada, tingkat keberhasilan Claude naik menjadi 76% pada Mei 2026 — peningkatan 50 poin dalam jangka waktu enam bulan. Dalam tolok ukur pengoptimalan yang terisolasi, di mana model ditugaskan untuk mempercepat kode pelatihan model AI, model Pratinjau Mythos internal Anthropic mencapai percepatan 52x. Sebagai perbandingan, pengembang manusia yang terampil biasanya memerlukan empat hingga delapan jam pemfaktoran ulang manual untuk mencapai kecepatan 4x saja pada basis kode yang sama. Rencana 3 langkah untuk menyelesaikan otomatisasi kode produksi Agar perusahaan dapat mereplikasi pencapaian 80 persen Anthropic, pengambil keputusan teknis harus meninggalkan model mental “asisten pengembang” dan beralih ke arsitektur “pabrik otomatis”. Pergeseran ini berdampak pada manajemen produk, operasi, dan alur kerja pengembang dalam tiga cara berbeda: 1. Pergeseran dari Eksekusi Kode ke Pengawasan Arsitektur Ketika biaya pembuatan kode mendekati nol dalam waktu manusia, peran teknik utama beralih dari menulis perangkat lunak ke menentukan tujuan dan meninjau keluaran. Para pemimpin perusahaan harus melatih kembali pengembang untuk bertindak sebagai arsitek dan penilai sistem. Seperti yang dikemukakan oleh salah satu karyawan Anthropic mengenai realitas operasional dari perubahan ini: “Bentuk yang ada saat ini kira-kira adalah ‘manusia mempunyai ide, dan model mampu mengimplementasikan, menguji, dan mengevaluasinya (dalam urutan besarnya) lebih cepat dari sebelumnya.'” 2. Mengatasi Kemacetan Tinjauan Kode Menyuntikkan kode yang dihasilkan AI dalam jumlah besar ke dalam organisasi pasti akan menciptakan gesekan operasional. Menurut hukum Amdahl, kecepatan proses apa pun sangat dibatasi oleh proses yang bersifat serial dan non-otomatis. kemacetan. Di Anthropic, membanjiri sistem dengan kode sintetis langsung mengubah tinjauan kode manusia menjadi hambatan kritis. Untuk mengatasi hal ini, tim perusahaan harus menerapkan peninjau kode AI otomatis langsung ke saluran Continuous Integration/Continuous Deployment (CI/CD) mereka. Anthropic mengimplementasikan peninjau Claude otomatis (versi yang dapat diakses publik, Claude Code Review diluncurkan untuk penggunaan komersial pada bulan Maret) yang bertugas menganalisis setiap permintaan penarikan untuk cacat arsitektur, kelemahan keamanan, dan bug regresi sebelum digabungkan. Perusahaan khusus lainnya seperti Qodo juga menawarkan alat yang dibuat khusus untuk tujuan ini. Dalam kasus Anthropic, analisis retrospektif menunjukkan bahwa lapisan otomatis menangkap sekitar sepertiga bug produksi yang bertanggung jawab atas penghentian historis di situs web utama claude.ai.3. Target Utang Operasional Bervolume TinggiPerusahaan sering kali dilumpuhkan oleh pemeliharaan kode lama dan utang teknis yang telah lama ditangguhkan. Daripada mengerahkan agen untuk menulis fitur baru yang spekulatif, pemimpin teknis harus mengarahkan agen otonom ke operasi pembersihan loop tertutup yang melelahkan. Pada bulan April 2026, seorang insinyur Anthropic mengerahkan Claude untuk mengatasi kesalahan API yang terus-menerus terjadi. Beroperasi secara mandiri, model ini mengirimkan lebih dari 800 perbaikan individual, dan berhasil mengurangi tingkat kesalahan hingga 1.000 kali lipat. Insinyur pengawas memperkirakan bahwa pengembang manusia akan menghabiskan empat tahun penuh untuk melaksanakan pekerjaan yang sama, karena beban kognitif yang menahan konteks kode yang sangat besar dan asing di kepala mereka secara bersamaan. Pertimbangan bagi perusahaan untuk bergerak maju di era yang sebagian besar kodenya dihasilkan oleh AI. Mengoperasikan basis kode yang sebagian besar dibuat oleh AI menimbulkan tantangan tata kelola unik yang harus dihadapi oleh tim hukum dan keamanan perusahaan. Berbeda dengan model lisensi sumber terbuka (seperti lisensi MIT yang permisif atau kerangka kerja GPL copyleft), basis kode perusahaan yang menggunakan infrastruktur LLM berpemilik tetap tunduk pada persyaratan layanan komersial dari masing-masing vendor AI. Penerapan agen otonom memerlukan protokol verifikasi yang ketat untuk memastikan kepatuhan, keamanan, dan perlindungan kekayaan intelektual: Kualitas dan Pemeliharaan Kode: Data internal Anthropic menunjukkan bahwa meskipun kode yang dibuat oleh AI secara obyektif memiliki kualitas yang lebih rendah dibandingkan keluaran manusia pada akhir tahun 2025, kode tersebut mencapai keseimbangan kasar pada pertengahan tahun 2026, dengan ekspektasi untuk melampaui standar manusia pada tahun tersebut. Tata kelola perusahaan harus beradaptasi dengan kenyataan di mana kualitas dasar keluaran otomatis secara struktural lebih unggul dibandingkan pengkodean manual rata-rata. Audit Keamanan dalam Skala Besar: Banyaknya volume pembuatan kode otomatis menuntut penemuan kerentanan otomatis. Project Glasswing dari Anthropic menggambarkan skala masalah ini: dengan memanfaatkan Mythos Preview, proyek ini mengidentifikasi lebih dari 10.000 kerentanan perangkat lunak dengan tingkat keparahan tinggi dan kritis di seluruh infrastruktur digital global dalam beberapa minggu pertama. Hal ini mengubah tantangan keamanan siber perusahaan sepenuhnya dari penemuan kerentanan menjadi kecepatan penerapan patch. Risiko Kaskade Penyelarasan: Pemimpin teknis harus menjaga gerbang verifikasi yang ketat. Jika suatu perusahaan menggunakan sistem AI untuk terus memodifikasi, memelihara, dan memperluas infrastruktur perangkat lunak miliknya, kesalahan yang tidak terdeteksi atau ketidakselarasan yang tidak kentara dapat bertambah seiring sesi agen yang berurutan, secara bertahap merusak integritas sistem atau menimbulkan eksploitasi keamanan yang luput dari perhatian manusia. Bersiap menghadapi gangguan budaya internal perusahaanTransisi ke basis kode yang didominasi AI mengubah dinamika budaya tim teknik, menimbulkan efisiensi yang belum pernah terjadi sebelumnya dan gesekan psikologis yang mendalam. Secara publik, Anthropic membingkai metrik ini sebagai pertanda transformasi yang lebih luas. Dalam pernyataan resmi mengenai X, perusahaan tersebut mengatakan: “Data internal kami menunjukkan bahwa Claude sedang mempercepat pengembangan AI—sebuah kemungkinan jalur menuju perbaikan diri secara rekursif, atau AI secara mandiri membangun penerus yang lebih mampu. Hal ini terjadi lebih cepat dari yang kami perkirakan, dan implikasinya memerlukan perhatian yang lebih besar.” Mereka memperluas implikasi produktivitas langsung segera setelahnya:”Saat ini, para insinyur Anthropic rata-rata mengirimkan 8x lebih banyak kode per kuartal dibandingkan dengan tahun 2021-2025… Banyak insinyur juga mengatakan bahwa kualitas kode Claude sekarang setara dengan kode manusia; kami memperkirakan akan lebih baik dalam tahun ini.” Di balik metrik perusahaan ini terdapat realitas kemanusiaan yang kompleks. Komunikasi internal karyawan mengungkapkan erosi nyata dari kolaborasi tradisional di tempat kerja, karena interaksi pengembang peer-to-peer secara sistematis digantikan oleh panggilan agen yang tidak sinkron: “Pekerjaan (dan kehidupan) berjalan berdasarkan ekonomi hadiah berupa bantuan kecil antar manusia. ‘Dapatkah Anda membantu saya menjalankan skrip ini?’ (…) masing-masing menciptakan sedikit hutang, sedikit kesadaran bersama. Claude telah memakan nikmatnya. Ini lebih cepat, tidak menimbulkan hutang, namun semua hal ini merupakan upaya yang sia-sia bagi kolaborasi manusia.” Bagi kontributor individu, otomatisasi total dari keahlian utama mereka menimbulkan kecemasan profesional yang akut mengenai relevansi dan kontrol sistemik:”Saya mulai mempelajari Claudifying sekitar setahun yang lalu. Itu merupakan petualangan yang gila dan sekarang sudah ~5 bulan sejak terakhir kali saya menulis kode apa pun.” “Pada hari-hari di mana segala sesuatunya berjalan dengan baik, mau tidak mau saya berpikir bahwa tidak ada yang saya lakukan yang berarti, semuanya serba otomatis dan lebih baik serta lebih cepat daripada sebelumnya. Namun kemudian ada hari-hari di mana segala sesuatunya rusak dan saya tidak mengerti mengapa dan saya menyadari bahwa saya tidak tahu lagi apa yang telah saya lakukan.” Para pemimpin perusahaan yang ingin menyamai kecepatan teknis Anthropic tidak boleh mengabaikan dinamika psikologis ini. Untuk mencapai 80 persen basis kode otomatis memerlukan lebih dari sekadar membeli token API atau mengonfigurasi loop agen; Hal ini memerlukan perombakan budaya secara total, strategi untuk mengurangi kekhawatiran akan keusangan pengembang, dan penerapan pagar pembatas verifikasi otomatis yang ketat untuk mempertahankan kendali penuh manusia atas tumpukan perangkat lunak.
Diterbitkan : 2026-06-04 20:25:00
sumber : venturebeat.com



