Pengembang papan atas beralih dari chatbot ke AI fisik. Inilah alasannya


Ilmuwan komputer Louis Castricato sedang mempelajari model bahasa besar pada tahun kedelapan—teknologi kecerdasan buatan di balik chatbot seperti ChatGPT dan Claude—ketika dia mulai merasa menemui jalan buntu. “Pada dasarnya kami telah melewati tahap melakukan penelitian LLM mendasar yang nyata,” kata Castricato. “Sekarang hanya sekedar aplikasi.” Peneliti tersebut berhenti dari studi doktoralnya di Brown University dan memulai sebuah perusahaan baru, bernama Overworld. Ambisinya ada pada namanya: AI yang dapat memahami dan menavigasi dunia, bukan hanya kata-kata. Masih banyak uang yang bisa dihasilkan dari chatbot AI—investor mengandalkannya karena mereka memberikan triliunan dolar kepada pengembang terkemuka seperti Anthropic dan OpenAI. Namun semakin banyak pengusaha AI yang mendedikasikan diri mereka pada apa yang mereka lihat sebagai terobosan berikutnya: “model dunia” yang mengajarkan sistem AI, dan terkadang robot, bagaimana bereaksi dalam lingkungan fisik. Mereka termasuk beberapa ilmuwan paling terkemuka di bidang ini, seperti “Ibu baptis AI” Fei-Fei Li, yang menggambarkan konsep model dunia sebagai “salah satu istilah paling penting dan paling banyak digunakan dalam AI saat ini.” Para ilmuwan menerapkan AI dalam dimensi baru dengan “model dunia”. Inti dari penelitian model dunia adalah gagasan bahwa AI tidak bisa benar-benar cerdas jika hanya bisa membaca buku. Ia juga perlu membaca ruangan. “Saat model bahasa mempelajari struktur statistik teks, model dunia mempelajari struktur statistik ruang dan waktu: bagaimana cahaya jatuh pada permukaan, bagaimana taman terlihat dari sudut yang tidak tertangkap kamera, bagaimana objek merespons gaya dan mengikuti hukum fisika,” tulis Li, pendiri startup World Labs di San Francisco, dalam esai yang diterbitkan bulan ini. Pendukung lainnya adalah pionir AI Yann LeCun, yang berhenti dari pekerjaannya sebagai kepala ilmuwan AI Meta tahun lalu untuk memulai Advanced Machine Intelligence yang berbasis di Paris Labs. “Model dunia dengan cepat menjadi kata kunci,” kata LeCun dalam podcast Unsupervised Learning baru-baru ini. Dia mengatakan bahwa dia memandangnya sebagai sesuatu yang memungkinkan agen AI “memprediksi konsekuensi dari tindakannya sendiri.” Ada banyak cara untuk mendefinisikan model dunia, sering kali didasarkan pada teknologi yang ingin dibangun oleh seseorang—baik itu robot atau video game yang lebih interaktif. Robot tidak bisa belajar banyak dari model AI yang dilatih di buku. Melatih semua buku kemanusiaan, artikel berita, dan media visual, seperti yang dilakukan model bahasa AI, telah menghasilkan asisten AI yang mengubah sifat pekerjaan berbasis kantor dan beberapa bidang kreatif. Namun beberapa pendukungnya melihat keterbatasan dalam model AI generatif yang bekerja dengan berulang kali memprediksi kata atau piksel berikutnya untuk menghasilkan dialog, gambar, atau baris kode baru. Chatbots tidak dapat mengambil cangkir kopi, catat Martial Hebert, dekan ilmu komputer di Universitas Carnegie Mellon. “Ada semua geometri dunia, dinamika cara saya menggerakkan tangan, interaksi fisik dari kontak dengan cangkir,” kata Hebert. Bagi ilmuwan seperti Hebert, yang telah menghabiskan lebih dari empat dekade meneliti robotika, penerapan yang paling berguna untuk model dunia adalah sebagai jalur yang lebih cepat dan lebih murah menuju “AI fisik”—sebuah istilah lain dalam industri teknologi. Beberapa kemajuan AI yang membuat chatbots sangat berguna juga dapat diterapkan untuk membangun AI dengan kesadaran yang cukup luas terhadap lingkungannya agar dapat bekerja seperti otak robot, katanya. “Dalam tubuh dan sumsum tulang belakang Anda, Anda memiliki model yang sangat umum tentang cara menyeimbangkan, cara berjalan, dan Anda dapat beradaptasi dengan nyeri lutut di pagi hari, jadi sekarang cara berjalan Anda sedikit berbeda,” katanya. “Anda tidak perlu memikirkan hal itu. Anda memiliki model umum di sistem saraf dan otak Anda yang memungkinkan tubuh Anda beradaptasi dengan sangat cepat.” Dunia simulasi menarik minat investor. Robot yang lebih cerdas bukan satu-satunya permainan akhir bagi model dunia. Castricato memulai Overworld tahun lalu dan startup kecil yang berbasis di Rhode Island kini membangun dunia video game di mana sebuah pemandangan, katakanlah, hutan yang menyeramkan, dapat beradaptasi ketika karakter virtual bergerak melewatinya dan berinteraksi dengan objek di dalamnya. “Tidak ada model dunia lain di mana Anda bisa berjalan melewati pintu atau berinteraksi dengan lingkungan mendetail seperti ini,” katanya dalam sebuah wawancara. “Kami mengoptimalkan interaksi di atas segalanya.” Meskipun penerapan jangka pendek tidak begitu terlihat seperti alat pengkodean AI, pembuat model dunia menarik minat pemodal ventura seperti Steve Jang, salah satu pendiri dan mitra pengelola di Kindred Ventures. Perusahaan ini berinvestasi di Overworld dan perusahaan lain yang berfokus pada model dunia, termasuk Causal Labs, yang membuat model AI untuk prediksi cuaca, dan Extropic, yang membuat chip komputer khusus yang sesuai dengan model dunia. “Saya pikir masa depan terdiri dari berbagai jenis model. dengan banyak filosofi dan arsitektur yang berbeda,” kata Jang. “Saya rasa tidak akan ada satu model yang besar dan padat yang akan mengatur semuanya.” Dalam esainya baru-baru ini, Li berusaha menciptakan “taksonomi model dunia” untuk membantu mengatasi kebingungan mengenai visi-visi yang saling bersaing. “Model video yang menghasilkan api yang indah namun secara fisik tidak mungkin, model bahasa yang mengimprovisasi permainan yang dapat dimainkan, dan mesin fisika yang dengan tepat mensimulasikan pembakaran, semuanya memiliki nama yang sama,” tulisnya. Dia membagi model dunia menjadi tiga kategori. Yang paling layak secara komersial saat ini adalah “renderer” yang memprioritaskan ketelitian visual dari dunia virtual yang mereka ciptakan namun tidak dapat dipercaya untuk mengajarkan banyak hal kepada robot. Lalu, ada “simulator” yang menciptakan tempat pelatihan virtual yang secara tepat mewakili struktur fisik sebuah dunia; dan “perencana” yang mencoba memprediksi apa yang harus dilakukan oleh agen atau robot AI di dunia yang tidak terstruktur. “Robot yang dapat merencanakan adalah robot yang dapat bekerja, dan seluruh industri berlomba untuk menjadi yang pertama mencapai tujuan tersebut,” tulisnya.—Oleh Matt O’Brien, penulis teknologi AP


Diterbitkan : 2026-06-25 18:19:00

sumber : www.fastcompany.com