
Hanya sedikit orang yang bisa meramalkan bahwa video Will Smith yang salah dan salah saat mencoba makan spageti akan menjadi salah satu penanda sebelum dan sesudah yang paling penting dalam sejarah AI modern.
Klip asli tahun 2023 yang dibuat dengan ModelScope sangat buruk secara operasional. Wajah Smith melengkung di antara ekspresi yang tidak serasi, tangannya berubah menjadi pelengkap yang kenyal, dan mie tersebut melayang seolah-olah mereka bertindak berdasarkan kode gravitasinya yang aneh. ‘Will Smith memakan spageti’ menjadi semacam singkatan untuk tahap awal pembuatan video AI.
Klip tahun 2023 kini terasa seperti peninggalan, seperti yang ditampilkan orang-orang dalam film dokumenter tentang awal mula sebuah teknologi untuk menggambarkan masa remaja yang canggung. AI tidak dapat menjaga identitas Smith tetap stabil dari bingkai ke bingkai, dan video awal mengungkapkan batasan sebenarnya dari sistem teks-ke-video awal. Pada awal tahun 2024, meme tersebut telah berkembang pesat sehingga Smith sendiri ikut serta dalam lelucon tersebut, memposting TikTok di mana dia membesar-besarkan setiap gerakan saat dia makan spageti di kehidupan nyata.
Versi terbaru, menggunakan Kling 3.0, menampilkan seluruh adegan Smith sedang makan spageti dengan seorang anak dan bahkan bercakap-cakap, semuanya hanya dalam satu perintah.
Saya punya bioskop
Peningkatan dalam video AI muncul dengan cepat di video. Cara mata tetap sejajar, struktur wajah menjadi stabil, dan mangkuk berhenti berpindah antar bingkai. Spaghetti sebenarnya berperilaku seperti objek fisik pada saat kompilasi mencapai model terbarunya. Bahkan pencahayaan menjadi koheren.
Model awal mampu menghasilkan frame yang terlihat bagus jika terisolasi, namun tidak dapat mempertahankan karakter, pola gerakan, atau bahkan adegan sepanjang waktu. Kling 3.0 menjaga kesinambungan secara keseluruhan. Potongan video pendek tersebut terasa seperti milik realitas fisik yang sama dari awal hingga akhir.
Ini adalah demonstrasi singkat tentang bagaimana seluruh prioritas penelitian berubah. Yang pertama adalah konsistensi anatomi, lalu koherensi gerak, lalu resolusi yang lebih tinggi, lalu fisika realistis, lalu kemampuan model untuk mengikuti maksud emosional atau naratif dari sebuah perintah.
Pengujian spageti
Kepribadian itulah yang membuat meme spageti bertahan lama. Dan kepribadian, semacam itulah yang mulai ditangkap oleh model-model terbaru. Di klip awal, tidak ada apa pun di layar yang berperilaku sesuai keinginan. Pada akhirnya, Smith yang dihasilkan oleh AI tampaknya benar-benar melakukan suatu tindakan, seolah-olah dipandu oleh logika internal, bukan improvisasi frame-to-frame yang acak.
Pergeseran ini menandakan sesuatu yang penting untuk bidang video AI yang lebih luas. Ketika seorang model dapat mempertahankan karakternya melalui gerakan, ia membuka pintu untuk menampilkan tindakan manusia dengan cara yang sesuai dengan harapan kita.
Internet telah menghabiskan waktu bertahun-tahun untuk mengarsipkan absurditasnya sendiri, namun meme ini telah berkembang menjadi semacam tolok ukur. Jika suatu model dapat melakukan hal ini dengan meyakinkan, maka model tersebut beroperasi pada tingkat yang tidak dapat dibayangkan oleh sistem paling awal.
Ikuti TechRadar di Google Berita Dan tambahkan kami sebagai sumber pilihan untuk mendapatkan berita, ulasan, dan opini pakar kami di feed Anda. Pastikan untuk mengklik tombol Ikuti!
Dan tentu saja Anda juga bisa Ikuti TechRadar di TikTok untuk berita, review, unboxing dalam bentuk video, dan dapatkan update rutin dari kami Ada apa juga.



