Universitas Kolombia

EMO, robot sinkronisasi bibir Columbia Engineering

Para peneliti di Universitas Columbia telah merancang robot yang mampu melakukan gerakan bibir secara realistis saat berbicara dan bernyanyi. Robot tersebut menggunakan kemampuannya untuk mengartikulasikan kata-kata dan bahkan menyanyikan lagu dari album debutnya yang dibuat oleh AI — namun masih berada di suatu tempat di “Lembah Luar Biasa”.

Penelitian sebelumnya menunjukkan bahwa kebanyakan orang fokus pada gerakan bibir selama percakapan tatap muka.

Namun, menciptakan robot yang dapat meniru gerakan bibir ini secara terus menerus merupakan sebuah tantangan, dan bahkan robot tercanggih yang saat ini ada di pasaran, ketika mereka berkomunikasi, paling banter hanya menghasilkan gerakan. seperti boneka.

Kini, tim peneliti dari Universitas Columbia yang dipimpin oleh Hod Lipson e Sally Scapamemproduksi robot yang bertujuan untuk mengatasi keterbatasan tersebut.

Pada tahap ini, kreasi tim masih terlihat benda mati, atau bahkan meresahkankarena ekspresi wajah mereka tidak sesuai dengan ekspektasi manusia, sehingga menimbulkan fenomena yang dikenal sebagai “Lembah Luar Biasa“, sesuatu seperti “Lembah Luar Biasa”, dalam terjemahan bebas — sedikit keanehan yang kita rasakan saat dihadapkan pada representasi manusia yang “Hampir sampai” tetapi belum sempurna.

Pekerjaan tim, dirinci dalam a belajar diterbitkan minggu lalu di majalah Robotika Sainsmengungkapkan bagaimana robotnya menggunakan keahliannya untuk mengartikulasikan kata-kata dalam berbagai bahasa dan bahkan menyanyikan sebuah lagu dari album debut mereka yang dihasilkan AI, “Halo Dunia“.

Di dalam Lembah Luar Biasa

Jadi apa sebenarnya Lembah Luar Biasa itu? “Itu dia perasaan aneh apa yang Anda miliki ketika Anda mengamati robot yang berusaha terlihat seperti manusiatetapi gagal dalam sesuatu yang penting”, Lipson menjelaskan kepada Pembahasan.

“Saya pikir begitu separuh masalahnya terletak pada gerakan bibirkarena separuh waktu manusia melakukan percakapan tatap muka, mereka menatap bibir lawan bicaranya,” kata Lipson.

“Hingga saat ini, robot tidak mempunyai bibirdan sebagian besar bahkan tidak memiliki wajah. Robot EMO kami Ini jauh dari sempurna, tapi saya pikir ini sedang dalam perjalanan untuk menyeberangi lembah yang aneh”, tambahnya.

Tidak seperti pendekatan tradisional, yang mengandalkan pemrograman kaku dan aturan yang telah ditentukan, robot tim Columbia belajar melalui observasiyaitu manusia yang sedang beraksi.

Awalnya, robot ini dirancang untuk berlatih di depan cermin, bereksperimen dengannya 26 otot wajah untuk membantu Anda “mempelajari” bagaimana wajah Anda bergerak.

Setelah terbiasa dengan ekspresinya sendiri, robot tersebut mengamati selama berjam-jam video manusia berbicara dan bernyanyibelajar tentang sinkronisasi dan koordinasi gerakan bibir yang tepat.

“Kami tidak memprogram mesinnya secara langsung, melainkan kami robot AI belajar seiring berjalannya waktu cara menggerakkan mesin dengan mengamati manusia lalu mengamati diri sendiri di cermin, dan membandingkannya,” jelas Lipson.

Setelah pelatihan ini, robot mendemonstrasikan kemampuan untuk menerjemahkan audio langsung dalam aksi motorik bibir yang tersinkronisasi.

Robot semakin berkembang seiring mereka berinteraksi dengan manusia“, jelas Lipson dalam a penyataan dari Columbia Engineering. “Pendekatan berbasis pembelajaran ini memungkinkan robot terus sempurnakan ekspresi Andasama seperti seorang anak belajar dengan mengamati dan meniru orang dewasa.”

“Motor wajah robot itu tersebar di bawah wajah robotdan dirancang untuk memungkinkan robot melakukan berbagai macam gerakan wajah, termasuk gerakan bibir, senyuman, dan gerakan lainnya,” tambah Lipson.

Untuk mencapai gerakan bibir seperti manusia ini, diperlukan “kulit” wajah yang fleksibel dan banyak mesin kecil mampu melakukan gerakan cepat dan senyap.

Pola rumit gerakan bibir ditentukan oleh bunyi vokal dan fonemsejenis koreografi yang digunakan manusia untuk melakukan gerakan-gerakan ini dengan mudah melalui puluhan otot wajah.

Dengan menggabungkan wajah yang sangat bermotor dengan model pembelajaran vision-to-action, robot Columbia mengatasi hambatan-hambatan tersebut: pertama mengeksplorasi ekspresi wajah acak, kemudian memperluas dan menyempurnakan kemampuannya mengamati manusia, membangun model itu menghubungkan isyarat pendengaran dengan gerakan motorik tepat.

Dalam kondisi saat ini, teknologi masih memerlukan beberapa perbaikanseperti yang ditunjukkan oleh tantangan yang dialami robot saat menghasilkan suara “B” dan “W”. Namun demikian, sistem ini telah membuat kemajuan besar melampaui kemampuan bicara robot lain yang saat ini ada di pasaran.

Ini adalah mata rantai yang hilang dalam robotika” kata Lipson. “Sebagian besar upaya dalam mengembangkan humanoids berfokus pada berjalan atau menggenggam, tetapi ekspresi wajah fokus pada hal tersebut penting untuk hubungan antarmanusia“.



Tautan sumber