Video: Robot menguasai hoki udara, belajar mengalahkan manusia tanpa pernah menyentuh meja sebenarnya
Trio mahasiswa dari Universitas British Columbia telah menguji keahlian mereka dengan membangun meja hoki udara yang dikendalikan oleh kecerdasan buatan (AI) pemain tunggal. Ini cukup menarik, tetapi yang benar-benar menarik adalah AI berhasil belajar bermain murni dalam simulasi. Biasanya, robot yang dikendalikan AI seperti ini dilatih melalui trial and error di “dunia nyata” dengan mengalami kegagalan dan belajar dari ribuan latihan. Meskipun efektif, hal ini memakan waktu dan dapat merusak perangkat keras. Namun, tim UBC memutuskan untuk melihat apakah mereka dapat melatih AI di ruang digital, membuat kesalahan terlebih dahulu di sana, dan kemudian melepaskannya ke meja hoki udara sungguhan. Untuk mencapai tujuan ini, mereka membangun tabel kembaran digital yang sangat akurat untuk melatih AI. Setelah pelatihan selesai, mereka kemudian menyalin AI yang dilatih ke dalam robot sebenarnya untuk melihat kinerjanya melawan lawan manusia. Dan hasilnya sungguh mengejutkan. Terlepas dari pengalaman dunia nyata, pemain hoki udara robot yang dikendalikan AI mampu memberikan tantangan nyata. Semua ini seolah-olah “di luar kotak”. Ditempa secara digital untuk dunia nyata Yang juga menarik di sini adalah bahwa AI biasanya kesulitan mempelajari tugas-tugas seperti hoki udara. Hal ini karena puck, khususnya, bergerak sangat cepat, dapat bergerak tidak terduga, dan sangat dipengaruhi oleh perubahan halus dari interaksi dengan dayung dan dinding. Setiap pemain robot juga harus memperhitungkan jeda waktu dari motor, kamera, fluktuasi tegangan, getaran mekanis, dan pelacakan keping yang tidak sempurna. Jadi, kesalahan kecil sekalipun dapat mengakibatkan kesalahan perhitungan yang merugikan. Untuk mencapai tujuan ini, tim sengaja merancang lingkungan pelatihan AI agar tidak sempurna. Ini merupakan pengalihan dari sebagian besar skenario pelatihan, yang mungkin “terlalu sempurna”, namun di dunia nyata jelas tidak demikian. Jadi, tim memperhitungkan hal-hal seperti rel yang tidak rata, meja yang melengkung, pantulan yang tidak konsisten, penurunan pasokan daya, dan latensi kamera. Disebut “pengacakan domain”, hal ini memungkinkan AI untuk belajar mengantisipasi hal-hal yang tidak terduga dan bereaksi sebaik mungkin, seperti yang harus dilakukan oleh pemain manusia. Hal ini, jelas tim, mengajarkan AI untuk memprediksi serangkaian kemungkinan hasil dari pantulan keping, bukan hasil pasti berdasarkan algoritma tertentu. Jadi, AI belajar untuk mengharapkan keping berada pada perkiraan tempat di masa depan dan bereaksi sesuai dengan itu. Untuk mempercepat pelatihan, tim membuang gagasan untuk menggunakan mesin fisika normal seperti Unity dan Unreal dan beralih ke sesuatu yang disebut pelatihan “kritikus aktor lunak”. Singkatnya, ini adalah semacam lingkungan belajar yang berbasis wortel dan tongkat. Hoki udara adalah olahraga yang menghukum. Di dalamnya, AI mengambil tindakan dan mendapat hadiah atau hukuman berdasarkan kinerjanya. Dari jutaan game yang disimulasikan, AI menjadi semakin baik dalam memainkan game dan beradaptasi dengan semua kekacauan yang ada di dalam game. Saat diterapkan di dunia nyata, pemain AI juga memberikan bantuan menggunakan kamera overhead khusus dan keping berlapis pita retroreflektif. Hal ini membantu AI “melihat” keping dengan lebih jelas pada 120 frame per detik. Selain hoki udara, inovasi tim juga memiliki beberapa aplikasi potensial untuk melatih sistem otonom lainnya seperti drone, kendaraan, robot, dan lain-lain. Jika pelatihan platform ini dapat dipercepat dan dibuat lebih realistis, transfer sim-to-real yang serupa bisa menjadi keuntungan besar. Jika Anda ingin mempelajari lebih lanjut, detailnya tersedia di halaman resmi GitHub proyek.
Diterbitkan : 2026-06-07 11:44:00
sumber : interestingengineering.com



