Mata Robot Kembangan MIT Ini Bisa Melihat dan Analisis Seperti Manusia

By Afkar Aristoteles Mukhaer, Kamis, 6 Januari 2022 | 07:00 WIB
Ilustrasi manusia dengan robot. Baru-baru ini para peneliti MIT mengembangkan mata robot yang lebih optimal dalam menafsirkan objek di depannya. Kemampuannya bahkan seperti mata manusia. (Live Science)

"Jadi, sistem bisa belajar dari data secara otomatis dan juga otomatis mendeteksi ketika aturan tidak berlaku."

Fitur yang membantu sistem pemrograman itu adalah 3D Scene Percepetion via Probabilistic Programming (3DP3), dengan gambaran bahwa penglihatan komputer dianggap sebagai 'kebalikan' dari grafik komputer'. Fitur ini mengkodekan pengetahuan yang telah dipelajari sebelumnya tentang adegan 3D.

Tiga rangkaian di atas adalah penampakan yang kita lihat dengan mata kita. Kemudian di baris kedua, cara robot memberikan prediksi pose objek tertentu yang kurang akurat. Sementara baris ketiga, dengan 3DP3, pose objek sesuai dengan input gambar. (Nishad Gothoskar et al/MIT)

Misal, 3DP3 'tahu' bahwa adegan terdiri dari objek yang berbeda di depan, dan objek ini sering kali diletakkan sejajar di atas satu sama lain. Hal ini memungkinkan model untuk bernalar tentang suatu adegan yang lebih masuk akal terhadap objek. 

Kemudian, untuk menganalisis gambar suatu adegan, 3DP3 jadi yang terlebih dulu mempelajari kumpulan objek itu, dari lima sudut yang berbeda. Lalu fitur itu memperkirakan volume yang akan ditempatinya di dalam satu ruang.

Baca Juga: Pencegahan Kepunahan Massal di Lautan Dengan AI, Robot, dan Printer 3D

"Jika saya menunjukkan sebuah objek dari lima perspektif yang berbeda, Anda dapat membangun gambaran yang cukup baik dari objek itu," ujar Gothoskar. "Anda akan memahami warna, bentuknya, dan Anda akan dapat mengenali objek itu dalam banyak adegan berbeda."

Para peneliti kemudian membandingkan model dengan 3DP3, dengan yang menggunakan sistem deep learning, untuk memperkirakan pose objek 3D dalam sebuah adegan. Hasilnya, modul dengan 3DP3 lebih akurat dan jauh lebih baik dari yang tidak, termasuk ketika objek 3D itu terhalang oleh objek lain.

Pada deep learning, model melihat objek seperti mangkuk di atas meja, tetapi pemfokusan mangkuk membuatnya terlihat melayang di atas meja. Hal itu tidak terjadi pada 3DP3, yang memahami adanya hubungan bersinggungan, dan dapat melihat 'melayang' adalah hal yang tidak masuk akal, sehingga dapat mengkoreksi dan menyelaraskan mangkuk tepat di atas meja.

Baca Juga: Merpati Bertenaga Uap Asal Yunani Kuno, Jadi Robot Pertama di Dunia