"Jadi, sistem bisa belajar dari data secara otomatis dan juga otomatis mendeteksi ketika aturan tidak berlaku."
Fitur yang membantu sistem pemrograman itu adalah 3D Scene Percepetion via Probabilistic Programming (3DP3), dengan gambaran bahwa penglihatan komputer dianggap sebagai 'kebalikan' dari grafik komputer'. Fitur ini mengkodekan pengetahuan yang telah dipelajari sebelumnya tentang adegan 3D.
Misal, 3DP3 'tahu' bahwa adegan terdiri dari objek yang berbeda di depan, dan objek ini sering kali diletakkan sejajar di atas satu sama lain. Hal ini memungkinkan model untuk bernalar tentang suatu adegan yang lebih masuk akal terhadap objek.
Kemudian, untuk menganalisis gambar suatu adegan, 3DP3 jadi yang terlebih dulu mempelajari kumpulan objek itu, dari lima sudut yang berbeda. Lalu fitur itu memperkirakan volume yang akan ditempatinya di dalam satu ruang.
Baca Juga: Pencegahan Kepunahan Massal di Lautan Dengan AI, Robot, dan Printer 3D
"Jika saya menunjukkan sebuah objek dari lima perspektif yang berbeda, Anda dapat membangun gambaran yang cukup baik dari objek itu," ujar Gothoskar. "Anda akan memahami warna, bentuknya, dan Anda akan dapat mengenali objek itu dalam banyak adegan berbeda."
Para peneliti kemudian membandingkan model dengan 3DP3, dengan yang menggunakan sistem deep learning, untuk memperkirakan pose objek 3D dalam sebuah adegan. Hasilnya, modul dengan 3DP3 lebih akurat dan jauh lebih baik dari yang tidak, termasuk ketika objek 3D itu terhalang oleh objek lain.
Pada deep learning, model melihat objek seperti mangkuk di atas meja, tetapi pemfokusan mangkuk membuatnya terlihat melayang di atas meja. Hal itu tidak terjadi pada 3DP3, yang memahami adanya hubungan bersinggungan, dan dapat melihat 'melayang' adalah hal yang tidak masuk akal, sehingga dapat mengkoreksi dan menyelaraskan mangkuk tepat di atas meja.
Baca Juga: Merpati Bertenaga Uap Asal Yunani Kuno, Jadi Robot Pertama di Dunia
Penulis | : | Afkar Aristoteles Mukhaer |
Editor | : | Mahandis Yoanata Thamrin |
KOMENTAR