Mengajari Mario bermain dengan dirinya sendiri: AI, pembelajaran mesin, dan Super Mario Bros.

BenHickling

Salah satu aspek yang paling menantang dari kecerdasan buatan adalah mengajari komputer cara mengukur, memahami, dan bereaksi terhadap dunia sekitar kita. Tindakan yang merupakan sifat alami manusia harus dengan susah payah 'diajarkan' ke robot. Sebuah tim di University of Tubingen di Jerman telah menciptakan sebuah proyek yang mengubah konsep AI robot dunia nyata dengan mengatasi tantangan berbeda: mengajari Mario untuk memainkan permainannya sendiri.



Tim telah membuat video yang menjelaskan cara kerja sistem, langkah demi langkah, tetapi ringkasan utamanya adalah bahwa berbagai tindakan dan respons Mario semuanya dapat diukur sebagai nilai. AI tampaknya dimulai dengan informasi yang sangat mendasar tentang bagaimana menavigasi dunia dan di mana dia berada dalam kaitannya dengan berbagai objek lainnya. Tim tersebut juga menciptakan alat untuk melacak keingintahuan Mario tentang dunia (dia lebih menjelajahi lingkungannya saat ingin tahu) dan seberapa banyak dia fokus pada pengumpulan koin (diwakili oleh kelaparan).

Saat bertemu musuh, AI mencatat keberadaan mereka. Saat ditanyai dengan 'Apa yang Anda ketahui tentang Goomba?' Mario menjawab dengan 'Saya tidak tahu apa-apa tentang itu' Setelah interaksi eksperimental, Mario mengetahui bahwa dia dapat melompat atau mendarat di Goomba, dan bahwa Goomba mati ketika dia melakukannya.



MarioLearning



Ini, kemudian, diterjemahkan kembali ke dalam ucapan manusia: 'Jika saya melompat ke Goomba, maka dia pasti mati.' (Yang terakhir ini mungkin merupakan artefak dari terjemahan Jerman-Inggris dan struktur kalimat). Mario belajar cara menavigasi lingkungannya, cara melompat ke area yang lebih tinggi untuk mencapai lokasi yang tidak dapat diakses, dan cara memicu blok pertanyaan untuk mengambil power up atau item berguna lainnya. AI memiliki aturan yang berbeda mengenai apakah Mario kecil atau besar dan perilakunya dapat bervariasi tergantung pada apakah dia punya bunga api atau hanya jamur.

Prinsip referensi ulang

Bagaimana prinsip reafference bekerja dalam kehidupan nyata.

Slide di atas menjelaskan bagaimana AI belajar tentang lingkungannya. Mario memiliki ide tentang cara kerja dunia - pertama kali dia berhasil melompat ke Goomba, dia berkata 'Jika saya melompat ke Goomba, dia mungkin mati.' Dia kemudian menguji hipotesis ini pada Goombas di masa depan, membandingkan hasil yang diharapkan dengan hasil aktual.

Mario tidak menggunakan tanggapan yang diatur skrip - dia menanggapi sintaksis dan memahami banyak sekali kata dan frasa. Dia dapat diberi tahu hal-hal “Jika Anda melompat ke Goomba, Goomba mati,” atau dia dapat mempelajarinya sendiri. Pohon sintaks lengkapnya ditunjukkan di bawah ini:



Mario

Manusia, tentu saja, menerapkan prinsip-prinsip pembelajaran dan komunikasi ini ribuan kali sehari, tetapi kita mempelajarinya saat kita masih bayi. Mengajari Mario bahwa melompat di atas Goomba akan membunuhnya adalah contoh AI yang menarik, terutama karena Mario secara bersamaan mempelajari lompatan itu ke seorang Goomba akan melukai atau membunuh dirinya sendiri.

Proyek seperti ini mungkin suatu hari nanti bisa menjadi langkah yang berguna dalam melatih aturan kecerdasan buatan yang lebih maju tentang cara berinteraksi dengan manusia. Game yang dibangun dengan benar dapat mengajari AI aturan paling dasar untuk berinteraksi dengan lingkungannya terlebih dahulu, lalu memperkenalkan konsep dan ide yang lebih kompleks saat game berjalan. Game terbaik sudah menggunakan aturan semacam ini; banyak game akan melipat tutorial dasar tentang gerakan, serangan, dan berbagai kemampuan pemain ke dalam game itu sendiri, mengungkapkan opsi ini saat game berlangsung dan membuka kemampuan baru saat pemain menunjukkan penguasaan konsep sebelumnya. Video lengkap proyek tersebut di bawah ini:



Jika pemain dapat mempelajari aturan ini dalam lingkungan game yang relatif tetap dan sederhana, AI mungkin dapat mempelajarinya juga. Bahaya dan risiko AI telah banyak dieksplorasi akhir-akhir ini, dengan banyak ilmuwan menyerukan kehati-hatian dalam penelitian berkelanjutan kami. Mengajar Mario untuk memainkan permainannya sendiri tampaknya relatif jinak dibandingkan dengan risikonya gangguan sosial dan drone keamanan otonom .

Sekarang baca: IBM membuka era baru komputasi dengan chip seperti otak: 4096 core, 1 juta neuron, 5,4 miliar transistor

Kredit Gambar: Ben Hickling

Copyright © Seluruh Hak Cipta | 2007es.com