Αυτό το AI χρησιμοποίησε το GPT-4 για να γίνει ένας ειδικός παίκτης Minecraft

Οι ερευνητές τεχνητής νοημοσύνης έχουν δημιουργήσει ένα ρομπότ Minecraft που μπορεί να εξερευνήσει και να επεκτείνει τις δυνατότητές του στον ανοιχτό κόσμο του παιχνιδιού — αλλά σε αντίθεση με άλλα ρομπότ, αυτό βασικά έγραψε τον δικό του κώδικα μέσω δοκιμής και λάθους και

πλήθος

των ερωτημάτων GPT-4.

Ονομάζεται Voyager, αυτό το πειραματικό σύστημα είναι ένα παράδειγμα ενός «ενσωματωμένου πράκτορα», ενός AI που μπορεί να κινείται και να ενεργεί ελεύθερα και σκόπιμα σε ένα προσομοιωμένο ή πραγματικό περιβάλλον. Τα τεχνητή νοημοσύνη και τα chatbot τύπου προσωπικού βοηθού δεν χρειάζεται να κάνουν πραγματικά πράγματα, πόσο μάλλον να περιηγηθούν σε έναν περίπλοκο κόσμο για να ολοκληρώσουν αυτά τα πράγματα. Αλλά αυτό ακριβώς αναμένεται να κάνει ένα οικιακό ρομπότ στο μέλλον, οπότε υπάρχουν πολλές έρευνες για το πώς θα μπορούσαν να το κάνουν αυτό.

Το Minecraft είναι ένα καλό μέρος για να δοκιμάσετε τέτοια πράγματα επειδή είναι μια πολύ (πολύ) προσεγγιστική αναπαράσταση του πραγματικού κόσμου, με απλούς και απλούς κανόνες και φυσική, αλλά και αρκετά περίπλοκη και ανοιχτή ώστε υπάρχουν πολλά να επιτύχετε ή να δοκιμάσετε. Οι προσομοιωτές που έχουν κατασκευαστεί για συγκεκριμένο σκοπό είναι επίσης υπέροχοι, αλλά έχουν τους δικούς τους περιορισμούς.


MineDojo

είναι ένα πλαίσιο προσομοίωσης που έχει δημιουργηθεί γύρω από το Minecraft, αφού δεν μπορείτε απλώς να βυθίσετε μια τυχαία τεχνητή νοημοσύνη εκεί και να περιμένετε να καταλάβει τι κάνουν όλα αυτά τα μπλοκ και τα γουρούνια. Οι δημιουργοί του (πολλές επικαλύψεις με την ομάδα του Voyager) συνέθεσαν βίντεο YouTube σχετικά με το παιχνίδι, μεταγραφές, άρθρα wiki και πολλές αναρτήσεις Reddit από το r/minecraft, μεταξύ άλλων δεδομένων, ώστε οι χρήστες να μπορούν να δημιουργήσουν ή να συντονίσουν ένα μοντέλο AI σε αυτους. Επιτρέπει επίσης σε αυτά τα μοντέλα να αξιολογηθούν περισσότερο ή λιγότερο αντικειμενικά βλέποντας πόσο καλά κάνουν πράγματα όπως να χτίσουν έναν φράχτη γύρω από ένα λάμα ή να βρουν και να εξορύξουν ένα διαμάντι.


Ταξιδιώτης

υπερέχει σε αυτές τις εργασίες, αποδίδοντας πολύ καλύτερα από το μόνο άλλο μοντέλο που πλησιάζει, το AutoGPT. Αλλά έχουν μια παρόμοια προσέγγιση: χρησιμοποιούν το GPT-4 για να γράφουν τον δικό τους κώδικα καθώς πηγαίνουν.

Κανονικά θα εκπαιδεύατε απλώς ένα μοντέλο σε όλα αυτά τα καλά δεδομένα του Minecraft και ελπίζετε ότι θα καταλάβαινε πώς να πολεμήσει τους σκελετούς όταν δύει ο ήλιος. Το Voyager, ωστόσο, ξεκινά σχετικά αφελές και καθώς συναντά πράγματα στο παιχνίδι, έχει μια μικρή εσωτερική συνομιλία με το GPT-4 για το τι πρέπει να κάνει και πώς.

Καθοδήγηση της επόμενης δράσης και προσθήκη δεξιοτήτων στο σωρό.

Για παράδειγμα, ας πούμε ότι πέφτει η νύχτα και αυτοί οι σκελετοί βγαίνουν. Ο πράκτορας έχει μια γενική ιδέα για αυτό, αλλά αναρωτιέται, τι θα έκανε ένας καλός παίκτης αυτού του παιχνιδιού όταν υπάρχουν τέρατα κοντά; Λοιπόν, το GPT-4 λέει, εάν θέλετε να εξερευνήσετε τον κόσμο με ασφάλεια, θα θελήσετε να φτιάξετε και να εξοπλίσετε ένα σπαθί και, στη συνέχεια, να χτυπήσετε τον σκελετό με αυτό αποφεύγοντας να χτυπήσετε. Και αυτή η γενική αίσθηση του τι πρέπει να κάνετε μεταφράζεται σε συγκεκριμένους στόχους: συλλέξτε πέτρα και ξύλο, φτιάξτε ένα σπαθί στο τραπέζι χειροτεχνίας, εξοπλίστε το και πολεμήστε έναν σκελετό.

Μόλις γίνουν αυτά τα πράγματα, εισάγονται σε μια βιβλιοθήκη γενικών δεξιοτήτων, έτσι ώστε αργότερα, όταν η εργασία είναι «να μπείτε βαθιά σε μια σπηλιά για να βρείτε σιδηρομετάλλευμα», δεν χρειάζεται να μάθει να παλεύει ξανά από την αρχή. Εξακολουθεί να χρησιμοποιεί GPT, αλλά το φθηνότερο και ταχύτερο GPT-3.5, το οποίο του λέει τις δεξιότητες που είναι πιο σχετικές με μια δεδομένη κατάσταση — επομένως δεν προσπαθεί να εξορύξει τον σκελετό και να καταπολεμήσει το μετάλλευμα.

Είναι παρόμοιο με έναν πράκτορα όπως το AutoGPT, όταν βρίσκεται αντιμέτωπος με μια διεπαφή που δεν γνωρίζει ακόμα, πρέπει να διδάξει τον εαυτό της να την περιηγείται για να πετύχει τον στόχο της. Αλλά το Minecraft είναι ένα πολύ βαθύτερο περιβάλλον από αυτό που έχει συνηθίσει να λύνει, επομένως ένας εξειδικευμένος πράκτορας όπως το Voyager τα καταφέρνει πολύ καλύτερα. Βρίσκει περισσότερα πράγματα, μαθαίνει περισσότερες δεξιότητες και εξερευνά μια πολύ μεγαλύτερη περιοχή από τα άλλα ρομπότ.

Είναι ενδιαφέρον, αν και ίσως δεν αποτελεί έκπληξη, το GPT-4 σκουπίζει το πάτωμα με GPT-3.5 (δηλ. ChatGPT) όταν πρόκειται για τη δημιουργία χρήσιμου κώδικα. Μια δοκιμή που αντικατέστησε το πρώτο με το δεύτερο είχε τον πράκτορα να χτυπήσει έναν τοίχο νωρίς, ίσως και κυριολεκτικά, και να αποτύχει να βελτιωθεί. Μπορεί να μην είναι προφανές όταν μιλάτε στα δύο μοντέλα ότι το ένα είναι πολύ πιο έξυπνο, αλλά η αλήθεια είναι ότι δεν χρειάζεται να είστε ιδιαίτερα έξυπνοι για να συνεχίσετε μια φαινομενικά έξυπνη συνομιλία (ρωτήστε με πώς ξέρω). Η κωδικοποίηση είναι πολύ πιο δύσκολη και το GPT-4 ήταν μια μεγάλη ενημέρωση εκεί.

Το θέμα αυτής της έρευνας δεν είναι να ξεπεραστούν οι παίκτες του Minecraft αλλά να βρεθούν μέθοδοι με τις οποίες τα σχετικά απλά μοντέλα τεχνητής νοημοσύνης μπορούν να βελτιώσουν τον εαυτό τους με βάση τις «εμπειρίες» τους, ελλείψει καλύτερης λέξης. Εάν πρόκειται να έχουμε ρομπότ που μας βοηθούν στα σπίτια, τα νοσοκομεία και τα γραφεία μας, θα πρέπει να μάθουν και να εφαρμόσουν αυτά τα μαθήματα σε μελλοντικές ενέργειες.


Μπορείτε να διαβάσετε περισσότερα για το Voyager εδώ.


techcrunch.com



You might also like


Leave A Reply



Cancel Reply

Your email address will not be published.