Η Google εκπαιδεύει ρομπότ με τον τρόπο που εκπαιδεύει τα chatbot AI

On

Ιούλ 29, 2023

Το RT-2 είναι η νέα έκδοση αυτού που η εταιρεία αποκαλεί το μοντέλο vision-language-action (VLA). Το μοντέλο διδάσκει στα ρομπότ να αναγνωρίζουν καλύτερα οπτικά και γλωσσικά μοτίβα για να ερμηνεύουν οδηγίες και να συμπεραίνουν ποια αντικείμενα λειτουργούν καλύτερα για το αίτημα.

Οι ερευνητές δοκίμασαν το RT-2 με έναν ρομποτικό βραχίονα σε ένα περιβάλλον γραφείου κουζίνας, ζητώντας από τον ρομποτικό του βραχίονα να αποφασίσει τι κάνει ένα καλό αυτοσχέδιο σφυρί (ήταν ένας βράχος) και να επιλέξει ένα ποτό για να δώσει σε ένα εξουθενωμένο άτομο (ένα Red Bull). Είπαν επίσης στο ρομπότ να μετακινήσει ένα κουτάκι κόκας σε μια φωτογραφία της Taylor Swift. Το ρομπότ είναι ένα Swiftie, και αυτό είναι καλά νέα για την ανθρωπότητα.

Το νέο μοντέλο εκπαιδεύεται σε δεδομένα ιστού και ρομποτικής, αξιοποιώντας την πρόοδο της έρευνας σε μεγάλα γλωσσικά μοντέλα όπως το Bard της Google και συνδυάζοντάς το με ρομποτικά δεδομένα (όπως ποιες αρθρώσεις πρέπει να κινούνται), είπε η εταιρεία

σε ένα χαρτί

. Κατανοεί επίσης οδηγίες σε άλλες γλώσσες εκτός από τα αγγλικά.

Για χρόνια, οι ερευνητές προσπάθησαν να εμποτίσουν τα ρομπότ με καλύτερα συμπεράσματα για την αντιμετώπιση προβλημάτων σχετικά με τον τρόπο ύπαρξης σε ένα πραγματικό περιβάλλον.

Το χείλος’

Ο Τζέιμς Βίνσεντ τόνισε ότι η πραγματική ζωή είναι ασυμβίβαστα ακατάστατη. Τα ρομπότ χρειάζονται περισσότερες οδηγίες για να κάνουν κάτι απλό για τους ανθρώπους. Για παράδειγμα, καθαρίζοντας ένα ποτό που χύθηκε. Οι άνθρωποι ξέρουν ενστικτωδώς τι πρέπει να κάνουν: να σηκώσουν το ποτήρι, να πάρουν κάτι για να λύσουν το χάος, να το πετάξουν έξω και να είσαι προσεκτικός την επόμενη φορά.

Προηγουμένως, η διδασκαλία ενός ρομπότ χρειαζόταν πολύ χρόνο. Οι ερευνητές έπρεπε να προγραμματίσουν ατομικά κατευθύνσεις. Αλλά με τη δύναμη των μοντέλων VLA όπως το RT-2, τα ρομπότ μπορούν να έχουν πρόσβαση σε ένα μεγαλύτερο σύνολο πληροφοριών για να συμπεράνουν τι πρέπει να κάνουν στη συνέχεια.

Η πρώτη επίθεση της Google σε εξυπνότερα ρομπότ ξεκίνησε πέρυσι όταν ανακοίνωσε ότι θα χρησιμοποιούσε το LLM PaLM της στη ρομποτική, δημιουργώντας το αδέξια ονομαζόμενο σύστημα PaLM-SayCan για να ενσωματώσει το LLM με τη φυσική ρομποτική.

Το νέο ρομπότ της Google δεν είναι τέλειο.

Οι Νιου Γιορκ Ταιμς

πρέπει να δω

μια ζωντανή επίδειξη του ρομπότ και ανέφερε ότι προσδιόρισε εσφαλμένα γεύσεις σόδας και αναγνώρισε εσφαλμένα τα φρούτα ως το λευκό χρώμα.

Ανάλογα με τον τύπο του ατόμου που είστε, αυτά τα νέα είναι είτε ευπρόσδεκτα είτε σας θυμίζουν τα τρομακτικά σκυλιά ρομπότ από

Μαύρος Καθρεφτής

(επηρεασμένος από τα ρομπότ της Boston Dynamics). Είτε έτσι είτε αλλιώς, θα πρέπει να περιμένουμε ένα ακόμα πιο έξυπνο ρομπότ το επόμενο έτος. Μπορεί ακόμη και να καθαρίσει μια διαρροή με ελάχιστες οδηγίες.

theverge.com