Το μοντέλο RT-2 της Google βοηθά τα ρομπότ να εκτελούν πιο εύκολα ενέργειες σε νέες καταστάσεις
Google
έχει ανακοινώσει
ένα νέο μοντέλο όρασης γλώσσας δράσης (VLA) που ονομάζεται
Robotics
Transformer 2 (RT-2), το οποίο περιγράφει ως «πρώτο στο είδος του». Σύμφωνα με την Google, το RT-2 είναι σε θέση να πραγματοποιεί εισαγωγές κειμένου ή εικόνας και να εξάγει ρομποτικές ενέργειες.
Η εταιρεία είπε ότι τα εκπαιδευτικά ρομπότ μπορεί να είναι μια «ηρακλειακή προσπάθεια», επειδή χρειάζονται εκπαίδευση σε δισεκατομμύρια σημεία δεδομένων για κάθε αντικείμενο, περιβάλλον, εργασία και κατάσταση στον κόσμο. Με το RT-2, ωστόσο, η Google λέει ότι υπάρχει μια τεράστια υπόσχεση για περισσότερα ρομπότ γενικής χρήσης.
Ενώ η εταιρεία είναι ενθουσιασμένη με το τι μπορεί να ξεκλειδώσει το RT-2, είπε ότι πρέπει να γίνει πολλή δουλειά για να ενεργοποιηθούν τα χρήσιμα ρομπότ σε ανθρωποκεντρικά περιβάλλοντα. Στο τέλος,
σύμφωνα με το DeepMind
ένα φυσικό ρομπότ γενικής χρήσης θα μπορούσε να προκύψει από μοντέλα VLA και θα μπορούσαν να αιτιολογήσουν, να λύσουν προβλήματα και να ερμηνεύσουν πληροφορίες για την εκτέλεση εργασιών στον πραγματικό κόσμο.
Όπως υποδηλώνει το όνομα, αυτή δεν είναι η πρώτη επανάληψη του μοντέλου Robotics Transformer VLA. Η DeepMind είπε ότι το RT-2 βασίζεται στο έργο του RT-1 και δείχνει βελτιωμένες δυνατότητες γενίκευσης σε σύγκριση με προηγούμενα μοντέλα και αποδίδει καλύτερα σε νέες, αόρατες εργασίες.
Μια άλλη νέα δεξιότητα που το RT-2 ήταν ικανό σε σχέση με τους προκατόχους του είναι ο συμβολικός συλλογισμός που σημαίνει ότι μπορεί να κατανοήσει αφηρημένες έννοιες και να τις χειριστεί λογικά. Ένα παράδειγμα αυτού είναι όταν ζητήθηκε από το ρομπότ να μετακινήσει την μπάνα στο άθροισμα 2 συν 1 και εκτέλεσε σωστά την εργασία, παρόλο που δεν ήταν ρητά εκπαιδευμένο να κάνει αφηρημένα μαθηματικά ή συμβολικούς χειρισμούς.
Ενώ το RT-2 είναι ένα σημαντικό βήμα προς τα εμπρός για τη ρομποτική, δεν θα ήταν δίκαιο να δηλώσουμε ότι τα ρομπότ
Terminator
έχουν φτάσει. Το μοντέλο εξακολουθεί να απαιτεί ανθρώπινη συμβολή και επίβλεψη και αντιμετωπίζει σημαντικούς τεχνικούς περιορισμούς στις λειτουργίες ρομπότ στον πραγματικό κόσμο.
Με αυτά τα λόγια, ελπίζουμε ότι θα οδηγήσει σε μερικά ενδιαφέροντα ρομπότ που μπορούν να εκτελέσουν εργασίες που προηγουμένως δεν ήταν δυνατές ή εύκολο να γίνουν.


