Η ομάδα DeepMind της Google υπογραμμίζει το νέο σύστημα για τη διδασκαλία νέων εργασιών στα ρομπότ
Ένα από τα πρώτα πράγματα που ανακαλύπτεις στον κόσμο της ρομποτικής είναι η πολυπλοκότητα των απλών εργασιών. Τα πράγματα που φαίνονται απλά στους ανθρώπους έχουν δυνητικά άπειρες μεταβλητές που θεωρούμε δεδομένες. Τα ρομπότ δεν έχουν τέτοιες πολυτέλειες.
Αυτός είναι ακριβώς ο λόγος που μεγάλο μέρος της βιομηχανίας επικεντρώνεται σε επαναλαμβανόμενες εργασίες σε δομημένα περιβάλλοντα. Ευτυχώς, ο κόσμος της ρομποτικής μάθησης έχει δει κάποιες ανακαλύψεις που αλλάζουν το παιχνίδι τα τελευταία χρόνια και η βιομηχανία βρίσκεται σε καλό δρόμο για τη δημιουργία και την ανάπτυξη πιο προσαρμόσιμων συστημάτων.
Πέρυσι, η ομάδα ρομποτικής του Google DeepMind
παρουσίασε το Robotics Transformer — RT-1
— η οποία εκπαίδευσε τα καθημερινά συστήματα Robot της ώστε να εκτελούν εργασίες όπως η επιλογή και η τοποθέτηση και το άνοιγμα κληρώσεων. Το σύστημα βασίστηκε σε μια βάση δεδομένων με 130.000 επιδείξεις, που οδήγησε σε ποσοστό επιτυχίας 97% για «πάνω από 700» εργασίες, σύμφωνα με την ομάδα.
Συντελεστές εικόνας:
Google DeepMind
Σήμερα αποσύρεται από το RT-2. Σε
μια ανάρτηση ιστολογίου
ο διακεκριμένος επιστήμονας και επικεφαλής της ρομποτικής της DeepMind, Vincent Vanhoucke, λέει ότι το σύστημα επιτρέπει στα ρομπότ να μεταφέρουν αποτελεσματικά έννοιες που έχουν μάθει σε σχετικά μικρά σύνολα δεδομένων σε διαφορετικά σενάρια.
«Το RT-2 δείχνει βελτιωμένες δυνατότητες γενίκευσης και σημασιολογική και οπτική κατανόηση πέρα από τα ρομποτικά δεδομένα στα οποία εκτέθηκε», εξηγεί η Google. “Αυτό περιλαμβάνει την ερμηνεία νέων εντολών και την απόκριση στις εντολές των χρηστών εκτελώντας στοιχειώδεις συλλογισμούς, όπως συλλογισμούς σχετικά με κατηγορίες αντικειμένων ή περιγραφές υψηλού επιπέδου.” Το σύστημα επιδεικνύει αποτελεσματικά την ικανότητα να προσδιορίζει πράγματα όπως το καλύτερο εργαλείο για μια συγκεκριμένη νέα εργασία με βάση τις υπάρχουσες πληροφορίες συμφραζομένων.
Ο Vanhoucke αναφέρει ένα σενάριο στο οποίο ένα ρομπότ καλείται να πετάξει σκουπίδια. Σε πολλά μοντέλα, ο χρήστης πρέπει να διδάξει στο ρομπότ να αναγνωρίζει τι χαρακτηρίζεται ως σκουπίδια και στη συνέχεια να το εκπαιδεύσει να μαζεύει τα σκουπίδια και να τα πετάει. Είναι ένα επίπεδο λεπτομέρειας που δεν είναι ιδιαίτερα επεκτάσιμο για συστήματα που αναμένεται να εκτελούν μια σειρά διαφορετικών εργασιών.
«Επειδή το RT-2 είναι σε θέση να μεταφέρει γνώση από ένα μεγάλο σύνολο δεδομένων ιστού, έχει ήδη μια ιδέα για το τι είναι τα σκουπίδια και μπορεί να τα αναγνωρίσει χωρίς ρητή εκπαίδευση», γράφει ο Vanhoucke. «Έχει ακόμη και μια ιδέα για το πώς να πετάει τα σκουπίδια, παρόλο που δεν έχει εκπαιδευτεί ποτέ να κάνει αυτή τη δράση. Και σκεφτείτε την αφηρημένη φύση των σκουπιδιών – αυτό που ήταν μια σακούλα πατατάκια ή μια φλούδα μπανάνας γίνεται σκουπίδια αφού τα φάτε. Το RT-2 είναι σε θέση να το κατανοήσει αυτό από τα δεδομένα εκπαίδευσης γλώσσας όρασης και να κάνει τη δουλειά του».
Η ομάδα λέει ότι το ποσοστό αποτελεσματικότητας στην εκτέλεση νέων εργασιών έχει βελτιωθεί από 32% σε 62% στο άλμα από RT-1 σε RT-2.


