Τα ανθρώπινα νήπια εμπνέουν νέες προσεγγίσεις στη μάθηση ρομπότ
Είναι μια συναρπαστική στιγμή για ρομποτική μάθηση. Οι οργανισμοί έχουν περάσει δεκαετίες δημιουργώντας σύνθετα σύνολα δεδομένων και πρωτοποριακά σε διαφορετικούς τρόπους για να διδάξουν συστήματα να εκτελούν νέες εργασίες. Φαίνεται ότι βρισκόμαστε στο κατώφλι ορισμένων πραγματικών ανακαλύψεων όσον αφορά την ανάπτυξη τεχνολογίας που μπορεί να προσαρμοστεί και να μάθει εν κινήσει.
Τον περασμένο χρόνο, είδαμε έναν μεγάλο αριθμό συναρπαστικών μελετών. Πάρτε το VRB (Vision-
Robotics
Bridge), το οποίο παρουσίασε το Πανεπιστήμιο Carnegie Mellon τον Ιούνιο. Το σύστημα είναι σε θέση να εφαρμόζει διδάγματα από βίντεο
YouTube
σε διαφορετικά περιβάλλοντα, έτσι ώστε ένας προγραμματιστής να μην χρειάζεται να λαμβάνει υπόψη κάθε πιθανή παραλλαγή.
Τον περασμένο μήνα, η ομάδα ρομποτικής DeepMind της
Google
έδειξε τη δική της εντυπωσιακή δουλειά, με τη μορφή του RT-2 (Robotic Transformer 2). Το σύστημα είναι σε θέση να αφαιρέσει τις λεπτομέρειες της εκτέλεσης μιας εργασίας. Στο παράδειγμα που δίνεται, το να πεις σε ένα ρομπότ να πετάξει ένα κομμάτι σκουπιδιών δεν απαιτεί από έναν προγραμματιστή να διδάξει στο ρομπότ να αναγνωρίζει συγκεκριμένα κομμάτια σκουπιδιών, να τα παίρνει και να τα πετάει για να κάνει μια φαινομενικά απλή (για τους ανθρώπους, τουλάχιστον) καθήκον.
Πρόσθετη έρευνα που επισημάνθηκε από την CMU αυτή την εβδομάδα συγκρίνει τη δουλειά της με την ανθρώπινη μάθηση σε πρώιμο στάδιο. Συγκεκριμένα, ο ρομποτικός πράκτορας AI συγκρίνεται με ένα τρίχρονο νήπιο. Βάζοντας το πλαίσιο, το επίπεδο μάθησης χωρίζεται σε δύο κατηγορίες — ενεργητική και παθητική μάθηση.
Η παθητική μάθηση σε αυτήν την περίπτωση διδάσκει ένα σύστημα να εκτελεί μια εργασία δείχνοντάς του βίντεο ή εκπαιδεύοντάς το στα προαναφερθέντα σύνολα δεδομένων. Η ενεργητική μάθηση είναι ακριβώς αυτό που ακούγεται — βγαίνετε έξω και εκτελείτε μια εργασία και προσαρμόζεστε μέχρι να το κάνετε σωστά.
RoboAgent
, που είναι μια κοινή προσπάθεια μεταξύ CMU και
Meta
AI (ναι, αυτό το Meta), συνδυάζει αυτούς τους δύο τύπους μάθησης, όπως θα έκανε ένας άνθρωπος. Εδώ αυτό σημαίνει παρατήρηση εργασιών που εκτελούνται μέσω του Διαδικτύου, σε συνδυασμό με ενεργή μάθηση μέσω τηλεχειρισμού του ρομπότ από απόσταση. Σύμφωνα με την ομάδα, το σύστημα είναι σε θέση να πάρει μαθήματα από ένα περιβάλλον και να τα εφαρμόσει σε ένα άλλο, παρόμοια με το σύστημα VRB που αναφέρθηκε παραπάνω.
«Ένας πράκτορας ικανός για αυτό το είδος μάθησης μάς φέρνει πιο κοντά σε ένα γενικό ρομπότ που μπορεί να ολοκληρώσει μια ποικιλία εργασιών σε διάφορες αόρατες ρυθμίσεις και να εξελίσσεται συνεχώς καθώς συγκεντρώνει περισσότερες εμπειρίες», λέει ο Shubham Tulsiani του Ινστιτούτου Ρομποτικής της CMU. «Το RoboAgent μπορεί να εκπαιδεύσει γρήγορα ένα ρομπότ χρησιμοποιώντας περιορισμένα δεδομένα εντός τομέα, ενώ βασίζεται κυρίως σε άφθονα διαθέσιμα δωρεάν δεδομένα από το Διαδίκτυο για να μάθει μια ποικιλία εργασιών. Αυτό θα μπορούσε να κάνει τα ρομπότ πιο χρήσιμα σε μη δομημένα περιβάλλοντα όπως σπίτια, νοσοκομεία και άλλους δημόσιους χώρους».
Ένα από τα πιο όμορφα κομμάτια όλων αυτών είναι το γεγονός ότι το σύνολο δεδομένων είναι ανοιχτού κώδικα και είναι καθολικά προσβάσιμο. Είναι επίσης σχεδιασμένο να χρησιμοποιείται με άμεσα διαθέσιμο, μη διαθέσιμο υλικό ρομποτικής, πράγμα που σημαίνει ότι οι ερευνητές και οι εταιρείες μπορούν να χρησιμοποιήσουν και να δημιουργήσουν έναν αυξανόμενο θησαυρό δεδομένων και δεξιοτήτων ρομπότ.
«Οι RoboAgents είναι ικανοί για πολύ πιο πλούσια πολυπλοκότητα δεξιοτήτων από ό,τι έχουν επιτύχει άλλοι», λέει ο Abhinav Gupta του Ινστιτούτου Ρομποτικής. «Έχουμε δείξει μεγαλύτερη ποικιλία δεξιοτήτων από οτιδήποτε έχει επιτευχθεί ποτέ από έναν μόνο ρομποτικό πράκτορα του πραγματικού κόσμου με αποτελεσματικότητα και μια κλίμακα γενίκευσης σε αόρατα σενάρια που είναι μοναδική».
Συντελεστές εικόνας:
CMU
Όλα αυτά είναι πολλά υποσχόμενα πράγματα όταν πρόκειται για την κατασκευή και την ανάπτυξη συστημάτων ρομποτικής πολλαπλών χρήσεων με βλέμμα στα ενδεχόμενα ρομπότ γενικής χρήσης. Ο στόχος είναι να δημιουργηθεί τεχνολογία που μπορεί να προχωρήσει πέρα από τις επαναλαμβανόμενες μηχανές σε εξαιρετικά δομημένα περιβάλλοντα που έχουμε την τάση να σκεφτόμαστε όταν σκεφτόμαστε τα βιομηχανικά ρομπότ. Η πραγματική χρήση και η κλιμάκωση είναι, φυσικά, πολύ πιο εύκολο να ειπωθεί παρά να γίνει.
Είμαστε πολύ πιο κοντά στην αρχή όσον αφορά αυτές τις προσεγγίσεις στη ρομποτική μάθηση, αλλά διανύουμε μια συναρπαστική περίοδο για τα αναδυόμενα συστήματα πολλαπλών χρήσεων.


