Ο αλγόριθμος χαμηλού κόστους μπορεί εύκολα να διδάξει δεξιότητες στα ρομπόντογκ

Ενώ τα δίποδα ανθρωποειδή ανδροειδή αποτελούν βασικό στοιχείο ταινιών επιστημονικής φαντασίας, για πολλές πιθανές εργασίες του πραγμα

κού κόσμου, όπως η διάσωση ανθρώπων από φλεγόμενα κτίρια, πλημμυρισμένους δρόμους ή παγωνιά, τα τετράποδα «ρομπόντογκ» είναι καλύτερα.

Σε μια νέα εφημερίδα

που πρόκειται να παρουσιαστεί στη Διάσκεψη για τη Μάθηση Ρομπότ (CoRL) τον επόμενο μήνα στην Ατλάντα, ερευνητές στο Πανεπιστήμιο του Στάνφορντ και το Ινστιτούτο Qi Zhi της Σαγκάης πρότειναν μια νέα, απλοποιημένη τεχνική μηχανικής

ς που τους επιτρέπει να εκπαιδεύσουν έναν αλγόριθμο βασισμένο στην όραση που επιτρέπει (σχετικά ) φθηνά ρομπότ εκτός ράφι για να σκαρφαλώνουν, να πηδούν, να σέρνονται και να τρέχουν στον πραγματικό κόσμο. Όπως υποστηρίζουν οι ερευνητές, μπορούν να κάνουν «παρκούρ» μόνοι τους.

Παραδοσιακά, η διδασκαλία ρομπότ για την πλοήγηση στον κόσμο ήταν μια δαπανηρή πρόκληση. Τα ρομπότ Atlas της Boston Dynamics μπορούν να χορεύουν, να πετούν πράγματα και να παρκάρουν σε περίπλοκα περιβάλλοντα, αλλά είναι το αποτέλεσμα έρευνας που χρηματοδοτείται από την DARPA για περισσότερο από μια δεκαετία. Όπως εξηγούν οι ερευνητές στο έγγραφο, «οι τεράστιες μηχανικές προσπάθειες που απαιτούνται για τη μοντελοποίηση του ρομπότ και των περιβαλλόντων του για προγνωστικό έλεγχο και το υψηλό κόστος υλικού εμποδίζουν τους ανθρώπους να αναπαράγουν συμπεριφορές parkour με λογικό προϋπολογισμό». Ωστόσο, οι πρόσφατες εξελίξεις στην τεχνητή νοημοσύνη έχουν δείξει ότι η εκπαίδευση ενός αλγόριθμου σε μια προσομοίωση υπολογιστή και στη συνέχεια η εγκατάστασή του σε ένα ρομπότ μπορεί να είναι οικονομικά αποδοτικός τρόπος για να τα εκπαιδεύσουμε να περπατούν, να ανεβαίνουν σκάλες και να μιμούνται ζώα, έτσι οι ερευνητές ξεκίνησαν να το ίδιο για το parkour σε υλικό χαμηλού κόστους.

Οι ερευνητές χρησιμοποίησαν ενισχυτική μάθηση δύο σταδίων για να εκπαιδεύσουν τον αλγόριθμο parkour. Στο πρώτο βήμα «μαλακής δυναμικής», τα εικονικά ρομπότ επετράπη να διεισδύσουν και να συγκρουστούν με τα προσομοιωμένα αντικείμενα, αλλά ενθαρρύνθηκαν —χρησιμοποιώντας έναν απλό μηχανισμό ανταμοιβής— να ελαχιστοποιήσουν τις διεισδύσεις καθώς και τη μηχανική

που απαιτείται για να καθαρίσουν κάθε εμπόδιο και να προχωρήσουν. Στα εικονικά ρομπότ δεν δόθηκαν οδηγίες – έπρεπε να βρουν πώς να προχωρήσουν καλύτερα για τον εαυτό τους, με τον οποίο ο

μαθαίνει τι κάνει και τι δεν λειτουργεί.

Στο δεύτερο στάδιο τελειοποίησης «σκληρής δυναμικής», χρησιμοποιήθηκε ο ίδιος μηχανισμός ανταμοιβής, αλλά τα ρομπότ δεν είχαν πλέον τη δυνατότητα να συγκρουστούν με εμπόδια. Και πάλι, τα εικονικά ρομπότ έπρεπε να καταλάβουν ποιες τεχνικές λειτουργούσαν καλύτερα για να προχωρήσουν, ελαχιστοποιώντας παράλληλα την ενεργειακή δαπάνη. Όλη αυτή η εκπαίδευση επέτρεψε στους ερευνητές να αναπτύξουν μια «πολιτική παρκούρ βασισμένη στην ενιαία όραση» για κάθε δεξιότητα που θα μπορούσε να αναπτυχθεί σε πραγματικά ρομπότ.

Και τα αποτελέσματα ήταν απίστευτα αποτελεσματικά. Παρόλο που η ομάδα εργαζόταν με μικρά ρομπότ που έχουν ύψος λίγο περισσότερο από 10 ίντσες, η σχετική τους απόδοση ήταν αρκετά εντυπωσιακή—ειδικά δεδομένου του απλού συστήματος ανταμοιβής και του εικονικού προγράμματος εκπαίδευσης. Τα off-the-shelf ρομπότ ήταν σε θέση να κλιμακώσουν αντικείμενα ύψους έως και 15,75 ιντσών (1,53 φορές το ύψος τους), να πηδήξουν πάνω από κενά πλάτους 23,6 ιντσών (1,5 φορές το μήκος τους), να σέρνονται κάτω από φράγματα τόσο χαμηλά όσο 7,9 ίντσες (0,76). x το ύψος τους) και γέρνουν έτσι ώστε να μπορούν να πιέζουν μέσα από κενά ένα κλάσμα της ίντσας στενότερα από το πλάτος τους.

Σύμφωνα με

μια συνέντευξη με τους ερευνητές στο Stanford News

, η μεγαλύτερη πρόοδος είναι ότι η νέα τεχνική εκπαίδευσης επιτρέπει στα ρομπόντογκ να ενεργούν αυτόνομα χρησιμοποιώντας μόνο τον ενσωματωμένο υπολογιστή και την κάμερά τους. Με άλλα λόγια, δεν υπάρχει άνθρωπος με τηλεχειριστήριο. Τα ρομπότ αξιολογούν το εμπόδιο που πρέπει να ξεπεράσουν, επιλέγουν την καταλληλότερη προσέγγιση από το ρεπερτόριο των δεξιοτήτων τους και την εκτελούν—και αν αποτύχουν, προσπαθούν ξανά.

Οι ερευνητές σημείωσαν ότι ο μεγαλύτερος περιορισμός με τη μέθοδο εκπαίδευσής τους είναι ότι τα προσομοιωμένα περιβάλλοντα πρέπει να σχεδιάζονται χειροκίνητα. Έτσι, στο

, η ομάδα ελπίζει να εξερευνήσει «τις προόδους στην τρισδιάστατη όραση και τα γραφικά για την κατασκευή διαφορετικών περιβαλλόντων προσομοίωσης αυτόματα από μεγάλης κλίμακας δεδομένα πραγματικού κόσμου». Αυτό θα μπορούσε να τους επιτρέψει να εκπαιδεύσουν ακόμη πιο τολμηρούς ρομπόντογκ.

Φυσικά, αυτή η ομάδα του Στάνφορντ δεν είναι η μόνη ερευνητική ομάδα που εξερευνά ρομπόντογκ. Τα τελευταία δύο χρόνια, είδαμε τετράποδα ρομπότ διαφορετικών σχημάτων και μεγεθών που μπορούν να ανοίγουν πόρτες, να σκαρφαλώνουν τοίχους και ταβάνια, να τρέχουν στην άμμο και να ισορροπούν κατά μήκος των δοκών. Αλλά παρ’ όλα αυτά, απέχουμε ακόμη λίγο από το να δούμε ρομπόντογκ διάσωσης στην άγρια ​​φύση. Φαίνεται ότι τα λαμπραντόρ δεν έχουν ακόμη φύγει από δουλειά.



https://www.popsci.com/


Leave A Reply



Cancel Reply

Your email address will not be published.