Παρακολουθήστε τι συμβαίνει όταν η τεχνητή νοημοσύνη διδάσκει ένα ρομπότ να στροβιλίζει ένα στυλό

Οι ερευνητές εκπαιδεύουν ρομπότ για να εκτελούν έναν συνεχώς αυξανόμενο αριθμό εργασιών μέσω της μάθησης ενίσχυσης δοκιμών και σφαλμάτων, η οποία είναι συχνά επίπονη και χρονοβόρα. Για να βοηθήσουν, οι άνθρωποι επιστρατεύουν τώρα τεχνητή νοημοσύνη μεγάλου γλωσσικού μοντέλου για να επιταχύνουν τη διαδικασία

ς. Σε ένα πρόσφατο πείραμα, αυτό οδήγησε σε μερικά απίστευτα επιδέξια αν και προσομοιωμένα ρομπότ.

Μια ομάδα της NVIDIA Research οδήγησε ένα πρωτόκολλο AI που τροφοδοτείται από το

του OpenAI για να διδάξει σε μια προσομοίωση ενός ρομπο

κού χεριού σχεδόν 30 σύνθετες εργασίες, όπως το πέταγμα μιας μπάλας, το σπρώξιμο μπλοκ, το πάτημα των διακοπτών και μερικές σοβαρά εντυπωσιακές ικανότητες περιστροφής με στυλό.


[Related:


These AI-powered robot arms are delicate enough to pick up Pringles chips


.]


Ο νέος “AI agent” Eureka της NVIDIA χρησιμοποιεί το GPT-4

ζητώντας από το μοντέλο μεγάλων γλωσσών (LLM) να γράψει τον δικό του κώδικα λογισμικού ενίσχυσης εκμάθησης βάσει ανταμοιβής. Σύμφωνα με την εταιρεία, το Eureka δεν χρειάζεται περίπλοκες προτροπές ή ακόμη και προκαθορισμένα πρότυπα. Αντίθετα, απλά αρχίζει να ακονίζει ένα πρόγραμμα και μετά ακολουθεί οποιαδήποτε

κόλουθη εξωτερική ανθρώπινη ανατροφοδότηση.

Στο

ανακοίνωση της εταιρείας

, ο Linxi “Jim” Fan, ανώτερος ερευνητής στην NVIDIA, περιέγραψε το Eureka ως έναν “μοναδικό συνδυασμό” LLM και προγραμματισμού προσομοίωσης με επιτάχυνση GPU. «Πιστεύουμε ότι το Eureka θα επιτρέψει τον επιδέξιο έλεγχο ρομπότ και θα προσφέρει έναν νέο τρόπο παραγωγής φυσικώς ρεαλιστικών κινούμενων σχεδίων για καλλιτέχνες», πρόσθεσε ο Fan.

Κρίνοντας από το βίντεο επίδειξης της NVIDIA, ένα ρομποτικό χέρι εκπαιδευμένο στο Eureka μπορεί να κάνει κόλπα περιστροφής με στυλό για να ανταγωνιστεί, αν όχι να νικήσει, εξαιρετικά επιδέξιους ανθρώπους.

Αφού δοκιμάσει το πρωτόκολλο εκπαίδευσης σε ένα προηγμένο πρόγραμμα προσομοίωσης, το Eureka αναλύει τα δεδομένα που συλλέγει και κατευθύνει το LLM να βελτιώσει περαιτέρω τον σχεδιασμό του. Το τελικό αποτέλεσμα είναι ένα ουσιαστικά επαναλαμβανόμενο πρωτόκολλο τεχνητής νοημοσύνης ικανό να κωδικοποιεί με επιτυχία μια ποικιλία σχεδίων ρομποτικών χεριών για χειρισμό ψαλιδιών, στυλό στροβιλισμού και ανοιχτών ντουλαπιών σε ένα περιβάλλον προσομοίωσης με ακρίβεια φυσικής.

Οι εναλλακτικές λύσεις του Eureka στα ανθρώπινα γραπτά προγράμματα εκμάθησης δοκιμών και σφαλμάτων δεν είναι απλώς αποτελεσματικές – στις περισσότερες περιπτώσεις, είναι στην πραγματικότητα

καλύτερα

από αυτά που συντάχθηκαν από ανθρώπους. Στην ομάδα

ευρήματα ερευνητικών εγγράφων ανοιχτού κώδικα

τα προγράμματα ανταμοιβής που σχεδιάστηκαν από το Eureka ξεπέρασαν τον κώδικα των ανθρώπων σε πάνω από το 80 τοις εκατό των εργασιών – με μέση βελτίωση της απόδοσης πάνω από 50 τοις εκατό στις ρομποτικές προσομοιώσεις.


[Related:


How researchers trained a

robot dog to do tricks


.]

«Η ενισχυτική μάθηση επέτρεψε εντυπωσιακές νίκες την τελευταία δεκαετία, ωστόσο υπάρχουν ακόμα πολλές προκλήσεις, όπως ο σχεδιασμός ανταμοιβής, που παραμένει μια διαδικασία δοκιμής και λάθους», Anima Anandkumar, ανώτερη διευθύντρια έρευνας AI στην NVIDIA’s Senior Director of AI Research and ένας από τους συν-συγγραφείς της εφημερίδας Eureka, είπε στην ανακοίνωση της εταιρείας. «Το Eureka είναι ένα πρώτο βήμα προς την ανάπτυξη νέων αλγορίθμων που ενσωματώνουν παραγωγικές και ενισχυτικές μεθόδους μάθησης για την επίλυση σκληρών εργασιών».


VIA:

popsci.com


Leave A Reply



Cancel Reply

Your email address will not be published.