Το RoboCat της DeepMind μαθαίνει να εκτελεί μια σειρά από εργασίες ρομποτικής

Η DeepMind λέει ότι έχει αναπτύξει ένα μοντέλο AI, που ονομάζεται RoboCat, το οποίο μπορεί να εκτελέσει μια σειρά εργασιών σε διαφορετικά μοντέλα ρομποτικών βραχιόνων. Αυτό από μόνο του δεν είναι ιδιαίτερα νέο. Αλλά η DeepMind ισχυρίζεται ότι το μοντέλο είναι το πρώτο που μπορεί να λύσει και να προσαρμοστεί σε πολλαπλές εργασίες και να το κάνει χρησιμοποιώντας διαφορετικά ρομπότ πραγματικού κόσμου.

«Δείχνουμε ότι ένα μεγάλο μοντέλο μπορεί να λύσει ένα διαφορετικό σύνολο εργασιών σε πολλαπλές πραγματικές ρομποτικές ενσωματώσεις και μπορεί γρήγορα να προσαρμοστεί σε νέες εργασίες και ενσωματώσεις», ο Alex Lee, ερευνητής στο DeepMind και συνεργάτης στην ομάδα πίσω από το RoboCat. είπε στο TechCrunch σε μια συνέντευξη μέσω email.

Το RoboCat – το οποίο εμπνεύστηκε από το Gato, ένα μοντέλο DeepMind AI που μπορεί να αναλύει και να ενεργεί σε κείμενο, εικόνες και γεγονότα – εκπαιδεύτηκε σε εικόνες και δεδομένα ενεργειών που συλλέχθηκαν από τη ρομποτική τόσο στην προσομοίωση όσο και στην πραγματική ζωή. Τα δεδομένα, λέει ο Lee, προήλθαν από έναν συνδυασμό άλλων μοντέλων ελέγχου ρομπότ μέσα σε εικονικά περιβάλλοντα, ανθρώπων που ελέγχουν ρομπότ και προηγούμενων επαναλήψεων του ίδιου του RoboCat.

Για να εκπαιδεύσουν το RoboCat, οι ερευνητές στο DeepMind συνέλεξαν αρχικά από 100 έως 1.000 επιδείξεις μιας εργασίας ή ενός ρομπότ χρησιμοποιώντας έναν ρομποτικό βραχίονα που ελέγχεται από έναν άνθρωπο. (Σκεφτείτε να έχετε έναν βραχίονα ρομπότ να μαζεύει γρανάζια ή να στοιβάζει μπλοκ.)

Στη συνέχεια, βελτίωσαν το RoboCat στην εργασία, δημιουργώντας ένα εξειδικευμένο μοντέλο «spin-off» που εξασκήθηκε στην εργασία κατά μέσο όρο 10.000 φορές.

Αξιοποιώντας τόσο τα δεδομένα που δημιουργούνται από τα spin-off μοντέλα όσο και τα δεδομένα επίδειξης, οι ερευνητές αύξησαν συνεχώς το σύνολο δεδομένων εκπαίδευσης του RoboCat — και εκπαίδευσαν τις επόμενες νέες εκδόσεις του RoboCat.

DeepMind RoboCat


Συντελεστές εικόνας:

DeepMind

Η τελική έκδοση του μοντέλου RoboCat εκπαιδεύτηκε σε συνολικά 253 εργασίες και αξιολογήθηκε σε ένα σύνολο 141 παραλλαγών αυτών των εργασιών, τόσο στην προσομοίωση όσο και στον πραγματικό κόσμο. Η DeepMind ισχυρίζεται ότι, μετά από παρατήρηση 1.000 ελεγχόμενων από τον άνθρωπο επιδείξεις που συλλέχθηκαν για αρκετές ώρες, η RoboCat έμαθε να χειρίζεται διαφορετικούς ρομποτικούς βραχίονες.

Ενώ το RoboCat είχε εκπαιδευτεί σε τέσσερα είδη ρομπότ με δύο βραχίονες, το μοντέλο ήταν σε θέση να προσαρμοστεί σε έναν πιο περίπλοκο βραχίονα με λαβή με τρία δάχτυλα και διπλάσιες ελεγχόμενες εισόδους.

Για να μην προκηρυχθεί το RoboCat ως το τέλος όλων των μοντέλων τεχνητής νοημοσύνης που ελέγχουν ρομπότ, το ποσοστό επιτυχίας του σε όλες τις εργασίες διέφερε δραστικά στις δοκιμές του DeepMind — από 13% στο χαμηλό έως 99% στο υψηλό επίπεδο. Αυτό συμβαίνει με 1.000 επιδείξεις στα δεδομένα εκπαίδευσης. Οι επιτυχίες ήταν αναμενόμενα λιγότερο συχνές με τις μισές διαδηλώσεις.

Ωστόσο, σε ορισμένα σενάρια, η DeepMind ισχυρίζεται ότι το RoboCat ήταν σε θέση να μάθει νέες εργασίες με μόλις 100 επιδείξεις.

Περαιτέρω, ο Lee πιστεύει ότι το RoboCat θα μπορούσε να προαναγγέλλει τη μείωση του φραγμού για την επίλυση νέων εργασιών στη ρομποτική.

«Με την παροχή περιορισμένου αριθμού επιδείξεων για μια νέα εργασία, το RoboCat μπορεί να προσαρμοστεί με ακρίβεια στις νέες εργασίες και με τη σειρά του να παράγει περισσότερα δεδομένα για να βελτιωθεί ακόμη περισσότερο», πρόσθεσε.

Στο εξής, η ερευνητική ομάδα στοχεύει να μειώσει τον αριθμό των επιδείξεων που απαιτούνται για να μάθει το RoboCat να ολοκληρώσει μια νέα εργασία σε λιγότερες από 10.


techcrunch.com



You might also like

Leave A Reply



Cancel Reply

Your email address will not be published.