Η «στιγμή GPT» της ρομποτικής AI είναι κοντά
Δεν είναι μυστικό ότι τα βασικά μοντέλα έχουν μεταμορφώσει την τεχνητή νοημοσύνη στον ψηφιακό κόσμο. Τα μεγάλα γλωσσικά μοντέλα (LLM) όπως τα ChatGPT, LLaMA και Bard έφεραν επανάσταση στην τεχνητή νοημοσύνη για τη γλώσσα. Ενώ τα μοντέλα GPT του OpenAI δεν είναι το μόνο μεγάλο μοντέλο γλώσσας που είναι διαθέσιμο, έχουν επιτύχει την πιο mainstream αναγνώριση για τη λήψη εισαγωγών κειμένου και εικόνων και την παροχή ανθρώπινων απαντήσεων — ακόμη και με ορισμένες εργασίες που απαιτούν περίπλοκη επίλυση προβλημάτων και προηγμένη λογική.
Η ιογενής και ευρεία υιοθέτηση του ChatGPT έχει διαμορφώσει σε μεγάλο βαθμό τον τρόπο με τον οποίο η κοινωνία κατανοεί αυτή τη νέα στιγμή για την τεχνητή νοημοσύνη.
Η επόμενη πρόοδος που θα καθορίσει την τεχνητή νοημοσύνη για γενιές είναι η ρομποτική. Η κατασκευή ρομπότ με τεχνητή νοημοσύνη που μπορούν να μάθουν πώς να αλληλεπιδρούν με τον φυσικό κόσμο θα ενισχύσει όλες τις μορφές επαναλαμβανόμενης εργασίας σε τομείς που κυμαίνονται από την εφοδιαστική, τις
μεταφορές
και την κατασκευή έως τη λιανική, τη γεωργία και ακόμη και την υγειονομική περίθαλψη. Θα ξεκλειδώσει επίσης τόσες αποδόσεις στον φυσικό κόσμο όσες έχουμε δει στον ψηφιακό κόσμο τις τελευταίες δεκαετίες.
Ενώ υπάρχει ένα μοναδικό σύνολο προβλημάτων προς επίλυση στη ρομποτική σε σύγκριση με τη γλώσσα, υπάρχουν ομοιότητες στις βασικές θεμελιώδεις έννοιες. Και μερικά από τα πιο έξυπνα μυαλά στην τεχνητή νοημοσύνη έχουν σημειώσει σημαντική πρόοδο στην κατασκευή του «GPT για τη ρομποτική».
Τι επιτρέπει την επιτυχία του GPT;
Για να κατανοήσετε πώς να δημιουργήσετε το “GPT για ρομποτική”, πρώτα κοιτάξτε τους βασικούς πυλώνες που επέτρεψαν την επιτυχία LLM όπως το GPT.
Θεμελιακή προσέγγιση μοντέλου
Το GPT είναι ένα μοντέλο AI που εκπαιδεύεται σε ένα τεράστιο, ποικίλο σύνολο δεδομένων. Οι μηχανικοί συνέλεγαν στο παρελθόν δεδομένα και εκπαίδευσαν συγκεκριμένη τεχνητή νοημοσύνη για ένα συγκεκριμένο πρόβλημα. Τότε θα πρέπει να συλλέξουν νέα δεδομένα για να λύσουν ένα άλλο. Άλλο πρόβλημα; Νέα δεδομένα και πάλι. Τώρα, με μια προσέγγιση θεμελιώδους μοντέλου, συμβαίνει ακριβώς το αντίθετο.
Αντί της δημιουργίας εξειδικευμένων AI για κάθε περίπτωση χρήσης, μπορεί κανείς να χρησιμοποιηθεί καθολικά. Και αυτό το πολύ γενικό μοντέλο είναι πιο επιτυχημένο από κάθε εξειδικευμένο μοντέλο. Το AI σε ένα μοντέλο θεμελίωσης αποδίδει καλύτερα σε μια συγκεκριμένη εργασία. Μπορεί να αξιοποιήσει τις γνώσεις από άλλες εργασίες και να γενικεύσει καλύτερα σε νέες εργασίες, επειδή έχει μάθει πρόσθετες δεξιότητες από το να πρέπει να αποδίδει καλά σε ένα διαφορετικό σύνολο εργασιών.
Εκπαίδευση σε ένα μεγάλο, ιδιόκτητο και υψηλής ποιότητας σύνολο δεδομένων
Για να έχετε μια γενικευμένη τεχνητή νοημοσύνη, χρειάζεστε πρώτα πρόσβαση σε έναν τεράστιο όγκο διαφορετικών δεδομένων. Το OpenAI έλαβε τα δεδομένα του πραγματικού κόσμου που απαιτούνται για την εκπαίδευση των μοντέλων GPT λογικά αποτελεσματικά. Το GPT έχει εκπαιδευτεί σε δεδομένα που συλλέγονται από ολόκληρο το
Διαδίκτυο
με ένα μεγάλο και ποικίλο σύνολο δεδομένων, όπως βιβλία, άρθρα ειδήσεων, αναρτήσεις στα μέσα κοινωνικής δικτύωσης, κώδικας και άλλα.
Η κατασκευή ρομπότ με τεχνητή νοημοσύνη που μπορούν να μάθουν πώς να αλληλεπιδρούν με τον φυσικό κόσμο θα ενισχύσει όλες τις μορφές επαναλαμβανόμενης εργασίας.
Δεν είναι μόνο το μέγεθος του συνόλου δεδομένων που έχει σημασία. Η επιμέλεια δεδομένων υψηλής ποιότητας και υψηλής αξίας παίζει επίσης τεράστιο ρόλο. Τα μοντέλα GPT έχουν επιτύχει άνευ προηγουμένου απόδοση επειδή τα υψηλής ποιότητας σύνολα δεδομένων τους ενημερώνονται κυρίως από τις εργασίες για τις οποίες ενδιαφέρονται οι χρήστες και τις πιο χρήσιμες απαντήσεις.
Ο ρόλος της ενισχυτικής μάθησης (RL)
Το OpenAI χρησιμοποιεί ενισχυτική μάθηση από την ανθρώπινη ανατροφοδότηση (RLHF) για να ευθυγραμμίσει την απόκριση του μοντέλου με την ανθρώπινη προτίμηση (π.χ. τι θεωρείται ωφέλιμο για έναν χρήστη). Χρειάζεται να υπάρχει κάτι περισσότερο από καθαρή εποπτευόμενη μάθηση (SL) επειδή η SL μπορεί να προσεγγίσει ένα πρόβλημα μόνο με ένα σαφές μοτίβο ή ένα σύνολο παραδειγμάτων. Τα LLM απαιτούν από το AI να επιτύχει έναν στόχο χωρίς μια μοναδική, σωστή απάντηση. Εισαγάγετε το RLHF.
Το RLHF επιτρέπει στον αλγόριθμο να κινηθεί προς έναν στόχο μέσω δοκιμής και λάθους, ενώ ένας άνθρωπος αναγνωρίζει τις σωστές απαντήσεις (υψηλή ανταμοιβή) ή απορρίπτει τις λανθασμένες (χαμηλή ανταμοιβή). Το AI βρίσκει τη συνάρτηση ανταμοιβής που εξηγεί καλύτερα την ανθρώπινη προτίμηση και στη συνέχεια χρησιμοποιεί το RL για να μάθει πώς να φτάσει εκεί. Το ChatGPT μπορεί να προσφέρει απαντήσεις που αντικατοπτρίζουν ή υπερβαίνουν τις ικανότητες σε ανθρώπινο επίπεδο μαθαίνοντας από την ανθρώπινη ανατροφοδότηση.
Το επόμενο όριο των μοντέλων θεμελίωσης είναι η ρομποτική
Η ίδια βασική
τεχνολογία
που επιτρέπει στο GPT να βλέπει, να σκέφτεται, ακόμη και να μιλά, επιτρέπει επίσης στις μηχανές να βλέπουν, να σκέφτονται και να ενεργούν. Τα ρομπότ που τροφοδοτούνται από ένα μοντέλο θεμελίωσης μπορούν να κατανοήσουν το φυσικό τους περιβάλλον, να λάβουν τεκμηριωμένες αποφάσεις και να προσαρμόσουν τις ενέργειές τους στις μεταβαλλόμενες συνθήκες.
Το «GPT για τη ρομποτική» κατασκευάζεται με τον ίδιο τρόπο όπως το GPT — θέτοντας τις βάσεις για μια επανάσταση που θα επαναπροσδιορίσει, για άλλη μια φορά, την τεχνητή νοημοσύνη όπως την ξέρουμε.
Θεμελιακή προσέγγιση μοντέλου
Ακολουθώντας μια προσέγγιση βασικού μοντέλου, μπορείτε επίσης να δημιουργήσετε ένα AI που λειτουργεί σε πολλαπλές εργασίες στον φυσικό κόσμο. Πριν από μερικά χρόνια, οι ειδικοί συμβούλεψαν τη δημιουργία ενός εξειδικευμένου AI για ρομπότ που μαζεύουν και συσκευάζουν είδη παντοπωλείου. Και αυτό είναι διαφορετικό από ένα μοντέλο που μπορεί να ταξινομήσει διάφορα ηλεκτρικά μέρη, κάτι διαφορετικό από το μοντέλο που εκφορτώνει παλέτες από ένα φορτηγό.
Αυτή η μετατόπιση παραδείγματος σε ένα μοντέλο θεμελίωσης επιτρέπει στην τεχνητή νοημοσύνη να ανταποκρίνεται καλύτερα σε σενάρια αιχμής που υπάρχουν συχνά σε μη δομημένα περιβάλλοντα πραγματικού κόσμου και διαφορετικά θα μπορούσαν να παρακωλύσουν μοντέλα με στενότερη εκπαίδευση. Η δημιουργία ενός γενικευμένου AI για όλα αυτά τα σενάρια είναι πιο επιτυχημένη. Με την εκπαίδευση σε όλα αποκτάτε την αυτονομία σε ανθρώπινο επίπεδο που μας έλειπε από τις προηγούμενες γενιές ρομπότ.
Εκπαίδευση σε ένα μεγάλο, ιδιόκτητο και υψηλής ποιότητας σύνολο δεδομένων
Το να μάθεις ένα ρομπότ να μάθει ποιες ενέργειες οδηγούν στην επιτυχία και τι οδηγεί στην αποτυχία είναι εξαιρετικά δύσκολο. Απαιτεί εκτεταμένα δεδομένα υψηλής ποιότητας που βασίζονται σε πραγματικές φυσικές αλληλεπιδράσεις. Οι ρυθμίσεις μεμονωμένων εργαστηρίων ή τα παραδείγματα βίντεο είναι αναξιόπιστες ή αρκετά ισχυρές πηγές (π.χ. τα βίντεο του YouTube αποτυγχάνουν να μεταφράσουν τις λεπτομέρειες της φυσικής αλληλεπίδρασης και τα ακαδημαϊκά σύνολα δεδομένων τείνουν να είναι περιορισμένα σε εύρος).
Σε αντίθεση με την τεχνητή νοημοσύνη για τη γλώσσα ή την επεξεργασία εικόνας, κανένα προϋπάρχον σύνολο δεδομένων δεν αντιπροσωπεύει τον τρόπο με τον οποίο τα ρομπότ πρέπει να αλληλεπιδρούν με τον φυσικό κόσμο. Έτσι, το μεγάλο, υψηλής ποιότητας σύνολο δεδομένων γίνεται μια πιο περίπλοκη πρόκληση για επίλυση στη ρομποτική και η ανάπτυξη ενός στόλου ρομπότ στην παραγωγή είναι ο μόνος τρόπος για να δημιουργηθεί ένα διαφορετικό σύνολο δεδομένων.
Ο ρόλος της ενισχυτικής μάθησης
Παρόμοια με την απάντηση σε ερωτήσεις κειμένου με ικανότητα σε ανθρώπινο επίπεδο, ο ρομποτικός έλεγχος και η χειραγώγηση απαιτούν από έναν πράκτορα να αναζητήσει πρόοδο προς έναν στόχο που δεν έχει ενιαία, μοναδική, σωστή απάντηση (π.χ. “Ποιος είναι ένας επιτυχημένος τρόπος για να πάρει αυτό το κόκκινο κρεμμύδι;”) . Για άλλη μια φορά, απαιτείται κάτι περισσότερο από καθαρά εποπτευόμενη μάθηση.
Χρειάζεστε ένα ρομπότ που τρέχει βαθιά ενισχυτική μάθηση (deep RL) για να πετύχετε στη ρομποτική. Αυτή η αυτόνομη προσέγγιση αυτομάθησης συνδυάζει το RL με βαθιά νευρωνικά δίκτυα για να ξεκλειδώσει υψηλότερα επίπεδα απόδοσης — το AI θα προσαρμόσει αυτόματα τις στρατηγικές μάθησης και θα συνεχίσει να βελτιώνει τις δεξιότητές του καθώς βιώνει νέα σενάρια.
Έρχεται προκλητική, εκρηκτική ανάπτυξη
Τα τελευταία χρόνια, μερικοί από τους λαμπρότερους ειδικούς της τεχνητής νοημοσύνης και της ρομποτικής στον κόσμο έθεσαν τις τεχνικές και εμπορικές βάσεις για μια επανάσταση ρομποτικού μοντέλου θεμελίωσης που θα επαναπροσδιορίσει το
μέλλον
της τεχνητής νοημοσύνης.
Ενώ αυτά τα μοντέλα AI έχουν κατασκευαστεί παρόμοια με το GPT, η επίτευξη αυτονομίας σε ανθρώπινο επίπεδο στον φυσικό κόσμο είναι μια διαφορετική επιστημονική πρόκληση για δύο λόγους:
- Η κατασκευή ενός προϊόντος βασισμένου σε AI που μπορεί να εξυπηρετήσει μια ποικιλία πραγματικών ρυθμίσεων έχει ένα αξιοσημείωτο σύνολο πολύπλοκων φυσικών απαιτήσεων. Το AI πρέπει να προσαρμοστεί σε διαφορετικές εφαρμογές υλικού, καθώς είναι αμφίβολο ότι ένα υλικό θα λειτουργήσει σε διάφορους κλάδους (logistics, μεταφορές, μεταποίηση, λιανικό εμπόριο, γεωργία, υγειονομική περίθαλψη, κ.λπ.) και δραστηριότητες σε κάθε τομέα.
- Οι αποθήκες και τα κέντρα διανομής είναι ένα ιδανικό περιβάλλον μάθησης για μοντέλα τεχνητής νοημοσύνης στον φυσικό κόσμο. Είναι σύνηθες να υπάρχουν εκατοντάδες χιλιάδες ή και εκατομμύρια διαφορετικές μονάδες τήρησης αποθεμάτων (SKU) που ρέουν μέσω οποιασδήποτε εγκατάστασης ανά πάσα στιγμή — παρέχοντας το μεγάλο, ιδιόκτητο και υψηλής ποιότητας σύνολο δεδομένων που απαιτείται για την εκπαίδευση του “GPT για ρομποτική”.
Η “στιγμή GPT” ρομποτικής AI είναι κοντά
Η τροχιά ανάπτυξης των ρομποτικών μοντέλων θεμελίωσης επιταχύνεται με πολύ γρήγορο ρυθμό. Οι ρομποτικές εφαρμογές, ιδιαίτερα σε εργασίες που απαιτούν ακριβή χειρισμό αντικειμένων, εφαρμόζονται ήδη σε περιβάλλοντα παραγωγής πραγματικού κόσμου — και θα δούμε έναν εκθετικό αριθμό εμπορικά βιώσιμων ρομποτικών εφαρμογών που θα αναπτυχθούν σε κλίμακα το 2024.
Ο Chen έχει δημοσιεύσει περισσότερες από 30 ακαδημαϊκές εργασίες που έχουν εμφανιστεί στα κορυφαία παγκόσμια περιοδικά τεχνητής νοημοσύνης και μηχανικής μάθησης.
VIA:
techcrunch.com
