Επικοινωνία χρησιμοποιώντας μόνο τη σκέψη; Η Unbabel αποκαλύπτει έργο AI για να μας δώσει υπεράνθρωπες δυνατότητες
Καθισμένος σε μια συνάντηση
δωμάτιο σε ένα γραφείο εκκίνησης στη Λισαβόνα, πληκτρολόγησα σιωπηλά την απάντηση σε μια ερώτηση, μόνο που το άτομο απέναντι θα ήξερε την απάντηση. Τι είδους καφέ είχα ζητήσει όταν έφτασα στο γραφείο; Λίγη ώρα αργότερα, χωρίς καν να κουνηθεί ή να ανοίξει το στόμα του, η απάντηση επέστρεψε μέσω μηνύματος: «Είχες ένα Americano».
Δεν περίμενα έτσι να περάσω το απόγευμα της Παρασκευής στην πόλη, αλλά εδώ ήμουν, καθόμουν στα γραφεία της startup υπηρεσιών μετάφρασης γλωσσών για επιχειρήσεις
Unbabel
απέναντι από ιδρυτή και διευθύνοντα σύμβουλο
Βάσκο Πέδρο
, δοκιμάζοντας αυτό που φαινόταν να είναι μια διεπαφή εγκεφάλου προς υπολογιστή. Και ήταν αρκετά εκπληκτικό.
Η ιστορία ξεκινά πριν από τέσσερα χρόνια.
Η βασική αποστολή της Unbabel – το να επιτρέπει στις επιχειρήσεις να κατανοούν και να γίνονται κατανοητές από τους πελάτες τους σε δεκάδες γλώσσες – οδήγησε την εταιρεία εδώ και πολύ καιρό να σκεφτεί έξω από το παροιμιώδες «κουτί», να αναπτύξει αρκετά έργα εσωτερικά. Ήθελε να εξερευνήσει άλλους τρόπους επικοινωνίας. Τώρα, ως startup με 90 εκατομμύρια δολάρια σε χρηματοδότηση VC, ετήσια έσοδα περίπου 50 εκατομμύρια δολάρια και έχοντας επιζήσει από την πανδημία, η Unbabel τα καταφέρνει αρκετά καλά για να εξερευνήσει αυτά τα έργα.
«Είχαμε την ιδέα να εξετάσουμε τις διεπαφές εγκεφάλου-επικοινωνίας», μου λέει ο Pedro. «Ξεκινήσαμε να κάνουμε ένα σωρό πειράματα, όπως ένα έργο 20%.
Η ομάδα καινοτομίας της Unbabel ηγείται από
Πάουλο Δήμας
Αντιπρόεδρος της Καινοτομίας Προϊόντων που εξέτασε τον τρόπο με τον οποίο εξελίχθηκε ο εγκέφαλός μας.
«Έχετε το μεταιχμιακό σας σύστημα, έχετε τον νεοφλοιό σας. Αλλά στην πραγματικότητα έχουν εξελιχθεί εδώ και εκατομμύρια χρόνια. Στην πραγματικότητα είναι ξεχωριστά συστήματα. Και νομίζω ότι αυτό που αρχίζουμε να βλέπουμε είναι σχεδόν η δημιουργία του «uber cortex», που πιστεύουμε ότι θα τροφοδοτείται από AI και θα υπάρχει έξω από τον βιολογικό σας εγκέφαλο», είπε ο Pedro.
Ο Δήμας και η ομάδα του άρχισαν να εξετάζουν συστήματα ηλεκτροεγκεφαλογράφημα (EEG), μερικά από τα οποία μπορεί να είναι επεμβατικά στο σώμα. του Έλον Μασκ
Neuralink
Η εταιρεία εξερευνά περίφημα επεμβατικές συσκευές διεπαφής εγκεφάλου-υπολογιστή για ανθρώπους.
[L to R] Mike Butcher, TechCrunch; Paulo Dimas, Αντιπρόεδρος της Unbabel καινοτομίας προϊόντων. Vasco Pedro, CEO/συνιδρυτής της Unbabel, με τη συσκευή Halo.
Το EMG ήταν η πύλη
Στη συνέχεια, όμως, η ομάδα του Unbabel έπεσε στην ιδέα να χρησιμοποιήσει ένα σύστημα ΗΜΓ. ΗΜΓ (
Ηλεκτρομυογραφία
) μετρά την απόκριση των μυών ή την ηλεκτρική δραστηριότητα ως απόκριση στη διέγερση του μυός από ένα νεύρο. Οι συσκευές EMG είναι συνηθισμένες και ασήμαντες. Μπορείτε ακόμη και να τα αγοράσετε
Amazon για λίγα δολάρια
.
«Αυτό που καταλάβαμε ήταν ότι το ΗΕΓ ήταν ακόμα πολύ θορυβώδες. Θέλαμε να είμαστε μη επεμβατικοί. Αλλά το ΗΜΓ, το οποίο μετρά την απόκριση των μυών, ήταν τόσο λιγότερο θορυβώδες. Μπορείτε να συλλάβετε πιο αξιόπιστα μερικά από τα σήματα», είπε ο Pedro.
Η ομάδα έβαλε αισθητήρες σε ένα περιβραχιόνιο και άρχισε να επεξεργάζεται τι μπορούσαν να μετρήσουν. «Αρχίσαμε να σκεφτόμαστε το ΗΜΓ ως μια πύλη για την άμεση αλληλεπίδραση του εγκεφάλου», μου είπε ο Pedro.
Στη συνέχεια, πέρυσι, αποφάσισαν να συνδέσουν ένα σύστημα ΗΜΓ με το Generative AI. Συγκεκριμένα, ένα LLM το οποίο ήταν εξατομικευμένο στον χρήστη. Αλλά πως?
Με απλά λόγια, το σύστημα μέτρησε πώς θα αντιδρούσε ο χρήστης μιας συσκευής ΗΜΓ όταν σκεφτόταν μια λέξη. Αυτό θα βοηθούσε στη δημιουργία ενός συνόλου σημάτων που συσχετίζονται με πραγματικές λέξεις. Η τροφοδοσία αυτών των σημάτων σε ένα LLM θα σήμαινε τη δημιουργία ενός «εξατομικευμένου LLM».
Έτσι, όταν ρώτησα τον Vasco τι είδους καφέ είχα ζητήσει μέσω ενός μηνύματος κειμένου που δεν είχε εμφανιστεί, του εστάλησαν αυτές οι λέξεις μέσω μιας φωνής AI στα ακουστικά του. Στη συνέχεια σκέφτηκε λέξεις όπως «Μαύρος καφές». Στη συνέχεια, ο LLM αντιστοίχισε τη φυσική του απόκριση στη λέξη, έλεγξε αν εννοούσε “Americano”, ξανά μέσω του ήχου σε ένα ακουστικό και, στη συνέχεια, μου έστειλε την απάντηση μέσω μηνύματος κειμένου – σε αυτήν την περίπτωση, την
εφαρμογή
SMS Telegram.
«Το LLM διευρύνει αυτό που λέτε. Και μετά επιβεβαιώνω πριν το στείλω πίσω. Υπάρχει λοιπόν μια αλληλεπίδραση με το LLM όπου χτίζω αυτό που θέλω να πει και μετά εγκρίνω το τελικό μήνυμα», εξήγησε ο Pedro.
Η διαδήλωση έγινε, μπροστά στα μάτια μου. Δεν υπήρχε κίνηση ή πληκτρολόγηση. Απλώς ο Βάσκο Πέδρο απαντά σιωπηλά στο κείμενο.
«Το LLM που παίρνει μια βασική προτροπή και την επεκτείνει σε μια ολοκληρωμένη απάντηση, σχεδόν αμέσως. Δεν θα είχα χρόνο να πληκτρολογήσω όλα αυτά με φυσικό τρόπο. Οπότε χρησιμοποιώ το LLM για να κάνω τη βαριά άρση στην απόκριση», πρόσθεσε.
Επεσήμανε επίσης ότι ο χρήστης έχει τον απόλυτο έλεγχο του τι βγάζει: «Δεν καταγράφει αυτό που σκέφτομαι. Καταγράφει αυτό που θέλω να πω. Οπότε είναι σαν να συζητάμε. Άλλες προσεγγίσεις, όπως το
Neuralink
, στην πραγματικότητα προσπαθούν να μετρήσουν τις υποσυνείδητες αλληλεπιδράσεις. Δημιουργούμε ένα κανάλι που μπορείτε να χρησιμοποιήσετε για να επικοινωνήσετε, αλλά το άτομο πρέπει να θέλει να το χρησιμοποιήσει».
Ο Pedro το περιγράφει σαν να έχεις μια φωνή μέσα στο κεφάλι σου με την οποία μπορείς να επικοινωνήσεις: «Οι δυνατότητες αύξησης είναι τεράστιες, αλλά υπάρχουν πολλά εμπόδια ακόμα να ξεπεραστούν».
Πώς λειτουργεί; Η απλή απάντηση είναι μια διεπαφή EMG «E-Skin» ενσωματωμένη σε ένα είδος εύκαμπτου περιβλήματος, που αναπτύχθηκε με το Printed Microelectronics Laboratory στο
Πανεπιστήμιο της Κοΐμπρα
καθοδηγείται από
Καθηγήτρια Ταβακολή
.
Αυτήν τη στιγμή η έκδοση είναι αρκετά χακαρισμένη μαζί, αλλά τελικά, η συσκευή θα μπορούσε να μικρογραφία.
Η γέννηση του Halo
Η Unbabel ονόμασε την εφεύρεσή της
Φωτοστέφανος
(μετά το «αλόγραμμα»). Μια εφαρμογή εκτελείται στο τηλέφωνο του χρήστη που επιτρέπει την πρόσβαση σε ένα κεντρικό κέντρο για τη λήψη της επικοινωνίας και επιτρέπει την επικοινωνία με το LLM και τις απαντήσεις. Η πλατφόρμα τραβάει το Open AI
ChatGPT
3.5 αυτή τη στιγμή.
Πώς λειτουργεί η συσκευή Halo της Unbabel.
Ο Pedro παρομοιάζει το έργο της Unbabel με εταιρείες αυτοκινήτων χωρίς οδηγό που χακάρουν μαζί δεδομένα από κανονικές κάμερες και όχι πολύπλοκα συστήματα, όπως το Lidar: «Θα λάβουμε έναν σκατά τόνο δεδομένων και μπορούμε να αρχίσουμε να τα χρησιμοποιούμε τώρα. Ξεκινήσαμε να εργαζόμαστε πριν από τέσσερα χρόνια και το σημείο καμπής είναι τώρα όσον αφορά τη γενετική τεχνητή νοημοσύνη. Αυτή είναι η στιγμή που αυτό θα επιταχυνθεί».
Ομολογουμένως, αυτή δεν είναι η πρώτη φορά που το EMG χρησιμοποιείται για τον έλεγχο ενός υπολογιστή και τη δημιουργία αποκρίσεων.
Για παράδειγμα, μια συσκευή που φτιάχτηκε από εργαστήρια CTRL που βασίζονταν στο Facebook είχε EMG
Περικάρπιο
το 2019 που έλαβε ηλεκτρικές ώσεις που προέρχονται από μυϊκές ίνες καθώς κινούνται.
Ωστόσο, η προσέγγιση του Unbabel φαίνεται σαν να είναι η πρώτη φορά που ένα LLM συνδέεται με το EMG με αυτόν τον τρόπο. Οι αιτήσεις θα μπορούσαν να είναι εκτενείς.
Ξεκλείδωμα του κλειδωμένου
Η Unbabel συνεργάζεται τώρα με το
Ίδρυμα Champalimaud
στη Λισαβόνα, η οποία εργάζεται για την προηγμένη βιοϊατρική έρευνα και τη διεπιστημονική κλινική φροντίδα στον τομέα της ALS, μεταξύ πολλών άλλων. Σαφώς, ωστόσο, το σύστημα θα μπορούσε να καταλήξει να χρησιμοποιηθεί σε άλλα σενάρια, όπως η Εγκεφαλική Παράλυση.
Η ανάγκη για καλύτερες διεπαφές για ασθενείς που δεν μπορούν να μιλήσουν είναι συνεχής. Αυτήν τη στιγμή, τα λεγόμενα προϊόντα «Εναλλακτικής και Αυξητικής Επικοινωνίας» (AAC) για άτομα που πάσχουν από ALS, όπως το Grid ή το Tobii, βασίζονται στην παρακολούθηση των ματιών. Αυτά τα συστήματα απαιτούν συχνά μια απογοητευτική διαδικασία βαθμονόμησης για τον χρήστη, είναι πραγματικά λειτουργικά μόνο σε εσωτερικούς χώρους και μπορεί να κουράσουν τον χρήστη. Εξαρτώνται επίσης από κοπιαστικά αργά πληκτ
ρολόγια
.
Όπως προσθέτει ο Pedros: «Το πρωτότυπό μας έχει ήδη εγκριθεί από τη μεγάλη ένωση ALS στην Πορτογαλία. Σκοπεύουμε να ξεκινήσουμε να το αναπτύσσουμε στους πρώτους μας χρήστες ALS έως τα Χριστούγεννα φέτος. Πέρα από τους ασθενείς με ALS, το τρέχον προϊόν μας είναι επίσης σχετικό με άλλους ασθενείς που δυσκολεύονται να πληκτρολογήσουν.»
Ο Δήμας είναι επίσης ο διορισμένος της Unbabel στη νεοσύστατη Πορτογαλία
Κέντρο Υπεύθυνης Τεχνητής Νοημοσύνης
, όπου είναι Διευθύνων Σύμβουλος. Πρόκειται για μια συνεργασία με πολλές πορτογαλικές νεοφυείς επιχειρήσεις και ερευνητικά κέντρα για την επένδυση 78 εκατομμυρίων ευρώ στην έρευνα της τεχνητής νοημοσύνης, δημιουργώντας 210 θέσεις εργασίας στο πλαίσιο του
Πορτογαλικό σχέδιο ανάκαμψης και ανθεκτικότητας
. Οι συνεργάτες περιλαμβάνουν Feedzai, Sword
Health
, Champalimaud Foundation και άλλους.
Το Generative AI έρχεται σε φορητές συσκευές
Εν τω μεταξύ, η έκδοση του Halo που μου παρουσιάστηκε έδειξε τη δυνητική ισχύ για το Generative AI που εφαρμόζεται σε φορητές συσκευές. Άλλες ομάδες εξερευνούν αυτόν τον γενναίο νέο κόσμο. Μόλις αυτή την εβδομάδα οι νευροεπιστήμονες μπόρεσαν
αναδημιουργώ
Pink ‘Floyd’s Another Brick in the Wall, Part 1′ χρησιμοποιώντας AI για να αποκρυπτογραφήσει την ηλεκτρική δραστηριότητα του εγκεφάλου.
Το concept υπάρχει εδώ και πολύ καιρό. Στη δεκαετία του 1980, το
Ταινία Firefox
σε σκηνοθεσία και πρωταγωνιστή τον Κλιντ Ίστγουντ, παρουσίασε έναν κόσμο όπου οι πιλότοι θα έλεγχαν οπλικά συστήματα μέσω ελεγχόμενων από τη σκέψη πλατφορμών:
Αλλά αυτή είναι μόνο η πρώτη έκδοση του Unbabel’s Halo: “Είναι ακόμα αρκετά περιορισμένο σε αυτό που μπορούμε να κάνουμε, αλλά είμαστε ήδη περίπου 20 λέξεις ανά λεπτό ισοδύναμης επικοινωνίας”, είπε ο Pedro.
«Για να σας δώσω μια αίσθηση αυτού, ο Stephen Hawking επικοινωνούσε με περίπου δύο λέξεις το λεπτό. Το Halo είναι τώρα περίπου 20 λέξεις ανά λεπτό. Το επίπεδο χρήσης καταναλωτή είναι 60 και το 80 είναι ο στόχος. Οι άνθρωποι μιλούν το πολύ 120 έως 130 λέξεις το λεπτό. Έτσι, αν φτάσεις στα 150, αρχίζεις να φτάνεις σε υπεράνθρωπες ικανότητες».
