Modern technology gives us many things.

Το δίπλωμα ευρεσιτεχνίας της Apple λέει ότι το Siri θα μπορούσε να εκπαιδευτεί να διαβάζει τα χείλη σας

Όπως συμβαίνει με πολλές ερωτήσεις στο βοηθητικό bot της Apple, ζητώντας από τη Siri να «διαβάσει τα χείλη μου», επιστρέφει με ένα μήνυμα «Δεν είμαι σίγουρος ότι καταλαβαίνω». Εξάλλου, η Apple μέχρι στιγμής έχει αποφύγει να μιλάει πολύ σχετικά με τα σύγχρονα συστήματα AI. Γιατί να θέλει και η υπηρεσία αναγνώρισης φωνής να με κοιτάζει σαν το HAL 9000 από 2001: A Space Odyssey?

Μια πρόσφατα αποκαλυφθείσα ευρεσιτεχνία από Η Apple δείχνει ότι η εταιρεία έχει σκεφτεί ενεργά τι είναι ιδιόκτητο χείλος-πρόγραμμα ανάγνωσης θα μοιάζει. Η αίτηση για δίπλωμα ευρεσιτεχνίας κατατέθηκε αρχικά τον Ιανουάριο του Αυτή την χρονιά και περιγράφει ένα σύστημα για τον προσδιορισμό του εάν τα «δεδομένα κίνησης» ταιριάζουν με μια λέξη ή φράση. Τα διαγράμματα αναφέρουν συγκεκριμένα το Siri με απλές φωνητικές εντολές όπως “Hey Siri”, “skip” ή “επόμενο τραγούδι” και πώς μπορούν να βελτιωθούν όλες αυτές οι είσοδοι χάρη σε έναν αλγόριθμο αναλύοντας τα μέρη του στόματος των χρηστών.

Όπως σημειώθηκε αρχικά από Apple Insider, η Apple εξηγεί ότι υπάρχουν προφανή προβλήματα με συστήματα αναγνώρισης φωνής όπως το Siri. Οι φωνές μπορεί να παραμορφωθούν μέσω του θορύβου του περιβάλλοντος και άλλοι αισθητήρες που παρακολουθούν διαρκώς τις φωνές των ανθρώπων καταναλώνουν αρκετή μπαταρία και ισχύ επεξεργασίας. Ένα τέτοιο σύστημα δεν θα χρησιμοποιούσε απαραίτητα την κάμερα μιας συσκευής. Αντίθετα, το λογισμικό αναγνώρισης φωνής θα χρησιμοποιούσε έναν από τους αισθητήρες κίνησης του τηλεφώνου για την εγγραφή στόμα, λαιμό ή κεφάλι και προσδιορίστε εάν κάποια από αυτές τις κινήσεις θα μπορούσε να υποδηλώνει ανθρώπινη ομιλία.

Αυτοί οι αισθητήρες θα μπορούσαν να είναι ένα προσαρτημένο επιταχυνσιόμετρο ή γυροσκόπιο, το οποίο η Apple σημείωσε στην πατέντα της ότι είναι πολύ λιγότερο πιθανό να καταστραφεί από ανεπιθύμητα ερεθίσματα από ένα μικρόφωνο. Δεν χρειάζεται να είναι απλώς ένα τηλέφωνο, καθώς το δίπλωμα ευρεσιτεχνίας περιγράφει πώς θα μπορούσε να ενσωματωθεί αυτό το είδος τεχνολογίας ανίχνευσης κίνησης σε AirPods ή ακόμα και μια αόριστη αναφορά σε «έξυπνα γυαλιά», που θα έκανε στη συνέχεια στείλτε αυτά τα δεδομένα στο iPhone ενός χρήστη. Οι συσκευές θα μπορούσαν να ανιχνεύσουν λεπτούς μυς του προσώπου, δονήσεις ή κινήσεις του κεφαλιού, σύμφωνα με το έγγραφο. Σίγουρος, Τα όνειρα της Apple για έξυπνα γυαλιά πέθαναν πριν από χρόνιααλλά η εταιρεία ελπίζει σε μεγάλα πράγματα με το Ακουστικά Vision Pro.

Για αυτό το είδος συστήματος, η Apple θα χρειαζόταν πολλά δεδομένα πώς οι άνθρωποι χρησιμοποιούν τα μέρη του στόματός τους. Η εταιρεία θα μπορούσε να δημιουργήσει ένα «προφίλ φωνής» για τους χρήστες στο σύστημα. Το Siri υποτίθεται ήδη ότι αναγνωρίζει ένα iPhone φωνή των κύριων χρηστών, αλλά της Apple πρόσφατες λειτουργίες προσβασιμότητας έχουν επεκτείνει αυτή τη δυνατότητα λήψης φωνής. Η δυνατότητα Ζωντανής ομιλίας στο iOS μπορεί να καταγράφει τα φωνητικά προφίλ των χρηστών, τα οποία στη συνέχεια χρησιμοποιείται από ένα σύστημα ομιλίας σε κείμενο για να αντιγράψετε αυτούς τους τόνους και τα φωνητικά μοτίβα.

Στη συνέχεια, η Apple μιλά για ένα «μοντέλο πρώτης γλώσσας» που θα πρέπει να εκπαιδευτεί σε δείγματα συνόλων δεδομένων. Δεν είναι σαφές εάν αυτό θα απαιτούσε κάποιο μοντέλο μηχανικής εκμάθησης, αλλά θα ήταν λογικό να εκπαιδεύσουμε ένα μοντέλο AI ώστε να αναγνωρίζει τις κινήσεις του προσώπου από ένα τεράστιο σύνολο δεδομένων. Ταιριάζει στο σημερινό παράδειγμα της Apple για την προώθηση της τεχνητής νοημοσύνης στο παρασκήνιο των νέων χαρακτηριστικών. Η εταιρεία αναφέρθηκε σε ένα «μοντέλο γλώσσας μετασχηματιστή» μόνο μία φορά το τελευταίο WWDC όταν μιλάμε για το νέο της εταιρείας λειτουργίες αυτόματης διόρθωσης που έρχονται στο iOS 17.

Σίγουρα, η Apple κάνει αρχείο πολλές πατέντες, κάποιοι λίγο πιο τρελοί από άλλους. Δεν γίνονται όλα προϊόντα. Αλλά καθώς αυτό είναι τόσο πρόσφατο, περιέχει λίγο περισσότερη ουσία από μερικές από τις άλλες ιδέες της εταιρείας Cupertino. Το Gizmodo επικοινώνησε με την Apple για σχολιασμό, αλλά δεν λάβαμε αμέσως απάντηση.

Ο αναλυτής της αλυσίδας εφοδιασμού της Apple Ming-Chi Kuo έγραψε χθες ότι η πρόοδος της Apple στη γενετική τεχνητή νοημοσύνη ήταν «σημαντικά πίσω από τους ανταγωνιστές της» και δεν υπήρχε καμία ένδειξη ότι η εταιρεία θα ενσωμάτωση αυτού του είδους των μοντέλων βαθιάς μάθησης στα προϊόντα υλικού της φέτος ή το επόμενο έτος. Αυτό παρά τις αναφορές Η Apple έχει αναπτύξει το δικό της εσωτερικό chatbot με την κωδική ονομασία «Apple GPT». Η Apple θα μπορούσε να εργάζεται για να προσθέσει περισσότερο AI δυνατότητες στο Siriειδικά καθώς πολλές άλλες εφαρμογές έχουν ήδη δημιουργήσει τις δικές τους Βοηθοί φωνής βασισμένοι σε AI για προϊόντα Apple.



gizmodo.com

Follow TechWar.gr on Google News

Απάντηση