Η Meta κυκλοφορεί το SeamlessM4T Translation AI για κείμενο και ομιλία

Ο Μέτα πήρε α

βήμα προς έναν παγκόσμιο μεταφραστή γλωσσών την Τρίτη με την κυκλοφορία του νέου

υ Seamless M4T AI, το οποίο η εταιρεία λέει ότι μπορεί να κατανοήσει γρήγορα και αποτελεσματικά τη γλώσσα από την ομιλία ή το κείμενο σε έως και 100 γλώσσες και να δημιουργήσει μετάφραση σε κάθε τρόπο επικοινωνίας. Πολλές εταιρείες τεχνολογίας έχουν κυκλοφορήσει παρόμοια α

προηγμένα μοντέλα μετάφρασης AI τους τελευταίους μήνες.

Σε ένα


ανάρτηση


, η Meta περιγράφει το νέο της σύστημα μετάφρασης ως «το πρώτο πολυτροπικό και πολυγλωσσικό μοντέλο μετάφρασης τεχνητής νοημοσύνης all-in-one» ικανό για αναγνώριση ομιλίας και μετάφραση ομιλίας σε κείμενο για σχεδόν 100 διαφορετικές γλώσσες. Το μοντέλο μπορεί επίσης να ερμηνεύσει την ομιλία και το κείμενο και να αποσπάσει μεταφρασμένες προφορικές λέξεις για 36 και 35 γλώσσες αντίστοιχα. Το Seamless M4T φέρεται επίσης να κατανοεί πότε οι χρήστες αλλάζουν γλώσσα στη μέση πρόταση, κάτι που θα μπορούσε να βοηθήσει κατά τη χρήση ενός μοντέλου για τη μετάφραση ατόμων που αναμειγνύουν μέρη γλωσσών όταν μιλούν, κάτι που οι ερευνητές γλωσσών αναφέρουν ως εναλλαγή κωδικών.

“Το SeamlessM4T είναι ένα ενοποιημένο πολύγλωσσο μοντέλο, που σημαίνει ότι δεν βασίζεται σε ενδιάμεσα μοντέλα για την παραγωγή αποτελεσμάτων”, δήλωσε στο Gizmodo ο διευθυντής της Meta

Scientist Paco Guzmán. «Συχνά κάνουν και άλλα διαδοχικά συστήματα για προφορική μετάφραση: αναγνώριση ομιλίας, μετάφραση κειμένου, δημιουργία κειμένου σε ομιλία. Το SeamlessM4T το κάνει με μία μόνο κίνηση.»

Σε ένα βίντεο επίδειξης, ο Guzmán είπε την φράση «στόχος μας είναι να δημιουργήσουμε έναν πιο συνδεδεμένο κόσμο». Το μοντέλο γρήγορα αναγνώρισε ότι η γλώσσα που μιλούσε ήταν τα αγγλικά και στη συνέχεια τη μετέφρασε στα ρωσικά. Μια μηχανογραφημένη Ρωσική φωνή έφτυσε τη φράση με ένα περισσότερο ή λιγότερο ανθρώπινο ηχόχρωμα.

Σε αντίθεση με άλλα προηγούμενα μοντέλα μετάφρασης, το SeamlessM4T χρησιμοποιεί ένα ενιαίο σύστημα το οποίο η Meta πιστεύει ότι τελικά θα έχει ως αποτέλεσμα μειωμένα σφάλματα και καθυστερήσεις και αυξημένη ποιότητα. Η Meta συνέκρινε αυτήν την προσέγγιση μεταφραστή all-in-one με τον παγκόσμιο μεταφραστή Babel


The Hitchhiker’s Guide to The Galaxy.

Προς το παρόν, δεν θα χρειαστεί


βάλε αυτό στο αυτί σου


.

Η Meta κυκλοφορεί το Seamless M4TT με άδεια

Commons, ώστε άλλοι μεταφραστές και ερευνητές τεχνητής νοημοσύνης να μπορούν να το αξιοποιήσουν. Η εταιρεία δημοσιεύει επίσης τα μεταδεδομένα του SeamlessAlign, τα οποία περιέχουν πάνω από 270.000 ώρες εξορυσσόμενης ομιλίας και κειμένου.

Η Meta ισχυρίζεται ότι είναι το μεγαλύτερο σύνολο δεδομένων του είδους του.

Αν και

μέρος της νέας τεχνητής νοημοσύνης τους τελευταίους μήνες έχει επισημάνει το

αναξιοπιστία της χρήσης μεγάλων γλωσσικών μοντέλων

για την ακριβή παράδοση

τεκμηριωμένες πληροφορίες

η μετάφραση γλώσσας είναι κάτι που αυτά τα μοντέλα είναι στην πραγματικότητα καλά-

κατάλληλος για. Το Seamless M4T καθίσταται δυνατό χάρη στις προηγούμενες επαναλήψεις της Meta σε μεταφραστικά μοντέλα. Ένα από αυτά άνοιξε νέους δρόμους

μεταφράζοντας με επιτυχία την κυρίως ομιλούμενη γλώσσα Hokkien σε προφορικές λέξεις

, μια πρώτη για ένα νέο μοντέλο. Πιο πρόσφατα, η εταιρεία κυκλοφόρησε το


Μαζικά πολύγλωσσος λόγος


Σύστημα,

το οποίο η Meta ισχυρίζεται ότι μπορεί να παρέχει αυτόματη ανίχνευση ομιλίας και αναγνώριση γλώσσας για περισσότερες από 1.100 γλώσσες.



gizmodo.com


Leave A Reply



Cancel Reply

Your email address will not be published.