Η Meta κυκλοφορεί το μοντέλο SeamlessM4T AI για μετάφραση κειμένου και ομιλίας
Η τελευταία έξοδος AI της Meta είναι μια σημαν
τι
κή πρόοδος για μετάφραση κειμένου και ομιλίας σε πραγματικό χρόνο.
Την Τρίτη, το
εταιρεία κυκλοφόρησε
SeamlessM4T: ένα πολυτροπικό μοντέλο που μεταφράζει κείμενο σε ομιλία και αντίστροφα. Η Meta ισχυρίζεται ότι το SeamlessM4T είναι «το πρώτο πολυγλωσσικό πολυτροπικό μοντέλο μετάφρασης και
μεταγραφή
ς τεχνητής νοημοσύνης all-in-one», που σημαίνει ότι είναι μοναδικά σε θέση να μεταφράζει και να μεταγράφει γλώσσες ταυτόχρονα. Το SeamlessM4T μπορεί να μεταφράσει εισόδους ομιλίας σε κείμενο, ομιλίας σε ομιλία, από κείμενο σε ομιλία και από κείμενο σε κείμενο για έως και 100 γλώσσες. Οι μεταφράσεις για μεταφράσεις ομιλίας σε ομιλία και μεταφράσεις κειμένου σε ομιλία υποστηρίζουν 35 γλώσσες.
ΔΕΙΤΕ ΕΠΙΣΗΣ:
Μια γιγάντια διαδικτυακή συλλογή βιβλίων Meta που χρησιμοποιούσε για την εκπαίδευση της τεχνητής νοημοσύνης της έχει ξεφύγει από ζητήματα πνευματικών δικαιωμάτων
Το tweet μπορεί να έχει διαγραφεί
Όπως και άλλα μοντέλα AI που κυκλοφόρησε πρόσφατα η Meta, συμπεριλαμβανομένων των Llama 2 και AudioCraft, το SeamlessM4T είναι δημόσια διαθέσιμο για ερευνητές και προγραμματιστές με άδεια έρευνας. Παράλληλα με το μοντέλο, η Meta κυκλοφορεί επίσης το εκπαιδευτικό της σύνολο που ονομάζεται SeamlessAlign, το οποίο έχει 270.000 ώρες στοίχισης ομιλίας και κειμένου. Σε αντίθεση με το OpenAI και την
Google
, η Meta έχει θέσει ως στόχο να κάνει τα μοντέλα της ανοιχτού κώδικα και δημόσια διαθέσιμα. Η προσέγγιση της Meta για την κυκλοφορία μοντέλων ανοιχτού κώδικα έχει το διπλό αποτέλεσμα, δίνοντας τη δυνατότητα στους προγραμματιστές να δημιουργήσουν και να βελτιώσουν τα προϊόντα, ενώ παράλληλα κερδίζει πόντους μεταξύ των τεχνιτών της τεχνητής νοημοσύνης που ζητούν διαφάνεια των παραγωγικών συστημάτων τεχνητής νοημοσύνης.
Η προσέγγιση ανοιχτού κώδικα της Meta μπορεί να φαίνεται αλτρουιστική, αλλά είναι μια στρατηγική κίνηση ισχύος σε μια αδίστακτα ανταγωνιστική αγορά έναντι άλλων μεγάλων εταιρειών
τεχνολογία
ς που αναπτύσσουν AI. Υπάρχει επίσης το ζήτημα της συλλογής δεδομένων που πρέπει να αντιμετωπίσουν όλα τα μοντέλα AI. Σύμφωνα με την
ανάρτηση
Το σύνολο δεδομένων του SeamlessM4T (SeamlessAlign) αποτελείται από δημόσια διαθέσιμα δεδομένα, υπάρχουν ηθικά και νομικά ζητήματα σχετικά με τη χρήση έργων που προστατεύονται από πνευματικά δικαιώματα και προσωπικών δεδομένων χωρίς συναίνεση.
Η ανακοίνωση της Meta δεν περιείχε λεπτομέρειες για συγκεκριμένα σχέδια για το SeamlessM4T, υπονοώντας μόνο ότι θέλει «να διερευνήσει πώς αυτό το θεμελιώδες μοντέλο μπορεί να επιτρέψει νέες δυνατότητες επικοινωνίας». Με άλλα λόγια, μπορεί κάποια μέρα να δούμε μια έκδοση του SeamlessM4T που απευθύνεται στον καταναλωτή στο WhatsApp ή το
Instagram
.
Θέματα
Τεχνητή Νοημοσύνη Meta
