Το AI Voice Generator της ElevenLabs μπορεί να παραποιήσει φωνές σε 30 γλώσσες
Αυτό που έχει γίνει μια από
τι
ς πιο δημοφιλείς εταιρείες του Διαδικτύου για τη δημιουργία αρκετά ρεαλιστικών οπτικών deepfakes έχει τώρα τη δυνατότητα να κλωνοποιήσει τη φωνή σας και να την αναγκάσει να μιλήσει σε μια αυξανόμενη ποικιλία γλωσσών. Η ElevenLabs ανακοίνωσε την Τρίτη η νέα της
κλωνοποίηση
φωνής υποστηρίζει πλέον 22 περισσότερες γλώσσες από ό,τι στο παρελθόν, συμπεριλαμβανομένων των ουκρανικών, κορεατικών, σουηδικών, αραβικών και άλλων.
Σύμφωνα με το ElevenLa
bs, το νέο μοντέλο Multilingual v2 υπόσχεται ότι μπορεί να παράγει ήχο «πλούσιο συναισθηματικά» σε συνολικά 30 γλώσσες. Η εταιρεία προσφέρει δύο φωνητικά εργαλεία AI, το ένα είναι ένα μοντέλο κειμένου σε ομιλία και το άλλο είναι το “VoiceLab” που επιτρέπει στους χρήστες που πληρώνουν να κλωνοποιήσουν μια φωνή εισάγοντας θραύσματα της ομιλίας τους (ή άλλων) στο μοντέλο για να δημιουργήσουν ένα είδος κώνος φωνής. Με το μοντέλο v2, οι χρήστες μπορούν να κάνουν αυτές τις φωνές που δημιουργούνται να αρχίσουν να μιλούν στα ελληνικά, τα μαλαισιανά ή τα τουρκικά.
Η υπηρεσία μεταδόθηκε ζωντανά στον ιστότοπο της εταιρείας γύρω στο μεσημέρι ET Τρίτη. Οι χρήστες χρειάζεται μόνο να πληκτρολογήσουν το κείμενο στην πραγματική του γλώσσα για να ακούσουν τη μεταφρασμένη φωνή και θα πρέπει να λειτουργεί με οποιονδήποτε κλώνο φωνής που δημιουργείται από την εταιρεία ή από τους χρήστες. Ως κύριος ομιλητής της αγγλικής γλώσσας, είναι δύσκολο να μετρήσετε πόσο καλά κάθε τονισμένη φωνή αντιπροσωπεύει κάθε γλώσσα, αλλά η ομιλία χρειάζεται χρόνο για να φαίνεται νατουραλιστική με την περιστασιακή παύση χωρίς ανάσα μεταξύ προτάσεων και εισαγωγικών.
Η πλατφόρμα ElevenLabs έχει δει το μερίδιο της διαμάχης μετά την κυκλοφορία της πέρυσι. Η αρχική πλατφόρμα beta της εταιρείας είδε τους χρήστες του 4Chan να κάνουν κατάχρηση των συστημάτων της για να υποδυθούν διασημότητες,
αναγκάζοντάς τους να πουν ρατσιστικά, μισογυνικά και τρανσφοβικά σενάρια
. Χρησιμοποιήθηκε επίσης από
Ευαγγελιστές AI να επιτεθούν σε φωνητικούς ηθοποιούς
ο οποίος παραπονέθηκε για την ευρεία χρήση της τεχνολογίας κλωνοποίησης φωνής. Έκτοτε, η ElevenLabs ισχυρίζεται ότι έχει ενσωματωμένα νέα μέτρα για να διασφαλίσει ότι οι χρήστες μπορούν να κλωνοποιήσουν μόνο τη δική τους φωνή. Οι χρήστες πρέπει να επαληθεύσουν την ομιλία τους με μια προτροπή κειμένου captcha, η οποία στη συνέχεια συγκρίνεται με το αρχικό δείγμα φωνής.
Ο συνιδρυτής της εταιρείας, ο πρώην
Palantir
Το στέλεχος Mati Staniszewski, δήλωσε σε μια ανακοίνωση: «Ελπίζουμε τελικά να καλύψουμε ακόμη περισσότερες γλώσσες και φωνές με τη βοήθεια της AI και να εξαλείψουμε τα γλωσσικά εμπόδια στο περιεχόμενο».
Εκτός Beta, το ElevenLabs προσπαθεί να προωθήσει τις φωνές AI στα μέσα
Παράλληλα με τις νέες γλωσσικές δυνατότητες, η ElevenLabs ισχυρίστηκε επίσης ότι αυτή η ώθηση σηματοδοτεί πλέον ότι η τεχνολογία κλωνοποίησης φωνής AI δεν βρίσκεται πλέον στη φάση beta, όπως ακριβώς η εταιρεία εξετάζει βαθύτερα τη διάθεση της τεχνολογίας σε εταιρείες πολυμέσων. Τον Ιούνιο, η ElevenLabs έλαβε
19 εκατομμύρια δολάρια σε χρηματοδότηση εκκίνησης
από τους κατασκευαστές της τεχνολογίας, Andreesen Horowitz, μαζί με τον πρώην επικεφαλής της
DeepMind
, τώρα
Ο συνιδρυτής της Inflection AI Mustafa Suleyman
.
Η ElevenLabs προωθεί την τεχνολογία της κλωνοποίησης φωνής ως έναν τρόπο για τις εταιρείες να δημιουργούν ηχητικά βιβλία, βίντεο, ακόμη και NPC φωνής σε
βιντεοπαιχνίδια
. Η εταιρία
αξιώσεις
έκλεισε συμφωνία με την Paradox Interactive, τον εκδότη πίσω από παιχνίδια όπως το
Hearts of Iron
σειρά και το επερχόμενο
The Lamplighters League
. Η τεχνολογία κλωνοποίησης φωνής της εταιρείας έχει αναφερθεί ρητά από
φωνή παιχνιδιών σε ηθοποιούς που ανησυχούν ότι η τεχνολογία χρησιμοποιείται για να υπονομεύσει τη δουλειά τους
.
Το Gizmodo επικοινώνησε με το Paradox για σχολιασμό, αλλά δεν ακούσαμε αμέσως απάντηση.
Στο μέτωπο των βιβλίων, τεχνολογικοί γίγαντες όπως η Google και η Apple προσπάθησαν να προωθήσουν ηχητικά βιβλία με αφήγηση με τεχνητή νοημοσύνη.
Η εφαρμογή Βιβλία της Apple άρχισε να περιλαμβάνει αφηγητές
με ήπια ονόματα όπως “Archie” και “Warren” για να εκφράσουν κάποιο περιεχόμενο. Όσοι ακούν ηχητικά βιβλία έχουν σημειώσει ότι αυτές οι φωνές είναι —ελλείψει καλύτερου όρου—
άψυχος
σε σύγκριση με το απόθεμα επαγγελματιών ηθοποιών φωνής που μπορούν πραγματικά να δώσουν προσοχή στην άνοδο και την πτώση μιας αφήγησης. Το σωματείο ηθοποιών SAG-AFTRA και το Writers Guild of America απεργούν αυτή τη στιγμή και ένα μεγάλο μέρος των τρεχουσών διαπραγματεύσεων με τη βιομηχανία του θεάματος
έχουν επικεντρωθεί στην τεχνητή νοημοσύνη
.
Ωστόσο, η ElevenLabs προωθεί ότι οι φωνές τεχνητής νοημοσύνης μπορούν να εξοικονομήσουν εκδοτικές εταιρείες τόσο χρόνο όσο και χρήμα για τη δημιουργία ηχητικών βιβλίων. Σε ανάρτηση στο blog της Δευτέρας, η εταιρεία
προωθούνται
συνεργάστηκε με τη Lukeman Literary, ένα λογοτεχνικό πρακτορείο και μια μικρή ανεξάρτητη εκδοτική εταιρεία, για να βελτιώσει την επεξεργασία των ηχητικών βιβλίων της. Η εταιρεία ισχυρίστηκε ότι χρειαζόταν στον Lukeman «εβδομάδες» για να δημιουργήσει ένα μόνο ηχητικό βιβλίο, αλλά με τεχνητή νοημοσύνη που μειώνεται σε λίγες ώρες.
Η Lukeman Literary βοήθησε στη δημοσίευση βιβλίων από γνωστά δημόσια πρόσωπα όπως ο Ρούτγκερ Χάουερ και ο Δαλάι Λάμα μαζί με άλλα έργα μυθοπλασίας. Σε ένα μήνυμα ηλεκτρονικού ταχυδρομείου που εστάλη στο Gizmodo, ο Lukeman τόνισε ότι το πρακτορείο και το εκδοτικό του όπλο ήταν ξεχωριστά, επομένως δεν υπήρχαν σχέδια για τη μετατροπή των αντιπροσωπευόμενων τίτλων του πρακτορείου σε αφήγηση AI. Ωστόσο, όσον αφορά την εκδοτική του δραστηριότητα, είπε ότι ποτέ δεν αγκάλιασε την αφήγηση της τεχνητής νοημοσύνης επειδή η «ποιότητα» δεν υπήρχε, αλλά από τη στιγμή που δοκίμασε τα χαρακτηριστικά του ElevenLabs είπε ότι «επιτέλους εντυπωσιάστηκε» αρκετά για να τη χρησιμοποιήσει. Ισχυρίστηκε περαιτέρω ότι «η αφήγηση της τεχνητής νοημοσύνης είναι θεϊκό δώρο» για ανεξάρτητους συγγραφείς, επειδή είναι πολύ φθηνότερο από την ανθρώπινη αφήγηση.
Παρά το γεγονός ότι η φωνή της τεχνητής νοημοσύνης είναι τελικά αρκετά καλή για την πρώτη στιγμή, ο Λούκεμαν συμφώνησε ότι η τεχνητή νοημοσύνη «θα αποτελέσει σίγουρα πρόκληση» για τους φωνητικούς ηθοποιούς, αλλά πρότεινε ότι «ορισμένοι» συγγραφείς και εκδότες θα εξακολουθούν να θέλουν ηχητικά βιβλία που εκφράζονται από έναν πραγματικό άνθρωπο.
Είτε οι φωνητικοί ηθοποιοί θα μπορέσουν τελικά να χορηγήσουν άδεια για τη φωνή τους σε τεχνητή νοημοσύνη για υπολείμματα, αυτού του είδους οι συμφωνίες εξακολουθούν να είναι ξένες προς τον εκδοτικό κλάδο που είναι
ερωτεύεται όλο και περισσότερο
με AI. Με την απεργία να συνεχίζεται, μπορεί να χρειαστεί χρόνος για να μάθουμε πώς ανταποκρίνονται οι συντελεστές σε μια βιομηχανία που αναζητά έναν τρόπο να κερδίσει χρήματα από την τάση των ηχητικών βιβλίων, αλλά χωρίς πραγματικό ανθρώπινο ήχο.
