Meta για να βοηθήσει τους ανθρώπους να δημιουργήσουν περισσότερα Deepfakes με AI «Voicebox».

On

Ιούν 16, 2023

Η

Meta

έχει ένα άλλο νέο μοντέλο τεχνητής νοημοσύνης στο docket, και αυτό φαίνεται τέλεια σχεδιασμένο για τη χώρα του αύριο, εάν αυτό το ουτοπικό μέλλον δεν είναι γεμάτο με τίποτα παρά με deepfakes και τροποποιημένο ήχο. Όπως και οι γεννήτριες εικόνων AI, το Voicebox δημιουργεί συνθετικές φωνές με βάση μια απλή προτροπή κειμένου από την αρχή —ή, στην πραγματικότητα— ήχο από χιλιάδες ηχητικά βιβλία.

Εάν ένα AI ανακατασκευάσει εικόνες που προστατεύονται από πνευματικά δικαιώματα, είναι τέχνη; | Μελλοντική Τεχν

Την Παρασκευή, η Meta ανακοίνωσε το νέο Voicebox AI που μπορεί να δημιουργήσει φωνητικά κλιπ χρησιμοποιώντας απλά μηνύματα κειμένου. Σε ένα

βίντεο

, μοιράστηκε ο διευθύνων σύμβουλος Mark Zuckerberg στο

Facebook

και το Instagram του, είπε ότι το μοντέλο Voicebox AI μπορεί να λάβει ένα μήνυμα κειμένου και να το διαβάσει με μια ποικιλία ανθρώπινων, αν και κάπως ψηφιακών φωνών. Διαφορετικά, το Voicebox μπορεί επίσης να τροποποιήσει τον ήχο για να αφαιρέσει ανεπιθύμητους θορύβους από φωνητικά κλιπ, όπως ένα σκυλί που γαβγίζει στο παρασκήνιο. Σε αντίθεση με πολλά άλλα μοντέλα σύνθεσης φωνής AI, το AI της Meta μπορεί να δημιουργήσει ήχο σε άλλες γλώσσες εκτός από τα αγγλικά, συμπεριλαμβανομένων των γαλλικών, ισπανικών, γερμανικών, πολωνικών και πορτογαλικών, και η εταιρεία είπε ότι η τεχνητή νοημοσύνη μπορεί να μεταφράσει αποτελεσματικά οποιοδήποτε πέρασμα από τη μια γλώσσα στην άλλη, διατηρώντας παράλληλα το ίδιο στυλ φωνής.

<br />

Σύμφωνα με το Meta

, Το Voicebox μπορεί να λάβει ένα δείγμα ήχου διάρκειας τουλάχιστον δύο δευτερολέπτων και στη συνέχεια να ταιριάζει με αυτό το στυλ ήχου για τη δημιουργία κειμένου σε ομιλία. Εάν ισχύει, είναι πιο εξελιγμένο από άλλα μοντέλα σύνθεσης όπως το Speechify ή

Eleven Labs

τα οποία συνήθως απαιτούν λίγο περισσότερα δεδομένα για να μπορέσουν να δημιουργήσουν μια ποιοτική συνθετική φωνή.

Στο διαφημιστικό κλιπ του Meta, μια από τις φωνές που τροποποιούνται ακούγεται απίστευτα σαν τον ίδιο τον Zuckerberg. Ανάλογα με το πόσο ικανό είναι πραγματικά το μοντέλο, το άκουσμα του Zuck φέρνει στο μυαλό

μερικά από τα deepfakes που διαμορφώθηκαν σύμφωνα με τον CEO της Meta

.

Σε αντίθεση με της εταιρείας

πολλές άλλες εκδόσεις AI πρόσφατα

, το Voicebox δεν θα είναι ανοιχτού κώδικα κατά το ντεμπούτο του, όλα αυτά θυμίζουν ότι η Meta θα μπορούσε να περιορίσει την τελευταία της έκδοση με τεχνητή νοημοσύνη λόγω πιθανών βλαβών που θα μπορούσαν να προκύψουν. Ενώ μερικοί άνθρωποι στο διαδίκτυο έχουν χρησιμοποιήσει παρόμοια προγράμματα για να δημιουργήσουν συνθετικά φωνητικά κλιπ των αγαπημένων τους χαρακτήρων στα μέσα ενημέρωσης

για πλάκα

τα έχουν χρησιμοποιήσει άλλοι

εκστρατείες παρενόχλησης κατά των ίδιων των φωνητικών ηθοποιών

. Επομένως, θα μπορούσε να προσπαθεί να αποτρέψει τη ζημιά ή θα μπορούσε να σώσει αυτό το δυνητικά επικερδές μοντέλο για κάποια μελλοντική επιχείρηση.

Σύμφωνα με την

Ερευνητικό έγγραφο Voicebox

, το σύστημα εκπαιδεύτηκε σε περισσότερες από 50.000 ώρες αφιλτράριστης, μη βελτιωμένης ομιλίας από αγγλικά ηχητικά βιβλία και άλλες 60.000 ώρες ακρόασης από πολύγλωσσα ηχητικά βιβλία. Γι’ αυτό στο βίντεο του Meta, ο συνθετικός λόγος ακούγεται λιγότερο συνομιλητικός και περισσότερο σαν κάποιος που διαβάζει ένα παιδί μια ιστορία πριν τον ύπνο. Οι ερευνητές είπαν ότι τελικά θα κλιμακώσουν το μοντέλο ώστε να περιλαμβάνει πιο περιστασιακή ομιλία.

Το μοντέλο είναι επίσης περιορισμένο στο ότι οι χρήστες δεν μπορούν να ελέγξουν ανεξάρτητα το είδος της φωνής των πιθήκων AI και τη συναισθηματικότητα ενός διαφορετικού δείγματος ομιλίας.

Αλλά αυτό που είναι πιο ανησυχητικό είναι ότι ο Meta δεν φαίνεται να απευθύνεται στον ελέφαντα στο δωμάτιο με την τελευταία του εφημερίδα. Οι ερευνητές δεν είπαν ποια

ηχητικά βιβλία ήταν

χρησιμοποιείται για την εκπαίδευση του AI, και

από όπου ήρθαν

.

Δεν είναι ξεκάθαρο αν οι δεκάδες χιλιάδες ώρες ηχητικών βιβλίων θα ισοδυναμούσαν με πολλές χιλιάδες ηχητικά βιβλία.

Το Gizmodo επικοινώνησε με το Meta για περισσότερες πληροφορίες σχετικά με τα ηχητικά βιβλία που χρησιμοποιήθηκαν στα δεδομένα εκπαίδευσης. Ένας εκπρόσωπος της Meta είπε ότι ήταν ηχητικά βιβλία «δημόσιας ιδιοκτησίας», αν και η εταιρεία αρνήθηκε να διατυπώσει πού κατέβασε αυτά τα βιβλία.

Οι ηθοποιοί φωνής έχουν

δεν ήταν ιδιαίτερα ευχαριστημένος με τη διάδοση της AI

, και ανησυχούν ιδιαίτερα για τις συμβάσεις που επιτρέπουν στις εταιρείες να συνθέτουν τη φωνή τους χωρίς αποζημίωση. Η

Apple

έχει ήδη

ληφθεί θερμότητα

για την αθόρυβη κυκλοφορία μιας σειράς βιβλίων που αφηγούνται φωνές που δημιουργούνται από την τεχνητή νοημοσύνη. Ο τεχνολογικός γίγαντας φέρεται να έχει προσεγγίσει αρκετούς μεγάλους εκδότες ακουστικών βιβλίων για να δημιουργήσει αυτές τις νέες ιστορίες με αφήγηση με τεχνητή νοημοσύνη.

Λαμβάνοντας υπόψη πώς ήταν τα έσοδα από την αγορά ακουστικών βιβλίων

αυξάνεται κατά διψήφιο αριθμό

χρόνο με το χρόνο, και ο τρόπος με τον οποίο οι δημιουργικές βιομηχανίες εκτοξεύονται μειώνοντας το κόστος εργασίας, αυτό το τελευταίο μοντέλο θα μπορούσε να αποδειχθεί ακόμη ένας πονοκέφαλος για τους επαγγελματίες της φωνής.

Θέλετε να μάθετε περισσότερα για την τεχνητή νοημοσύνη, τα chatbots και το μέλλον της μηχανικής μάθησης; Δείτε την πλήρη κάλυψή μας για

τεχνητή νοημοσύνη

ή περιηγηθείτε στους οδηγούς μας

Οι καλύτερες δωρεάν γεννήτριες τέχνης AI

,

Οι καλύτερες εναλλακτικές λύσεις

ChatGPT

και

Όλα όσα γνωρίζουμε για το ChatGPT του

OpenAI

.

gizmodo.com

Apple

chatgpt

Facebook

meta

openai