Η Microsoft λανσάρει έναν δημιουργό deepfakes στην εκδήλωση Ignite 2023



Ένα από τα πιο απροσδόκητα προϊόντα που κυκλοφορούν από την εκδήλωση Microsoft Ignite

είναι ένα εργαλείο που μπορεί να δημιουργήσει ένα φωτορεαλιστικό

ενός ατόμου και να ζωντανέψει αυτό το avatar λέγοντας πράγματα που δεν είπε απαραίτητα το άτομο.

Ονομάζεται Azure AI Speech avatar κειμένου σε ομιλία, η νέα λειτουργία, διαθέσιμη σε δημόσια προεπισκόπηση από σήμερα, επιτρέπει στους χρήστες να δημιουργούν βίντεο με ένα avatar που μιλάει ανεβάζοντας εικόνες ενός ατόμου που επιθυμούν να μοιάζει με το avatar και γράφοντας ένα σενάριο. Το εργαλείο της Microsoft εκπαιδεύει ένα μοντέλο για να οδηγεί το κινούμενο σχέδιο, ενώ ένα ξεχωριστό μοντέλο μετατροπής κειμένου σε ομιλία — είτε προκατασκευασμένο είτε εκπαιδευμένο στη φωνή του ατόμου — «διαβάζει» το σενάριο δυνατά.

«Με το avatar κειμένου σε ομιλία, οι χρήστες μπορούν να δημιουργήσουν πιο αποτελεσματικά βίντεο… για να δημιουργήσουν εκπαιδευτικά βίντεο, εισαγωγές προϊόντων, μαρτυρίες πελατών [and so on] απλά με την εισαγωγή κειμένου»,

γράφει η Microsoft σε μια ανάρτηση στο blog

. “Μπορείτε να χρησιμοποιήσετε το avatar για να δημιουργήσετε συνομιλητές, εικονικούς βοηθούς,

και πολλά άλλα.”

Τα Avatar μπορούν να μιλούν σε πολλές γλώσσες. Και, για σενάρια chatbot, μπορούν να χρησιμοποιήσουν μοντέλα τεχνητής νοημοσύνης όπως το GPT-3.5 του OpenAI για να απαντήσουν σε ερωτήσεις πελατών εκτός του σεναρίου.

Τώρα, υπάρχουν αμέτρητοι τρόποι με τους οποίους θα μπορούσε να γίνει κατάχρηση ενός τέτοιου εργαλείου — κάτι που η Microsoft, προς τιμήν της, αντιλαμβάνεται. (Παρόμοια τεχνολογία δημιουργίας avatar από την εκκίνηση AI Synthesia ήταν

κακή χρήση

να παράγει προπαγάνδα στη Βενεζουέλα και

ψευδής

ρεπορτάζ ειδήσεων που προωθούνται από λογαριασμούς μέσων κοινωνικής δικτύωσης υπέρ της Κίνας.) Οι περισσότεροι συνδρομητές του Azure θα έχουν πρόσβαση μόνο σε προκατασκευασμένα —όχι προσαρμοσμένα— avatars κατά την κυκλοφορία. Τα προσαρμοσμένα avatar είναι επί του παρόντος μια δυνατότητα «περιορισμένης πρόσβασης» που διατίθεται μόνο με εγγραφή και «μόνο για ορισμένες περιπτώσεις χρήσης», λέει η Microsoft.

Αλλά το χαρακτηριστικό εγείρει μια σειρά από άβολα ηθικά ερωτήματα.

Ένα από τα σημαντικότερα σημεία κόλλησης στην πρόσφατη

SAG-AFTRA ήταν η χρήση της τεχνητής νοημοσύνης για τη δημιουργία ψηφιακών ομοιωμάτων. Τα στούντιο συμφώνησαν τελικά να πληρώσουν τους ηθοποιούς για τις ομοιότητες που δημιουργήθηκαν από την τεχνητή νοημοσύνη. Τι γίνεται όμως με τη Microsoft και τους πελάτες της;

Ρώτησα τη θέση της Microsoft σχετικά με τις εταιρείες που χρησιμοποιούν ομοιότητες ηθοποιών χωρίς, κατά τις απόψεις των ηθοποιών, κατάλληλη αποζημίωση ή ακόμη και ειδοποίηση. Η εταιρεία δεν απάντησε – ούτε είπε εάν θα απαιτούσε από τις εταιρείες να χαρακτηρίζουν τα avatar ως δημιουργημένα από AI, όπως

YouTube

και ένα

αυξανόμενος αριθμός

άλλων πλατφορμών.

Προσωπική φωνή


φαίνεται να έχει περισσότερα προστατευτικά κιγκλιδώματα γύρω από ένα σχετικό εργαλείο δημιουργίας τεχνητής νοημοσύνης, την προσωπική φωνή, που κυκλοφορεί επίσης στο Ignite.

Η προσωπική φωνή, μια νέα δυνατότητα στην προσαρμοσμένη υπηρεσία νευρωνικής φωνής της Microsoft, μπορεί να αναπαράγει τη φωνή ενός χρήστη σε λίγα δευτερόλεπτα, παρέχοντας ένα δείγμα ομιλίας ενός λεπτού ως ηχητική προτροπή. Η Microsoft το παρουσιάζει ως έναν τρόπο δημιουργίας εξατομικευμένων φωνητικών βοηθών, μεταγλώττισης περιεχομένου σε διαφορετικές γλώσσες και δημιουργίας εξατομικευμένων αφηγήσεων για ιστορίες, ηχητικά βιβλία και podcast.

Για να αποτρέψει πιθανούς νομικούς πονοκεφάλους, η Microsoft απαιτεί από τους χρήστες να δίνουν «ρητή συγκατάθεση» με τη μορφή ηχογραφημένης δήλωσης προτού ο πελάτης μπορέσει να χρησιμοποιήσει προσωπική φωνή για να συνθέσει τις φωνές του. Η πρόσβαση στη λειτουργία περιορίζεται προς το παρόν πίσω από μια φόρμα εγγραφής και οι πελάτες πρέπει να συμφωνήσουν να χρησιμοποιούν προσωπική φωνή μόνο σε εφαρμογές “όπου η φωνή δεν διαβάζει περιεχόμενο που δημιουργείται από τον χρήστη ή περιεχόμενο ανοιχτού τύπου”.

“Η χρήση του φωνητικού μοντέλου πρέπει να παραμένει εντός μιας εφαρμογής και η έξοδος δεν πρέπει να μπορεί να δημοσιευτεί ή να κοινοποιηθεί από την εφαρμογή”, γράφει η Microsoft σε μια ανάρτηση ιστολογίου. “[C]πελάτες που πληρούν κριτήρια καταλληλότητας περιορισμένης πρόσβασης διατηρούν τον αποκλειστικό έλεγχο της δημιουργίας, της πρόσβασης και της χρήσης των μοντέλων φωνής και της παραγωγής τους [where it concerns] μεταγλώττιση για ταινίες, τηλεόραση, βίντεο και ήχο μόνο για ψυχαγωγικά σενάρια.”

Η Microsoft δεν απάντησε στις ερωτήσεις του TechCrunch σχετικά με το πώς θα μπορούσαν να αποζημιωθούν οι ηθοποιοί για τις προσωπικές τους φωνητικές συνεισφορές — ή εάν σχεδιάζει να εφαρμόσει οποιοδήποτε είδος τεχνολογίας υδατογράφησης, ώστε οι φωνές που δημιουργούνται από AI να μπορούν να αναγνωρίζονται πιο εύκολα.

Για περισσότερη κάλυψη του Microsoft Ignite 2023:


Αυτή η ιστορία δημοσιεύθηκε αρχικά στις 8 π.μ. PT στις 15 Νοεμβρίου και ενημερώθηκε στις 3:30 μ.μ. PT.


VIA:

techcrunch.com


Leave A Reply



Cancel Reply

Your email address will not be published.