Η Microsoft προσφέρει έναν τρόπο στους ανθρώπους να κάνουν τις δικές τους φωνές AI με το Azure AI Speech





Η

πρόκειται να επιτρέψει σε επιχειρήσεις και ανθρώπους να δημιουργήσουν τη δική τους προσαρμοσμένη φωνή βασισμένη σε AI που θα μπορούσε να χρησιμοποιηθεί για μεταγλώττιση σε άλλες γλώσσες, παιχνίδια και πολλά άλλα. Σήμερα, στο πλαίσιο του συνεδρίου προγραμματιστών Ignite 2023 της εταιρείας, το τμήμα υπηρεσιών τεχνητής νοημοσύνης Azure ανακοίνωσε αυτό το νέο χαρακτηριστικό, που ονομάζεται Personal Voice.


Σε μια ανάρτηση στο blog

, η Microsoft λέει ότι αυτό είναι κάτι σαν επέκταση της τρέχουσας προσαρμοσμένης λειτουργίας νευρωνικής φωνής στο Azure AI Speech. Το Personal Voice είναι διαφορετικό γιατί, όπως υποδηλώνει το όνομα, χρησιμοποιεί τη φωνή ενός ατόμου για να δημιουργήσει ήχο βασισμένο σε AI, ο οποίος μπορεί στη συνέχεια να χρησιμοποιηθεί για τη δημιουργία φωνών σε περισσότερες από 100 γλώσσες.

Το blog αναφέρει:

Η προετοιμασία δειγμάτων εκπαίδευσης για τη δημιουργία φωνής AI μπορεί να είναι δύσκολη ή δαπανηρή. Με την προσωπική φωνή, οι χρήστες μπορούν να δημιουργήσουν μια φωνή που ακούγεται ακριβώς όπως τους με ένα δείγμα φωνής, μόλις 60 δευτερόλεπτα.

Αυτή η δυνατότητα θα μπορούσε να χρησιμοποιηθεί για τη δημιουργία ενός φωνητικού βοηθού που ακούγεται ακριβώς όπως το άτομο που χρησιμοποιεί το Personal Voice για να δημιουργήσει το chatbot AI. Θα μπορούσε επίσης να χρησιμοποιηθεί από τους παίκτες για να εκφράσουν τους χαρακτήρες τους, μαζί με τη μεταγλώττιση της φωνής ενός ηθοποιού σε άλλες γλώσσες και πολλά άλλα.

Προφανώς, αυτή η τεχνολογία θα μπορούσε να χρησιμοποιηθεί για να δημιουργήσει ψεύτικες φωνές πραγματικών ανθρώπων για λιγότερο από έντιμες ενέργειες.

λέει ότι όποιος κάνει φωνή AI με αυτή τη δυνατότητα πρέπει να κάνει μια ηχογραφημένη δήλωση, δηλώνοντας ότι ο χρήστης γνωρίζει ότι «ο πελάτης θα δημιουργήσει και θα χρησιμοποιήσει τη φωνή του».

Επιπλέον, η δυνατότητα μπορεί να χρησιμοποιηθεί μόνο σε ορισμένες περιπτώσεις, τουλάχιστον προς το παρόν. Η Microsoft λέει:

  • Σε εφαρμογές όπου η έξοδος φωνής περιορίζεται και ορίζεται από πελάτες που πληρούν τα κριτήρια καταλληλότητας περιορισμένης πρόσβασης και όπου η φωνή δεν διαβάζει περιεχόμενο που δημιουργείται από χρήστες ή περιεχόμενο ανοιχτού τύπου. Η χρήση φωνητικού μοντέλου πρέπει να παραμείνει εντός της

    ς και η έξοδος δεν πρέπει να μπορεί να δημοσιευτεί ή να κοινοποιηθεί από την εφαρμογή. Μερικά παραδείγματα εφαρμογών που ταιριάζουν σε αυτήν την περιγραφή είναι οι βοηθοί φωνής σε έξυπνες συσκευές και η προσαρμογή μιας φωνής χαρακτήρων στα παιχνίδια.
  • Μεταγλώττιση για ταινίες, τηλεόραση,

    και ήχο μόνο για σενάρια ψυχαγωγίας, όπου οι πελάτες που πληρούν τα κριτήρια καταλληλότητας για περιορισμένη πρόσβαση διατηρούν τον αποκλειστικό έλεγχο της δημιουργίας, της πρόσβασης και της χρήσης των μοντέλων φωνής και της παραγωγής τους.

Οι χρήστες πρέπει επίσης να υπακούουν στη Microsoft

οδηγίες για τη χρήση αυτής της τεχνολογίας

και είναι

κώδικας δεοντολογίας

. Προς το παρόν, αυτή η λειτουργία θα είναι διαθέσιμη μόνο στις περιοχές της Δυτικής

ς, των Ανατολικών ΗΠΑ και της Νοτιοανατολικής Ασίας του κόσμου. Η δημόσια προεπισκόπηση θα γίνει ζωντανή την 1η Δεκεμβρίου.


VIA:

NeoWin.net


Leave A Reply



Cancel Reply

Your email address will not be published.