Η Meta αποκαλύπτει ένα εργαλείο τεχνητής νοημοσύνης που θα μπορούσε να σας επιτρέψει να μιλάτε σε έξι γλώσσες

Αν και η

και η

τείνουν να κυριαρχούν στους τίτλους που σχετίζονται με την τεχνητή νοημοσύνη, πολλές άλλες εταιρείες σπεύδουν επίσης να αναπτύξουν προϊόντα τεχνητής νοημοσύνης, συμπεριλαμβανομένου του

. Για το σκοπό αυτό, ο γίγαντας των

μόλις εισήγαγε την πρώτη του είσοδο στον χώρο.

Σήμερα ο Μέτα αποκάλυψε σε α

ανάρτηση

ότι εργάζεται σε ένα εργαλείο δημιουργίας τεχνητής νοημοσύνης για ομιλία. Με την ονομασία Voicebox, η εταιρεία λέει ότι το εργαλείο της μπορεί να εκτελέσει μια ποικιλία εργασιών παραγωγής ομιλίας «που δεν είχε ειδικά εκπαιδευτεί να κάνει μέσω της μάθησης εντός του πλαισίου».

Σύμφωνα με τη Meta, ορισμένες από αυτές τις εργασίες περιλαμβάνουν τη σύνθεση κειμένου σε ομιλία εντός πλαισίου, την επεξεργασία ομιλίας, τη μείωση θορύβου, τη διαγλωσσική μεταφορά στυλ και τη δειγματοληψία ποικίλης ομιλίας. Δείτε πώς περιγράφει η εταιρεία αυτά τα χαρακτηριστικά:


  • Μετατροπή κειμένου σε ομιλία σε πλαίσιο:

    Χρησιμοποιεί δείγματα ήχου διάρκειας δύο δευτερολέπτων για να ταιριάζει με το στυλ ήχου και χρήση για τη δημιουργία κειμένου σε ομιλία.

  • Επεξεργασία ομιλίας και μείωση θορύβου:

    Το εργαλείο μπορεί να αναδημιουργήσει ένα τμήμα της ομιλίας που διακόπηκε από θόρυβο ή να αντικαταστήσει τις λέξεις που ακούγονται λάθος χωρίς να χρειάζεται να ηχογραφήσει ξανά.

  • Διαγλωσσική μεταφορά στυλ:

    Το εργαλείο μπορεί να πάρει ένα δείγμα ομιλίας και ένα απόσπασμα κειμένου για να δημιουργήσει μια ανάγνωση του κειμένου στα Αγγλικά, Γαλλικά, Γερμανικά, Ισπανικά, Πολωνικά ή Πορτογαλικά.

  • Διάφορη δειγματοληψία ομιλίας:

    Χρησιμοποιεί διαφορετικά δεδομένα για να δημιουργήσει ομιλία πιο αντιπροσωπευτική του τρόπου με τον οποίο μιλάνε οι άνθρωποι στις έξι γλώσσες που αναφέρθηκαν προηγουμένως.

Ο οργανισμός λέει ότι το Voicebox είναι μέρος της έρευνάς του για τη γενετική τεχνητή νοημοσύνη. Όσον αφορά τη χρησιμότητά του, η Meta αναφέρει:

Στο μέλλον, τα μοντέλα πολλαπλών χρήσεων τεχνητής νοημοσύνης, όπως το Voicebox, θα μπορούσαν να δίνουν φωνές με φυσικό ήχο σε εικονικούς βοηθούς και χαρακτήρες που δεν είναι παίκτες στο μετασύμπαν. Θα μπορούσαν να επιτρέψουν σε άτομα με προβλήματα όρασης να ακούν γραπτά μηνύματα από φίλους που διαβάζονται από την τεχνητή νοημοσύνη στη φωνή τους, να δίνουν στους δημιουργούς νέα εργαλεία για να δημιουργούν και να επεξεργάζονται εύκολα κομμάτια ήχου για βίντεο και πολλά άλλα.

Αν θέλετε να δείτε ένα παράδειγμα του Voicebox, μπορείτε να μεταβείτε στο ιστολόγιο του Meta και να παρακολουθήσετε το βίντεο που δημοσιεύτηκε εκεί.


AndroidAuthority.com



You might also like


Leave A Reply



Cancel Reply

Your email address will not be published.