Το Acapela επιτρέπει σε οποιονδήποτε να δημιουργήσει αντίγραφα ασφαλείας της φωνής του δωρεάν μέσα σε λίγα λεπτά — για κάθε ενδεχόμενο

On

Μάι 8, 2023

Ο David Tennant πρωταγωνιστεί στις προσφορές για την 60η…

This Week in Apps: Google I/O 2023 recap; Android, apps and…

Το Netflix ακυρώνει την Lockwood & Co. μετά από μία…

Η συνθετική ομιλία μπορεί να είναι ένα τρομακτικό αντικείμενο στις μέρες μας όταν συνδυάζεται με deepfakes και άλλες παραπλανήσεις τεχνητής νοημοσύνης, αλλά είναι επίσης ένα απαραίτητο εργαλείο για όποιον δεν μπορεί πλέον να μιλήσει μόνος του. Το Acapela Group έχει αυτούς τους ανθρώπους στο μυαλό του με το νέο του

«Η δική μου φωνή»

υπηρεσία, η οποία επιτρέπει σε οποιονδήποτε

εκπαιδεύστε ένα φωνητικό προφίλ AI

δωρεάν.

Η Acapela βρίσκεται στον χώρο της μετατροπής κειμένου σε ομιλία για περίπου 25 χρόνια και πρόσφατα αποκτήθηκε από τον γίγαντα της τεχνολογίας προσβασιμότητας Tobii Dynavox, αν και εξακολουθούν να λειτουργούν ανεξάρτητα.

Όπως πολλές βιομηχανίες, η προσβασιμότητα έχει επηρεαστεί σε μεγάλο βαθμό από την εμφάνιση διαδικασιών μηχανικής μάθησης σε κλίμακα καταναλωτή. Πριν από 7 ή 8 χρόνια, θυμάται ο συνιδρυτής της Acapela, Remy Cadic, δεν ήταν απλώς κουραστικό να προσαρμόσετε μια συνθετική φωνή για τον εαυτό σας, αλλά τα αποτελέσματα δεν ήταν ιδιαίτερα καλά.

«Ήταν πολύ χρονοβόρο – ο ασθενής έπρεπε να προπονηθεί για 8 ώρες. Τώρα μπορούμε να δημιουργήσουμε μια φωνή με μόλις 50 ηχογραφημένες προτάσεις. διαρκεί περίπου 10 λεπτά και η φωνή είναι έτοιμη την επόμενη μέρα», είπε. “Υπάρχει σίγουρα μια επανάσταση σε εξέλιξη με τις νευρικές τεχνικές μετατροπής κειμένου σε ομιλία.”

Δεν αστειεύονταν για το πόσο γρήγορο και εύκολο είναι: πέρασα ο ίδιος τη νέα διαδικασία «η δική μου φωνή» και ήταν πραγματικά μόλις 50 σύντομες προτάσεις, που προέρχονται από ένα (τυχαίο, φαινόταν) σώμα μυθιστορημάτων, βιβλίων συνταγών , και άρθρα. Η διεπαφή ηχογράφησης ήταν απλή και εύκολη στην πλοήγηση, και σίγουρα, μια μέρα περίπου αργότερα η φωνή μου ήταν έτοιμη για χρήση. Η ποιότητα είναι καλή — όχι ασυνήθιστη όπως μπορεί να υπάρχουν ορισμένα μοντέλα εκεί έξω, αλλά σαφώς η δική μου φωνή (όπως διαφημίζεται) και ικανή να χειριστεί οποιαδήποτε πρόταση της έριξα στη σελίδα επίδειξης.

Τώρα που είναι εκεί, αν ποτέ το χρειαστώ, μπορώ να πάω και να το κατεβάσω έναντι χρέωσης για να το χρησιμοποιήσω σε οποιοδήποτε συμβατό σύστημα παραγωγής ομιλίας. Προφανώς αυτό περιλαμβάνει το TD Talk και τις συσκευές της Tobii Dynavox. η εταιρία

μόλις κυκλοφόρησε ένα νέο την περασμένη εβδομάδα

στην πραγματικότητα — αυτά τα πράγματα γίνονται αρκετά κομψά.

Η Delaina δοκιμάζει τη νέα συσκευή Tobii-Dynavox.

Και αυτό είναι το πραγματικό νόημα όλων αυτών — δεν είναι μια τεχνική επίδειξη της δύναμης της τεχνολογίας νευρωνικής φωνής ή ένα demo που επιτρέπει σε οποιονδήποτε να το τροφοδοτήσει με μια φωνή διασημοτήτων για να κλωνοποιηθεί. Είναι ένα εργαλείο που δημιουργήθηκε ειδικά για άτομα που μέχρι πρόσφατα μπορεί να μην είχαν επιλογές ή στην καλύτερη περίπτωση μια δύσκολη, περίπλοκη διαδικασία αν ήθελαν να διατηρήσουν τη φωνή τους.

Πολλοί που αντιμετωπίζουν εκφυλιστικές καταστάσεις, καρκίνους ή ορισμένες διαδικασίες γνωρίζουν ότι μέσα σε λίγους μήνες ή χρόνια μπορεί να μην μπορούν να μιλήσουν καλά ή καθόλου πια. Το να κάνουν όσο το δυνατόν πιο εύκολη τη διαδικασία τραπεζικής φωνής είναι μια υπηρεσία που πολλοί θα εκτιμήσουν.

«Ένα μεγάλο πλεονέκτημα είναι ότι προσαρμόζουμε επίσης για παιδιά — κάναμε το σενάριο ηχογράφησης πιο ευανάγνωστο και ρυθμίσαμε το σύστημα για να βελτιώσουμε την ποιότητα των συνθετικών φωνών των παιδιών. Ήμασταν οι πρώτοι στον κόσμο που το κάναμε αυτό και συνεχίζουμε να πηγαίνουμε προς αυτή την κατεύθυνση», είπε ο Cadic.

Το να μπορείς να ηχογραφήσεις και να ηχογραφήσεις εκ νέου ή να γεράσεις τεχνητά την τραπεζική φωνή είναι μια νέα και προκλητική ικανότητα, αλλά φαίνεται να έχει αποτελέσματα:

Η συμβατότητα με συσκευές εκτός σύνδεσης που δεν διαθέτουν το πιο πρόσφατο τσιπ επεξεργασίας νευρώνων είναι επίσης βασικός παράγοντας διαφοροποίησης. “Υπάρχουν διαδικτυακές λύσεις όπου είναι εύκολο να δημιουργηθεί φωνή, αλλά είναι διαθέσιμη μόνο μέσω του cloud και αυτό δεν είναι πρακτικό”, είπε.

Η εταιρεία ανακάλυψε επίσης ότι η διαφορετικότητα και η στοχαστικότητα στη διαδικασία εκπαίδευσης είναι εξίσου σημαντική με άλλες εφαρμογές τεχνητής νοημοσύνης. Ένα ζήτημα που επισήμανε ο Cadic με ορισμένες εξαιρετικά γρήγορες τεχνικές εκπαίδευσης είναι ότι «θα προσπαθήσει λίγο πολύ να βρει τον ομιλητή στο εκπαιδευτικό υλικό που είναι πιο κοντά στον χρήστη. Αλλά αν δεν υπάρχει ένα ηχείο στην προπόνηση κοντά στην αρχική φωνή, απλά δεν θα ακούγεται σαν αυτό.”

Ο διευθυντής προϊόντων Acapela, Nicolas Mazars, πρόσθεσε ότι, όπως πολλά προβλήματα τεχνητής νοημοσύνης με τη ρίζα τους στα ανεπαρκή δεδομένα εκπαίδευσης, αυτό δεν είναι ομοιόμορφα κατανεμημένο: «Αυτή η διαδικασία λειτουργεί καλά για τον μέσο 50χρονο λευκό άντρα, αλλά όχι εάν είστε Αφροαμερικανός, ή δεν μιλάς καλά αγγλικά. Εργαζόμαστε σε 23 γλώσσες και έχουμε πολλούς χρήστες με ειδικές ανάγκες. Προσπαθούμε να βασιστούμε στα σχόλια των χρηστών και να αναπτύξουμε κάτι για αυτούς, από αυτούς».

Η διαδικασία καταγραφής και τραπεζικής είναι δωρεάν.

μπορείτε να εγγραφείτε για λογαριασμό εδώ

και εκπαιδεύστε τη δική σας συνθετική φωνή μέσα σε λίγα λεπτά. Πληρώνετε μόνο εάν θέλετε να το κατεβάσετε και να το εγκαταστήσετε σε μια συσκευή.

techcrunch.com