Το Spotify μπορεί να χρησιμοποιήσει την τεχνητή νοημοσύνη για να δημιουργήσει διαφημίσεις podcast που διαβάζονται από οικοδεσπότη που ακούγονται σαν πραγματικοί άνθρωποι
Related Posts
Με τον DJ AI του Spotify, η εταιρεία εκπαίδευσε μια τεχνητή νοημοσύνη στη φωνή ενός πραγματικού προσώπου – αυτή του επικεφαλής των Πολιτιστικών Συνεργασιών και οικοδεσπότη podcast, Xavier “X” Jernigan. Τώρα, ο streamer μπορεί να μετατρέψει την ίδια τεχνολογία σε διαφήμιση, φαίνεται. Σύμφωνα με δηλώσεις του ιδρυτή του The Ringer, Bill Simmons, η υπηρεσία ροής αναπτύσσει τεχνολογία AI που θα μπορεί να χρησιμοποιεί τη φωνή ενός κεντρικού υπολογιστή podcast για να δημιουργεί διαφημίσεις που διαβάζονται από τον κεντρικό υπολογιστή — χωρίς ο οικοδεσπότης να χρειάζεται πραγματικά να διαβάσει και να ηχογραφήσει το αντίγραφο της διαφήμισης.
Ο Simmons έκανε τις δηλώσεις σε πρόσφατη
επεισόδιο
του “The Bill Simmons Podcast”, λέγοντας, “Θα υπάρχει ένας τρόπος να χρησιμοποιήσω τη φωνή μου για τις διαφημίσεις. Πρέπει προφανώς να δώσεις την έγκριση για τη φωνή, αλλά σου ανοίγει, από διαφημιστική άποψη, όλες αυτές τις διαφορετικές μεγάλες δυνατότητες».
Είπε ότι αυτές οι διαφημίσεις θα μπορούσαν να ανοίξουν νέες ευκαιρίες για podcasters, επειδή θα μπορούσαν να στοχεύσουν γεωγραφικά τις διαφημίσεις – όπως εισιτήρια για μια τοπική εκδήλωση στην πόλη του ακροατή – ή ακόμα και να δημιουργήσουν διαφημίσεις σε διαφορετικές γλώσσες, με την άδεια του οικοδεσπότη.
Τα σχόλιά του αναφέρθηκαν αρχικά από
Semafor
.
Το Ringer αποκτήθηκε από το Spotify το 2020, αλλά δεν ήταν σαφές εάν ο Simmons είχε εξουσιοδότηση να μιλήσει για τα σχέδια του streamer σε αυτόν τον τομέα, καθώς ξεκίνησε λέγοντας: «Δεν νομίζω ότι το Spotify θα θυμώσει μαζί μου γιατί αυτό…» πριν κοινοποιήσετε τις πληροφορίες.
Εφόσον ζητηθεί σχόλιο, το Spotify δεν επιβεβαίωσε ή αρνήθηκε απευθείας την ανάπτυξη της δυνατότητας.
«Πάντα εργαζόμαστε για να βελτιώσουμε την εμπειρία του Spotify και να δοκιμάσουμε νέες προσφορές που ωφελούν τους δημιουργούς, τους διαφημιστές και τους χρήστες», δήλωσε στο TechCrunch εκπρόσωπος του Spotify. «Το τοπίο της τεχνητής νοημοσύνης εξελίσσεται γρήγορα και το Spotify, το οποίο έχει μακρά ιστορία καινοτομίας, εξερευνά μια ευρεία γκάμα εφαρμογών, συμπεριλαμβανομένης της εξαιρετικά δημοφιλής δυνατότητας AI DJ.
Υπήρξε αύξηση 500 τοις εκατό
στον αριθμό των καθημερινών επεισοδίων podcast που συζητούσαν την τεχνητή νοημοσύνη τον περασμένο μήνα, συμπεριλαμβανομένης της συνομιλίας μεταξύ του Derek Thompson και του Bill Simmons. Η διαφήμιση αντιπροσωπεύει έναν ενδιαφέροντα καμβά για μελλοντική εξερεύνηση, αλλά δεν έχουμε τίποτα να ανακοινώσουμε αυτή τη στιγμή.”
Το υποκείμενο αυτού του σχολίου δείχνει ότι οι δηλώσεις του Simmons μπορεί να ήταν κάπως πρόωρες.
Τούτου λεχθέντος, το Spotify έχει ήδη υπονοήσει ότι ο DJ AI στην εφαρμογή σήμερα δεν θα είναι ο μόνος που θα συναντούσαν οι χρήστες φωνής AI στο μέλλον. Όταν ο Jernigan ρωτήθηκε πρόσφατα για τα σχέδια του Spotify να συνεργαστεί με άλλα μοντέλα φωνής στο μέλλον, πείραξε, «μείνετε συντονισμένοι».
Ο streamer έχει επίσης επενδύσει αθόρυβα στην ανάπτυξη και έρευνα AI, με μια ομάδα μερικών εκατοντάδων να εργάζεται τώρα σε τομείς όπως η εξατομίκευση και η μηχανική μάθηση. Επιπλέον, η ομάδα χρησιμοποιεί το μοντέλο OpenAI και ερευνά τις δυνατότητες σε μοντέλα μεγάλων γλωσσών, γενετική φωνή και πολλά άλλα.
Η ικανότητα του Spotify να δημιουργεί φωνές τεχνητής νοημοσύνης αξιοποιεί ειδικά την IP από την εξαγορά της Sonatic από το Spotify το 2022 σε συνδυασμό με την τεχνολογία OpenAI. Μπορεί να επιλέξει να χρησιμοποιήσει τη δική της εσωτερική τεχνολογία AI στο μέλλον, μας είπε πρόσφατα η εταιρεία.
Για να δημιουργήσει τον AI DJ, το Spotify έβαλε τον Jernigan να πάει σε ένα στούντιο για να παράγει ηχογραφήσεις υψηλής ποιότητας, συμπεριλαμβανομένων εκείνων όπου διάβαζε γραμμές με διαφορετικούς ρυθμούς και συναισθήματα. Διατήρησε τις φυσικές του παύσεις και αναπνοές στις ηχογραφήσεις και ήταν βέβαιο ότι θα χρησιμοποιούσε τη γλώσσα που ήδη έλεγε – όπως «μελωδίες» ή «bangers» αντί για «τραγούδια». Όλα αυτά στη συνέχεια τροφοδοτούνται στο μοντέλο AI που στη συνέχεια δημιουργεί τη φωνή AI.
Η εταιρεία εξήγησε λεπτομερώς τη διαδικασία με περισσότερες λεπτομέρειες ή είπε πόσος χρόνος χρειάστηκε για να μετατραπούν οι ηχογραφήσεις του Jernigan σε DJ AI. Όμως, δεδομένου του πιθανού ενδιαφέροντός της να μετατρέψει τους κεντρικούς υπολογιστές podcast σε μοντέλα φωνής AI, πρέπει να αναπτύσσει μια αρκετά αποτελεσματική διαδικασία εδώ – και μια διαδικασία που θα μπορούσε ενδεχομένως να αξιοποιήσει τις υπάρχουσες ηχογραφήσεις ενός podcaster.
Αν και οι φωνές AI δεν είναι καινούριες, η ικανότητα να ακούγονται σαν αληθινοί άνθρωποι είναι μια πιο σύγχρονη εξέλιξη. Πριν από μερικά χρόνια, η Google εντυπωσίασε τον κόσμο με μια ανθρώπινη τεχνητή νοημοσύνη στο Duplex που μπορούσε να καλέσει εστιατόρια για να κάνετε κράτηση. Αλλά η τεχνολογία αρχικά επικρίθηκε για την έλλειψη αποκάλυψης. Αυτόν τον μήνα, η Apple εισήγαγε μια δυνατότητα προσβασιμότητας, την Personal Vocie, η οποία μπορεί να μιμηθεί τη φωνή του χρήστη αφού πρώτα εκπαιδεύσει το μοντέλο, αφιερώνοντας 15 λεπτά διαβάζοντας τυχαία επιλεγμένα μηνύματα, τα οποία επεξεργάζονται τοπικά στη συσκευή του.

