Συνεχίστε με τη γεννήτρια μουσικής της Google με τεχνητή νοημοσύνη

Μπορεί το AI να λειτουργήσει αντίστροφα από μια περιγραφή κειμένου για να δημιουργήσει ένα συνεκτικό τραγούδι; Αυτή είναι η προϋπόθεση του

MusicLM

το εργαλείο δημιουργίας μουσικής με τεχνητή νοημοσύνη που κυκλοφόρησε χθες η Google κατά την έναρξη της διάσκεψης I/O.

Το MusicLM, το οποίο εκπαιδεύτηκε σε εκατοντάδες χιλιάδες ώρες ήχου για να μάθει να δημιουργεί νέα μουσική σε μια σειρά από στυλ, είναι διαθέσιμο σε προεπισκόπηση μέσω της εφαρμογής AI Test Kitchen της Google. Το έπαιζα την τελευταία μέρα περίπου, όπως και μερικοί από τους συναδέλφους μου.

Η ετυμηγορία? Ας πούμε απλώς ότι η MusicLM δεν έρχεται σύντομα για δουλειές μουσικών.

Η χρήση του MusicLM στο Test Kitchen είναι αρκετά απλή. Μόλις εγκριθείτε για πρόσβαση, θα εμφανιστεί ένα πλαίσιο κειμένου όπου μπορείτε να εισαγάγετε μια περιγραφή τραγουδιού —όσο λεπτομερής θέλετε— και να ζητήσετε από το σύστημα να δημιουργήσει δύο εκδόσεις του τραγουδιού. Και τα δύο μπορούν να ληφθούν για ακρόαση εκτός σύνδεσης, αλλά η Google σάς ενθαρρύνει να “επιδοκιμάσετε” ένα από τα κομμάτια για να βελτιώσετε την απόδοση του AI.


Συντελεστές εικόνας:

Google

Όταν διασκέδασα για πρώτη φορά το MusicLM τον Ιανουάριο, πριν κυκλοφορήσει, έγραψα ότι τα τραγούδια του συστήματος ακούγονταν κάτι σαν να συνθέτει ένας άνθρωπος καλλιτέχνης — αν και όχι απαραίτητα ως μουσικά εφευρετικά ή συνεκτικά. Τώρα, δεν μπορώ να πω ότι επιμένω πλήρως σε αυτά τα λόγια, καθώς φαίνεται ξεκάθαρο ότι έγινε κάποια σοβαρή συλλογή κερασιών με δείγματα από νωρίτερα μέσα στη χρονιά.

Τα περισσότερα τραγούδια που έχω δημιουργήσει με το MusicLM ήχο βατό στην καλύτερη περίπτωση — και στη χειρότερη σαν ένα τετράχρονο παιδί που αφήνεται ελεύθερο σε

ΚΑΛΙΑΚΟΥΔΑ

. Έχω κολλήσει κυρίως στο EDM, προσπαθώντας να αποδώσω κάτι με δομή και μια ευδιάκριτη (συν ευχάριστη, ιδανικά) μελωδία. Αλλά ανεξάρτητα από το πόσο αξιοπρεπές – ακόμα και καλό! — ακούγεται η αρχή των τραγουδιών της MusicLM, έρχεται μια στιγμή που καταρρέουν με έναν πολύ εμφανή, μουσικά δυσάρεστο τρόπο.

Για παράδειγμα, πάρτε αυτό το δείγμα, που δημιουργήθηκε χρησιμοποιώντας την προτροπή “EDM τραγούδι σε ένα ελαφρύ, αισιόδοξο και ευάερο στυλ, καλό για χορό”. Ξεκινά πολλά υποσχόμενο, με εντυπωσιακή γραμμή βάσης και στοιχεία ενός κλασικού σινγκλ Daft Punk. Αλλά προς τη μέση του κομματιού, ξεφεύγει από την πορεία του – πρακτικά ένα άλλο είδος.



Ακολουθεί ένα σόλο πιάνου από μια πιο απλή προτροπή — «ρομαντική και συναισθηματική μουσική για πιάνο». Τα ανταλλακτικά, θα παρατηρήσετε, ακούγονται καλά και ωραία — εξαιρετικά ακόμη, τουλάχιστον όσον αφορά τη δουλειά των δακτύλων. Αλλά τότε είναι σαν να κυριεύεται ο πιανίστας από μανία. Ένα συνονθύλευμα νότες αργότερα, και το τραγούδι παίρνει μια ριζικά διαφορετική κατεύθυνση, σαν από νέα παρτιτούρα — αν και σύμφωνα με τις γραμμές του πρωτότυπου.

Δοκίμασα το χέρι της MusicLM στα chiptunes για το καλό, υποθέτοντας ότι η τεχνητή νοημοσύνη μπορεί να περάσει πιο εύκολα με τραγούδια πιο βασικής κατασκευής. Χωρίς ζάρια. Το αποτέλεσμα (παρακάτω), αν και πιασάρικο σε μέρη, έληξε εξίσου τυχαία με τα άλλα δείγματα.

Το θετικό είναι ότι το MusicLM, συνολικά, κάνει πολύ καλύτερη δουλειά από το Jukebox, την προσπάθεια του OpenAI πριν από αρκετά χρόνια να δημιουργήσει μια γεννήτρια μουσικής AI. Σε αντίθεση με το MusicLM, τα τραγούδια που παρήγαγε το Jukebox δεν είχαν τυπικά μουσικά στοιχεία όπως ρεφρέν που επαναλαμβάνονταν και συχνά περιείχαν

ανοησίες στίχοι

. Τα τραγούδια που παράγονται από τη MusicLM περιέχουν επίσης λιγότερα τεχνουργήματα, και γενικά αισθάνονται σαν ένα βήμα προς τα πάνω όσον αφορά την πιστότητα.

Η εμφάνιση του Dance Diffusion έρχεται αρκετά χρόνια αφότου το OpenAI, το εργαστήριο με έδρα το Σαν Φρανσίσκο πίσω από το DALL-E 2, παρουσίασε λεπτομερώς το μεγαλειώδες πείραμά του με τη γενιά μουσικής, που ονομάστηκε Jukebox. Δεδομένου ενός είδους, ενός καλλιτέχνη και ενός αποσπάσματος στίχων, το Jukebox θα μπορούσε να δημιουργήσει σχετικά συνεκτική μουσική με φωνητικά. Αλλά τα τραγούδια που παρήγαγε το Jukebox δεν είχαν μεγαλύτερες μουσικές δομές όπως τα ρεφρέν που επαναλαμβάνονταν και συχνά περιείχαν

ανοησίες στίχοι

.

Επιπλέον, η χρησιμότητα του MusicLM είναι λίγο περιορισμένη, χάρη στους τεχνητούς περιορισμούς στην πλευρά των προτροπών. Δεν θα δημιουργήσει μουσική με καλλιτέχνες ή φωνητικά, ούτε καν στο

στυλ

συγκεκριμένων μουσικών. Δοκιμάστε να πληκτρολογήσετε ένα μήνυμα όπως “κατά μήκος των γραμμών του Barry Manilow” και δεν θα λάβετε τίποτα παρά μόνο ένα μήνυμα σφάλματος.

MusicLM


Συντελεστές εικόνας:

Google

Ο λόγος είναι μάλλον νόμιμος. Η Deepfaked μουσική βρίσκεται σε θολό νομικό έδαφος, σε τελική ανάλυση, με ορισμένους στη μουσική βιομηχανία να υποστηρίζουν ότι οι παραγωγοί μουσικής AI, όπως το MusicLM, παραβιάζουν τα πνευματικά δικαιώματα της μουσικής. Μπορεί να μην περάσει πολύς καιρός πριν υπάρξει κάποια σαφήνεια για το θέμα – πολλές αγωγές που θα περάσουν από τα δικαστήρια πιθανότατα θα έχουν αντίκτυπο στην τεχνητή νοημοσύνη που παράγει μουσική, συμπεριλαμβανομένης μιας που σχετίζεται με τα δικαιώματα των καλλιτεχνών των οποίων η δουλειά χρησιμοποιείται για την εκπαίδευση συστημάτων τεχνητής νοημοσύνης χωρίς γνώση ή συναίνεση. Ο χρόνος θα δείξει.

Προς το παρόν, όμως, θα υποστήριζα ότι οι καλλιτέχνες δεν έχουν πολλούς λόγους να ανησυχούν. Το MusicLM, όπως και οι άλλες γεννήτριες μουσικής AI που κυκλοφόρησαν πρόσφατα, χρησιμεύει περισσότερο από οτιδήποτε άλλο ως παράδειγμα του πόσο μακριά πρέπει να φτάσει η τεχνολογία.

Διαβάστε περισσότερα για το Google I/O 2023 στο TechCrunch


techcrunch.com



You might also like


Leave A Reply



Cancel Reply

Your email address will not be published.