Modern technology gives us many things.

Το AI ανοιχτού κώδικα «MusicGen» της Meta είναι σαν το ChatGPT για Tunes

Η ητή νοημοσύνη έχει καταφέρει να παρεισφρήσει στις περισσότερες καλλιτεχνικές προσπάθειες, και τώρα έχει έρθει πλήρως για τη μουσική βιομηχανία. Η Meta ανακοίνωσε τώρα την κυκλοφορία της έκδοσης ανοιχτού κώδικα του μοντέλου τεχνητής νοημοσύνης της μουσικής γενιάς που χρησιμοποιεί απλές προτροπές για τη δημιουργία μουσικής όπως το ChatGPT ή άλλο κείμενο δημιουργίας τεχνητής νοημοσύνης που βασίζεται σε μοντέλα μεγάλων γλωσσών.

Ο Felix Kreuk, ένας ερευνητής μηχανικός τεχνητής νοημοσύνης στο Meta, έδειξε τις δυνατότητες του «MusicGen» σε ένα νήμα Twitter τέλη της περασμένης εβδομάδας. Το σύστημα μπορεί να πάρει λίγη μουσική και να την τροποποιήσει, όπως να φτιάξει ένα ποπ τραγούδι της δεκαετίας του '80 από ένα κλασικό μουσικό ρεφρέν.

Όπως περιγράφεται από τον Kreuk, το μοντέλο χρησιμοποιεί έναν ενδείκτη ήχου EnCodec που βασίζεται σε ένα μοντέλο γλώσσας μετασχηιστή. Οι χρήστες μπορούν να κάνουν επίδειξη του MusicGen μέσω Το API του Hugging Face, ωστόσο, η δημιουργία μουσικής μπορεί να διαρκέσει λίγο, ανάλογα με το πόσοι χρήστες τη χρησιμοποιούν ταυτόχρονα. Μπορείτε να χρησιμοποιήσετε τον ιστότοπο Hugging Face για να δημιουργήσετε τη δική σας παρουσία του μοντέλου για πολύ πιο γρήγορες εξόδους. Διαφορετικά, μπορείτε κατεβάστε τον κωδικό και τρέξτε το μόνοι σας εάν έχετε την τεχνογνωσία και την εξέδρα για να το υποστηρίξετε.

Οι δικές μας δοκιμές περιελάμβαναν μια συνθετική «συμφωνική απόδοση του θέματος χαρούμενα γενέθλια» και ένα μάλλον τρακαρισμένο «Lo-fi hip hop κομμάτι με δείγματα από τη φύση, συμπεριλαμβανομένων των γρύλων». Δεν περιλαμβάνονται στίχοι στα τραγούδια από προεπιλογή. Το Gizmodo δοκίμασε το σύστημα δοκιμάζοντας το δικό μας προαιρετικό ηχητικό κομμάτι με στίχους από το δικό σας αληθινά (αν θέλετε πραγματικά να τονίσετε τα αυτιά σας στη φωνή μου που ραγίζει το γυαλί, μπορείτε να το βρείτε στο προηγούμενες δοκιμές της δυνατότητας καραόκε της Apple Music). Η προτροπή «τραγούδι Grunge με βαρύ μπάσο και συνοδεία βιολιού» βγήκε πιο τρακαρισμένη με τους πρόσθετους στίχους παρά η ίδια προτροπή που τρέχει χωρίς αυτό.

Δεν είναι σαφές πόσο κατανοεί η τεχνητή νοημοσύνη ορισμένους συνθέτες. Του ζητήσαμε να δημιουργήσει μια «παρτιτούρα του Hans Zimmer για μια μεσαιωνική ταινία steampunk», αν και είναι δύσκολο να πούμε εάν η τεχνητή νοημοσύνη θα μπορούσε πραγματικά να αναπαράγει τα θέματα του Zimmer.

Ο Χανς Ζίμερ σκοράρει για μια μεσαιωνική ταινία steampunk Clip

Ο Χανς Ζίμερ σκοράρει για μια μεσαιωνική ταινία steampunk Clip

Ενώ πολλά άλλα μοντέλα εκτελούν τη δημιουργία κειμένου, τη σύνθεση φωνής, τη δημιουργία έργων τέχνης και ακόμη και τα σύντομα βίντεο, δεν έχουν κυκλοφορήσει πολλά ποιοτικά παραδείγματα παραγωγής μουσικής στο κοινό. Σύμφωνα με το συνοδευτικό ερευνητικό έγγραφο διαθέσιμο στο αποθετήριο προεκτύπωσης arXiv, μια από τις κύριες προκλήσεις με τη μουσική είναι ότι απαιτεί την εκτέλεση του πλήρους φάσματος συχνοτήτων, κάτι που απαιτεί πιο έντονη δειγματοληψία. Αυτό για να μην αναφέρουμε τις περίπλοκες δομές και τα επικαλυπτόμενα όργανα που υπάρχουν στη μουσική.

Η Meta συνέκρινε επίσης το σύστημά της με το μοντέλο κειμένου σε μουσική MusicLM της Google. Το Meta έχει το δικό του δική σελίδα παρουσιάζοντας τα χαρακτηριστικά των δύο μοντέλων για άμεση σύγκριση.

Αν και για τους καλλιτέχνες, αυτό που μπορεί να είναι πιο ανησυχητικό για το μοντέλο είναι τα δεδομένα εκπαίδευσής του. Σύμφωνα με το ερευνητικό έγγραφο, το MusicGen εκπαιδεύτηκε σε 20.000 ώρες αδειοδοτημένης μουσικής από ένα εσωτερικό σύνολο δεδομένων που περιλαμβάνει 10.000 μουσικά κομ. Επιπλέον, η εταιρεία χρησιμοποίησε περίπου 390.000 κομμάτια μόνο με όργανα που εμφανίζονται στο Shutterstock και το Pond5. Οι ερευνητές του Meta ισχυρίστηκαν ότι όλη η μουσική στην οποία εκπαιδεύεται το μοντέλο τους «καλύπτεται από νομικές συμφωνίες με τους κατόχους δικαιωμάτων». Αυτό περιλαμβάνει μια συμφωνία με την Shutterstock.

Shutterstock υπέγραψε συμφωνία με τον δημιουργό του DALL-E OpenAI πέρυσι, και ήδη έχει το δικό του εργαλείο δημιουργίας εικόνας AI που είναι προεκπαιδευμένο στις εικόνες όλων των συντελεστών. Ωστόσο, αυτό δεν σημαίνει ότι οι καλλιτέχνες είναι απαραίτητα χαρούμενοι που η δουλειά τους χρησιμοποιείται για την εκπαίδευση της τεχνητής νοημοσύνης. Κάποιοι καλλιτέχνες έχουν έχει ήδη μηνύσει μερικές από τις μεγαλύτερες εταιρείες τέχνης τεχνητής νοημοσύνης όπως το και το Midjourney, με ισχυρισμούς που στοχεύουν άμεσα στο πώς τα σύνολα δεδομένων AI απορροφούν μαζικές ποσότητες αδειοδοτημένου περιεχομένου χωρίς άδεια χρήστη. Αυτό γίνεται πιο περίπλοκο όταν μεγάλες εταιρείες τεχνολογίας όπως η Meta μπορούν να αντέξουν οικονομικά να αδειοδοτήσουν δημιουργικό για χρήση στη γενιά της AI. Για έναν χρήστη, ο κίνδυνος ότι η τεχνητή νοημοσύνη πλαστογραφεί απευθείας το έργο άλλων μουσικών, με άδεια ή όχι, αργαλειός στο βάθος.

Όπως οι περισσότερες μεγάλες εταιρείες τεχνολογίας, Ο Meta έχει κάνει τεχνητή νοημοσύνη ως αργά. ντοσε σύγκριση με Τα μεγάλα αδέρφια της στον τομέα της τεχνολογίας, ο Meta δήλωσε ότι θέλει κυκλοφορήσει περισσότερο ανοιχτού κώδικα μοντέλα στον αιθέρα για οποιονδήποτε για να παραλάβετε και να χρησιμοποιήσετε. Είναι μια ενδιαφέρουσα τακτική για να κάνετε την εταιρεία να ξεχωρίζει από τα OpenAI, Microsoft και Google που έχουν γίνει όλο και πιο μυστικοπαθείς. Ακόμη, δεν σημαίνει ότι ο Meta μπορεί να αποφύγει Η διαμάχη, ειδικά όσον αφορά τα δημιουργικά, οι εταιρείες θα χρησιμοποιήσουν την τεχνητή νοημοσύνη για καλλιτεχνικές εργασίες αντί για αληθινά δημιουργικά. Στην εργασία τους, οι ερευνητές της Meta αναγνώρισαν ότι η τεχνητή νοημοσύνη «μπορεί να αντιπροσωπεύει έναν αθέμιτο ανταγωνισμό για τους καλλιτέχνες.“Βut αυτοί ισχυρίστηκε ότι η χρήση ανοιχτών μοντέλων μπορεί να δώσει μουσική ερασιτέχνες και επαγγελματίες νέα εργαλεία για τη δημιουργία μουσικής.





gizmodo.com

Follow TechWar.gr on Google News

Απάντηση