Η Meta λανσάρει μια γεννήτρια μουσικής ανοιχτού κώδικα AI – Review Geek
ioat/Shutterstock.com
Το
Meta
μας δίνει μια ματιά στο μέλλον με το MusicGen, ένα νέο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα που μπορεί να ξετυλίξει σύντομα τραγούδια με βάση τη συμβολή σας. Αν και απέχει πολύ από το τελικό προϊόν, το MusicGen είναι εντυπωσιακό και μπορείτε να ρυθμίσετε το AI με μια υπάρχουσα μελωδία για να βελτιώσετε τα αποτελέσματά του.
Για να δοκιμάσετε το MusicGen AI, απλώς επισκεφτείτε το
Ιστότοπος Hugging Face
Η τεχνητή νοημοσύνη βγάζει ένα κομμάτι διάρκειας μόλις 12 δευτερολέπτων και, φυσικά, τα αποτελέσματα είναι εξαιρετικά ασυνεπή. Οι απλές προτροπές φαίνεται να λειτουργούν καλύτερα. Και αν θέλετε να γίνετε πολύ συγκεκριμένοι με το AI, μπορείτε να του δώσετε ένα αρχείο μουσικής για ένα υπάρχον τραγούδι. Στη συνέχεια, η τεχνητή νοημοσύνη θα «ρυθμιστεί» στη μελωδία του τραγουδιού, αν και δεν θα αποθηκεύσει κανένα μεταφορτωμένο τραγούδι στη βάση δεδομένων του.
Παρουσιάζουμε το MusicGen: Ένα απλό και ελεγχόμενο μοντέλο παραγωγής μουσικής. Το MusicGen μπορεί να προκληθεί τόσο από κείμενο όσο και από μελωδία.
Κυκλοφορούμε κώδικα (MIT) και μοντέλα (CC-BY NC) για ανοιχτή έρευνα, αναπαραγωγιμότητα και για τη μουσική κοινότητα:
https://t.co/OkYjL4xDN7
pic.twitter.com/h1l4LGzYgf
— Felix Kreuk (@FelixKreuk)
9 Ιουνίου 2023
Όπως το MusicLM AI της
Google
, το οποίο δοκιμάσαμε τον περασμένο μήνα, η έξοδος του MusicGen μπορεί να ακούγεται λίγο υδαρής, ομιχλώδης ή κηλιδωμένη. Τα όργανα δεν έχουν έναν τόνο ορισμού, ειδικά όταν δίνετε στο AI μια φιλόδοξη προτροπή. Από τις δοκιμές μου, το AI σπάνια κάνει καλή δουλειά με όλα τα «όργανα» που παίζει, αν και συνήθως έχει ένα ή δύο καλά καθορισμένα και ευκρινή όργανα.
Προτροπή: Hip-Hop δεκαετίας του ’90 με Vibraphone (Ακατάστατο, ασαφές μπάσο.)
Προτροπή: Hair Metal με ρυθμό Cumbia (δεν είμαι σίγουρος τι περίμενα. Πολύ ωραίο.)
Ο Meta λέει ότι η MusicGen εκπαιδεύτηκε σε 20.000 ώρες
αδειούχος
μουσική, συμπεριλαμβανομένων κομματιών από τις βιβλιοθήκες Shutterstock και Pond5—αυτό είναι σημαντικό να το έχετε κατά νου, καθώς η μουσική στοκ τείνει να έχει μια συγκεκριμένη ατμόσφαιρα και συνήθως κλίνει προς τα ηλεκτρονικά, hip-hop, κλασικά και country είδη. Είμαι βέβαιος ότι το σύνολο δεδομένων του AI περιέχει μια ποικιλία από πολύ διαφορετικά κομμάτια, αλλά μπορεί να χειρίζεται ορισμένα είδη καλύτερα από άλλα.
Μπορείτε να δοκιμάσετε το MusicGen στο
Ιστότοπος Hugging Face
(αν και μπορεί να χρειαστεί λίγος χρόνος για να φορτώσει το πρόγραμμα). Ή, επισκεφθείτε το
GitHub
για μια πιο πρακτική προσέγγιση σε αυτό το μοντέλο AI.
Πηγή: Meta via
Felix Kreuk


