Η Meta λανσάρει το AudioCraft, μια γεννήτρια μουσικής τεχνητής νοημοσύνης ανοιχτού κώδικα

Η νέα γεννήτρια μουσικής AI της Meta είναι η τελευταία σε μια σειρά προϊόντων τεχνητής νοημοσύνης που κυκλοφόρησε πρόσφατα η εταιρεία τεχνολογίας.

Την Τετάρτη, η Meta ανακοίνωσε την κυκλοφορία του

AudioCraft

, μια τεχνητή νοημοσύνη ανοιχτού κώδικα που δημιουργεί ήχο και μουσική από μηνύματα κειμένου. Το AudioCraft διαθέτει τρία μοντέλα, το MusicGen για τη σύνθεση μουσικής, το AudioGen για τη δημιουργία ηχητικών εφέ και το EnCodec, το οποίο χρησιμοποιεί AI για να βοηθήσει στη συμπίεση ήχου που ξεπερνά τη μορφή MP3.

Σε περίπτωση που αναρωτιόσαστε για ζητήματα πνευματικών δικαιωμάτων, η MusicGen εκπαιδεύτηκε σε μουσική που ανήκει στο Meta και με άδεια χρήσης.


ΔΕΙΤΕ ΕΠΙΣΗΣ:

Llama 2: Τι πρέπει να γνωρίζετε για τον ανταγωνιστή ChatGPT της Meta

Η Meta έχει πιέσει επιθετικά για να φέρει τα εργαλεία με τεχνητή νοημοσύνη στις μάζες σε ανταγωνισμό με τα OpenAI, Google και Microsoft. Τον Ιούλιο, κυκλοφόρησε το ανοιχτού κώδικα Llama 2, την πιο πρόσφατη έκδοση του LLM (μεγάλο γλωσσικό μοντέλο).

Σε αντίθεση με το GPT-4 του OpenAI και το PaLM 2 της Google, το Llama 2 είναι ανοιχτού κώδικα, το οποίο κερδίζει Meta πόντους μεταξύ προγραμματιστών και ηθικών που πιστεύουν στη διαφάνεια της ανάπτυξης της τεχνητής νοημοσύνης. Υπάρχουν επίσης φήμες ότι η Meta λανσάρει «personas» τεχνητής νοημοσύνης, γνωστή και ως chatbots για το Instagram, το Facebook και το WhatsApp.

Το AudioCraft σχεδιάστηκε με γνώμονα τους μουσικούς και τους σχεδιαστές ήχου για να “παρέχει έμπνευση, να βοηθά τους ανθρώπους να κάνουν γρήγορα ιδέες και να επαναλάβουν τις συνθέσεις τους με νέους τρόπους”, ανέφερε η ανακοίνωση.

Παραδείγματα στην ανάρτηση του ιστολογίου περιλαμβάνουν δείγματα ήχου από την προτροπή “Whistling with wind blowing” και “Pop dance κομμάτι με πιασάρικες μελωδίες, τροπικά κρουστά και αισιόδοξους ρυθμούς, τέλειους για την παραλία”, που… ακούγονται με επιτυχία σαν αυτές τις περιγραφές.

Πολλές από τις πρόσφατες εξελίξεις της τεχνητής νοημοσύνης έχουν επικεντρωθεί στη δημιουργία κειμένου και εικόνων, η οποία είναι μια απλούστερη διαδικασία.

Το κείμενο σε ήχο είναι ένα πιο περίπλοκο εγχείρημα που η Meta φαίνεται να έχει σπάσει. Το AudioCraft μαθαίνει διακριτικά ήχου από ακατέργαστα σήματα χρησιμοποιώντας τον αποκλειστικό νευρωνικό κωδικοποιητή ήχου EnCodec για να δημιουργήσει ένα νέο «λεξιλόγιο» για το μοντέλο.

Στη συνέχεια εκπαιδεύει γλωσσικά μοντέλα σε αυτό το ηχητικό λεξιλόγιο, έτσι ώστε το μοντέλο να κατανοεί τις συσχετίσεις μεταξύ ήχου και κειμένου. Δεδομένου ότι το AudioCraft είναι επίσης ανοιχτού κώδικα, ο κώδικας είναι διαθέσιμος στο GitHub για να τον εξερευνήσουν και να τον δοκιμάσουν οι ίδιοι οι χρήστες.


mashable.com



Μπορεί επίσης να σας αρέσει


Αφήστε ένα σχόλιο στο άρθρο…



Ακύρωση απάντησης

Η διεύθυνση email σας δεν θα δημοσιευθεί.