Η Google θέλει να χρησιμοποιήσει την τεχνητή νοημοσύνη για να μετατρέψει τα εγκεφαλικά σας κύματα σε μουσική
Μήνα με τον μήνα, νέα προϊόντα, προγράμματα και πειράματα μας δείχνουν πόσο τεράστιες είναι πραγματικά οι δυνατότητες της γενετικής τεχνητής νοημοσύνης. Σε εκείνο το σημείο, η
Google
συνεργάστηκε με ερευνητές από την Ιαπωνία και βρήκε έναν τρόπο να παράγει μουσική από τη δραστηριότητα του ανθρώπινου εγκεφάλου που καταγράφηκε χρησιμοποιώντας λειτουργική απεικόνιση μαγνητικού συντονισμού (fMRI) και ανακατασκευάστηκε με το μοντέλο παραγωγής μουσικής MusicLM της Google.
Όπως εξηγεί η Google στο
μια ερευνητική εργασία
με τίτλο «Brain2Music: Αναδημιουργώντας τη μουσική από τη δραστηριότητα του ανθρώπινου εγκεφάλου» (μέσω
ZDNet
), κλιπ 15 δευτερολέπτων από 540 μουσικά κομμάτια που καλύπτουν δέκα διαφορετικά είδη επιλέχθηκαν τυχαία. Πέντε συμμετέχοντες άκουσαν τα κλιπ μέσω ενός ζεύγους ενθέτων ακουστικών συμβατών με μαγνητική τομογραφία, κατά τη διάρκεια του οποίου σαρώθηκε η εγκεφαλική τους δραστηριότητα.
Οι ερευνητές τροφοδότησαν τα δεδομένα στο MusicLM για να «προβλέψουν και να ανακατασκευάσουν τα είδη μουσικής στα οποία εκτέθηκε το ανθρώπινο υποκείμενο». Στο τέλος, η παραγόμενη μουσική είχε ομοιότητες με τη μουσική που άκουγαν αρχικά τα υποκείμενα της δοκιμής «σε σημασιολογικό επίπεδο».
Αν θέλετε να ακούσετε κάποια από την ανακατασκευασμένη μουσική δραστηριότητα του εγκεφάλου, Google
δημιουργήστε μια ιστοσελίδα
για τη μελέτη που περιλαμβάνει τα αρχικά ερεθίσματα και τις ανακατασκευές.
Η ερευνητική ομάδα αποκάλυψε επίσης τρεις παράγοντες που περιορίζουν την ποιότητα της μουσικής AI:
-
οι πληροφορίες που περιέχονται στα δεδομένα fMRI είναι πολύ χρονικά και χωρικά αραιές (οι παρατηρούμενες περιοχές είναι 2×2×2mm
3
σε μέγεθος, πολλές τάξεις μεγέθους μεγαλύτερες από τους ανθρώπινους νευρώνες). - τις πληροφορίες που περιέχονται στις μουσικές ενσωματώσεις από τις οποίες ανακατασκευάζουμε τη μουσική (χρησιμοποιήσαμε το MuLan, στο οποίο δέκα δευτερόλεπτα μουσικής αντιπροσωπεύονται με μόλις 128 αριθμούς).
-
τους περιορισμούς του συστήματος παραγωγής μουσικής μας. Όταν μελετούσαμε
MusicLM
είδαμε ότι έχει περιθώρια βελτίωσης τόσο στον τρόπο που τηρεί την προτροπή κειμένου όσο και ως προς την πιστότητα του παραγόμενου ήχου.
Όπως συμβαίνει με τα περισσότερα γλωσσικά μοντέλα, υπάρχει ακόμη πολλή δουλειά που πρέπει να γίνει. Τούτου λεχθέντος, είναι ήδη σαφές ότι η τεχνητή νοημοσύνη μπορεί να χρησιμοποιήσει αποτελεσματικά τη δραστηριότητα του εγκεφάλου σας για να αναδημιουργήσει τους ήχους που ακούτε. Αλλά αν ανησυχείτε μήπως κάποιος άγνωστος σκανάρει τα κύματα του εγκεφάλου σας και κλέψει τις σκέψεις σας, μάλλον είστε ασφαλείς (προς το παρόν). Η ομάδα σημειώνει ότι οι εθελοντές έπρεπε να περάσουν ώρες σε έναν μεγάλο σαρωτή fMRI για αυτή τη μελέτη. Επομένως, απλώς αποφύγετε να βγείτε σε οποιοδήποτε πρώτο ραντεβού σε μεγάλους σαρωτές fMRI.


