Η Google θέλει να χρησιμοποιήσει την τεχνητή νοημοσύνη για να μετατρέψει τα εγκεφαλικά σας κύματα σε μουσική

On

Αυγ 9, 2023

Μήνα με τον μήνα, νέα προϊόντα, προγράμματα και πειράματα μας δείχνουν πόσο τεράστιες είναι πραγματικά οι δυνατότητες της γενετικής τεχνητής νοημοσύνης. Σε εκείνο το σημείο, η

Google

συνεργάστηκε με ερευνητές από την Ιαπωνία και βρήκε έναν τρόπο να παράγει μουσική από τη δραστηριότητα του ανθρώπινου εγκεφάλου που καταγράφηκε χρησιμοποιώντας λειτουργική απεικόνιση μαγνητικού συντονισμού (fMRI) και ανακατασκευάστηκε με το μοντέλο παραγωγής μουσικής MusicLM της Google.

Όπως εξηγεί η Google στο

μια ερευνητική εργασία

με τίτλο «Brain2Music: Αναδημιουργώντας τη μουσική από τη δραστηριότητα του ανθρώπινου εγκεφάλου» (μέσω

ZDNet

), κλιπ 15 δευτερολέπτων από 540 μουσικά κομμάτια που καλύπτουν δέκα διαφορετικά είδη επιλέχθηκαν τυχαία. Πέντε συμμετέχοντες άκουσαν τα κλιπ μέσω ενός ζεύγους ενθέτων ακουστικών συμβατών με μαγνητική τομογραφία, κατά τη διάρκεια του οποίου σαρώθηκε η εγκεφαλική τους δραστηριότητα.

Οι ερευνητές τροφοδότησαν τα δεδομένα στο MusicLM για να «προβλέψουν και να ανακατασκευάσουν τα είδη μουσικής στα οποία εκτέθηκε το ανθρώπινο υποκείμενο». Στο τέλος, η παραγόμενη μουσική είχε ομοιότητες με τη μουσική που άκουγαν αρχικά τα υποκείμενα της δοκιμής «σε σημασιολογικό επίπεδο».

Αν θέλετε να ακούσετε κάποια από την ανακατασκευασμένη μουσική δραστηριότητα του εγκεφάλου, Google

δημιουργήστε μια ιστοσελίδα

για τη μελέτη που περιλαμβάνει τα αρχικά ερεθίσματα και τις ανακατασκευές.

Η ερευνητική ομάδα αποκάλυψε επίσης τρεις παράγοντες που περιορίζουν την ποιότητα της μουσικής AI:

οι πληροφορίες που περιέχονται στα δεδομένα fMRI είναι πολύ χρονικά και χωρικά αραιές (οι παρατηρούμενες περιοχές είναι 2×2×2mm
³
σε μέγεθος, πολλές τάξεις μεγέθους μεγαλύτερες από τους ανθρώπινους νευρώνες).
τις πληροφορίες που περιέχονται στις μουσικές ενσωματώσεις από τις οποίες ανακατασκευάζουμε τη μουσική (χρησιμοποιήσαμε το MuLan, στο οποίο δέκα δευτερόλεπτα μουσικής αντιπροσωπεύονται με μόλις 128 αριθμούς).
τους περιορισμούς του συστήματος παραγωγής μουσικής μας. Όταν μελετούσαμε

MusicLM

είδαμε ότι έχει περιθώρια βελτίωσης τόσο στον τρόπο που τηρεί την προτροπή κειμένου όσο και ως προς την πιστότητα του παραγόμενου ήχου.

Όπως συμβαίνει με τα περισσότερα γλωσσικά μοντέλα, υπάρχει ακόμη πολλή δουλειά που πρέπει να γίνει. Τούτου λεχθέντος, είναι ήδη σαφές ότι η τεχνητή νοημοσύνη μπορεί να χρησιμοποιήσει αποτελεσματικά τη δραστηριότητα του εγκεφάλου σας για να αναδημιουργήσει τους ήχους που ακούτε. Αλλά αν ανησυχείτε μήπως κάποιος άγνωστος σκανάρει τα κύματα του εγκεφάλου σας και κλέψει τις σκέψεις σας, μάλλον είστε ασφαλείς (προς το παρόν). Η ομάδα σημειώνει ότι οι εθελοντές έπρεπε να περάσουν ώρες σε έναν μεγάλο σαρωτή fMRI για αυτή τη μελέτη. Επομένως, απλώς αποφύγετε να βγείτε σε οποιοδήποτε πρώτο ραντεβού σε μεγάλους σαρωτές fMRI.

bgr.com