Οι ερευνητές βρίσκουν έναν τρόπο να κάνουν τις φωτογραφίες και τα βίντεο σε σίγαση να «μιλούν» – ορίστε τι μπορεί να σημαίνει για το απόρρητό σας
Η λήψη ήχου από μια ακίνητη εικόνα μπορεί να μοιάζει σαν κάτι από μυθιστόρημα
επιστημονικής φαντασίας
, αλλά ένας επιστήμονας έχει πραγματικά επινοήσει έναν τρόπο να το κάνει, με τη βοήθεια της τεχνητής νοημοσύνης.
Δημιουργώντας ένα εργαλείο μηχανικής μάθησης που ονομάζεται Side Eye, μια ομάδα με επικεφαλής τον καθηγητή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών και Επιστήμης Υπολογιστών στο Northeastern University, Kevin Fu, μπορεί να διαβάζει εικόνες σε εξαιρετικό βαθμό.
Εφαρμόζοντας το Side Eye σε μια ακίνητη εικόνα, μπορούν να προσδιορίσουν το φύλο ενός ομιλητή στο δωμάτιο, όπου τραβήχτηκε η φωτογραφία και τις λέξεις που μίλησαν, σύμφωνα με
TechXplor
. Μπορούν επίσης να εφαρμόσουν το εργαλείο σε βίντεο σε σίγαση.
Ένας εφιάλτης απορρήτου που λειτουργεί με AI;
«Φανταστείτε ότι κάποιος κάνει ένα βίντεο TikTok και το κάνει σίγαση και μεταγλωττίζει τη μουσική», είπε ο Fu στο publicaton. “Έχετε περιεργαστεί ποτέ τι πραγματικά λένε; Ήταν “Καρπούζι καρπούζι” ή “Εδώ είναι ο κωδικός μου;” Μιλούσε κάποιος πίσω από αυτούς; Μπορείτε πραγματικά να καταλάβετε τι λέγεται από την κάμερα.”
Το Side Eye που λειτουργεί με μηχανική μάθηση εκμεταλλεύεται την
τεχνολογία
σταθεροποίησης εικόνας που χρησιμοποιείται παγκοσμίως σε όλες σχεδόν τις κάμερες smartphone.
Οι κάμερες που είναι ενσωματωμένες σε smartphone διαθέτουν ελατήρια για την ανάρτηση του φακού σε υγρό, πράγμα που σημαίνει ότι οι
φωτογραφίες
δεν λαμβάνονται θολές ή εκτός εστίασης λόγω της ασταθούς λαβής κάποιου. Αισθητήρες και ηλεκτρομαγνήτης συνδυάζονται για να ωθήσουν τον φακό προς την αντίθετη κατεύθυνση από την όποια ταλάντωση ασκείται, για να σταθεροποιήσουν την εικόνα.
Όταν κάποιος μιλάει κοντά στο φακό της κάμερας ενώ λαμβάνεται η φωτογραφία, δημιουργεί μικροσκοπικούς κραδασμούς στα ελατήρια και κάμπτει το φως με διακριτικό τρόπο. Αν και θα ήταν σχεδόν αδύνατο να εξαχθεί η ηχητική συχνότητα από αυτές τις δονήσεις, αυτό είναι απλό λόγω της μεθόδου του κυλιόμενου κλείστρου της φωτογραφίας που χρησιμοποιούν οι περισσότερες κάμερες.
«Ο τρόπος με τον οποίο οι κάμερες λειτουργούν σήμερα για να μειώσουν το κόστος βασικά είναι ότι δεν σαρώνουν όλα τα
pixel
μιας εικόνας ταυτόχρονα – το κάνουν μία σειρά τη φορά», πρόσθεσε ο Fu. “[That happens] εκατοντάδες χιλιάδες φορές σε μια φωτογραφία. Αυτό ουσιαστικά σημαίνει ότι είστε σε θέση να ενισχύσετε κατά πάνω από χίλιες φορές πόσες πληροφορίες συχνότητας μπορείτε να λάβετε, βασικά την ευαισθησία του ήχου.”
Ενώ το ίδιο το Side Eye είναι σε πολύ βασική μορφή και απαιτεί πολύ περισσότερα δεδομένα
εκπαίδευση
ς για να τελειοποιηθεί και να τελειοποιηθεί, εάν μια πιο προηγμένη μορφή του συστήματος πέσει σε λάθος χέρια, θα μπορούσε να αποτελέσει εφιάλτη κυβερνοασφάλειας για πολλούς.
Ωστόσο, υπάρχουν θετικές επιπτώσεις και για την τεχνολογία, ειδικά εάν μια πολύ πιο προηγμένη μορφή Side Eye χρησιμοποιηθεί ως ένα είδος ψηφιακής απόδειξης για όσους εργάζονται για τη διερεύνηση του εγκλήματος.
