Το νέο AI εντοπίζει την ακριβή τοποθεσία σας από μία φωτογραφία με ακρίβεια 92% Street View — ξεπερνώντας έναν επαγγελματία παίκτη GeoGuessr
Τι πρέπει να ξέρετε
- Μεταπτυχιακοί φοιτητές από το Πανεπιστήμιο του Στάνφορντ έχουν αναπτύξει μια εφαρμογή με τεχνητή νοημοσύνη που μπορεί να προσδιορίσει την ακριβή τοποθεσία σας με βάση το Google Street View της.
- Το εργαλείο υπόσχεται 92% ακρίβεια, περιορίζοντας την τοποθεσία σε 25 χιλιόμετρα από την ακριβή τοποθεσία σε πάνω από το 40% των εικασιών του.
- Κατά την εκτέλεση σημείων αναφοράς, η εφαρμογή κέρδισε τον διάσημο παίκτη της GeoGuessr Trevor Rainbolt σε έξι αγώνες.
-
Η εφαρμογή βασίζεται στο νευρωνικό δίκτυο CLIP του
OpenAI
, το οποίο του επιτρέπει να συνδέει κείμενο με εικόνες. - Το μοντέλο δεν έχει αποσταλεί σε ευρεία διαθεσιμότητα λόγω ανησυχιών για την ασφάλεια και το απόρρητο.
Το Generative AI ήταν τεράστιο το 2023 και αναμένεται να διατηρήσει τον ίδιο ρυθμό το 2024. Ομολογουμένως, οι χρήστες έχουν ασχοληθεί αρκετά με την τεχνολογία, επιτυγχάνοντας τελικά απίστευτα επιτεύγματα στην ιατρική, την εκπαίδευση, την
πολιτική
και την τεχνολογία γενικότερα. Η Microsoft βρίσκεται στην πρώτη γραμμή της ενσωμάτωσης της τεχνητής νοημοσύνης στα περισσότερα από τα προϊόντα και τις υπηρεσίες της, ειδικά μετά από μια επένδυση πολλών δισεκατομμυρίων δολαρίων στην τεχνολογία του OpenAI.
Εξίσου, η τεχνολογία έχει επίσης υποστεί οπισθοδρομήσεις που περιστρέφονται γύρω από την ασφάλεια και το απόρρητο. Αυτό έχει οδηγήσει τους χρήστες στο όριο, εκφράζοντας κατάφωρα τις επιφυλάξεις τους για την τεχνητή νοημοσύνη. Η κυβέρνηση του Μπάιντεν εξέτασε αυτό το ζήτημα, οδηγώντας κατά συνέπεια στην έκδοση ενός Εκτελεστικού Διατάγματος που είχε σχεδιαστεί για την τοποθέτηση προστατευτικών κιγκλιδωμάτων που θα βοηθήσουν στη ρύθμιση της χρήσης της τεχνολογίας.
ΣΧΕΤΙΖΕΤΑΙ ΜΕ:
Οι κανόνες εξαγωγών της κυβέρνησης των ΗΠΑ μπλοκάρουν προηγμένες GPU τεχνητής νοημοσύνης αξίας 5 δισεκατομμυρίων δολαρίων από την Κίνα
Καθώς ξεκινάμε τη χρονιά, η τεχνητή νοημοσύνη συνεχίζει να αποτελεί απειλή (ειδικά για τους χρήστες που προτιμούν να κάνουν μια σιωπηλή και ιδιωτική ζωή). Τα μέσα κοινωνικής δικτύωσης ανοίγουν τη ζωή σας σε ολόκληρο τον κόσμο. Ευτυχώς, υπάρχουν μερικά περίπλοκα μέτρα που μπορείτε να αξιοποιήσετε για να δημιουργήσετε ένα κομμάτι απορρήτου, όπως να κάνετε ιδιωτικούς τους λογαριασμούς σας στα μέσα κοινωνικής δικτύωσης, να περιορίσετε τις δυνατότητες προβολής σχολίων και κατάστασης, ακόμη και να επιλέξετε να μην συμπεριλάβετε την ακριβή τοποθεσία κατά την κοινή χρήση φωτογραφιών.
Γνωρίζατε όμως ότι η τεχνητή νοημοσύνη μπορεί να προσδιορίσει την ακριβή τοποθεσία σας παρά την εφαρμογή των παραπάνω μέτρων; Πέρυσι, μια ομάδα μεταπτυχιακών φοιτητών από το Πανεπιστήμιο του Στάνφορντ αναπτύχθηκε
μια εφαρμογή που λειτουργεί με AI
με τη δυνατότητα αναγνώρισης και προσδιορισμού της ακριβούς τοποθεσίας σας με βάση μια φωτογραφία. Η εφαρμογή μπορεί να περιορίσει την τοποθεσία σας με βάση την προβολή δρόμου που παρουσιάζεται στη φωτογραφία ή, γενικά, την κοινή πηγή εικόνας.
Σύμφωνα με το έργο που ονομάζεται Πρόβλεψη γεωγραφικών τοποθεσιών εικόνας (PIGEON), η εφαρμογή μπορεί να προσδιορίσει την ακριβή τοποθεσία όπου τραβήχτηκε μια φωτογραφία κοιτάζοντας το Google Street View της τοποθεσίας. Επιπλέον, η εφαρμογή υπόσχεται ακρίβεια 92% όταν περιορίζει το σημείο λήψης της φωτογραφίας. Η εφαρμογή μπορεί επίσης να περιορίσει την τοποθεσία σε 25 χιλιόμετρα από την ακριβή τοποθεσία σε πάνω από το 40% των εικασιών της.
Ένα στιγμιότυπο οθόνης που δείχνει τις δυνατότητες της εφαρμογής που λειτουργεί με AI για τον προσδιορισμό της ακριβούς τοποθεσίας όπου τραβήχτηκε μια εικόνα χρησιμοποιώντας μια τοποθεσία Google Street View σε σχέση με το GeoGuessrs.
(Εικόνα: Πανεπιστήμιο Στάνφορντ)
Αν το δούμε αυτό, το PIGEON κατατάχθηκε στο κορυφαίο 0,01% των παικτών GeoGuessr. Για όσους δεν γνωρίζουν, το GeoGuessing είναι ένα παιχνίδι γεωγραφίας όπου αναμένεται να μαντέψετε την ακριβή τοποθεσία όπου τραβήχτηκε μια φωτογραφία με βάση το Google Street View της τοποθεσίας. Για λίγο πλαίσιο, αυτή ήταν η όλη υπόθεση για το PIGEON.
Πώς λειτουργεί το PIGEON;
Η εφαρμογή τροφοδοτείται από το νευρωνικό δίκτυο CLIP του OpenAI, το οποίο διαθέτει τη δυνατότητα σύνδεσης κειμένου και εικόνων. Το μοντέλο εκπαιδεύεται στα ονόματα των οπτικών κατηγοριών στις οποίες πρέπει να επικεντρωθεί. Κέρδισε τον παγκοσμίου φήμης παίκτη της GeoGuessr Trevor Rainbolt σε μια σειρά έξι αγώνων.
Κατά την έναρξη του έργου PIGEON, απόφοιτοι του Πανεπιστημίου του Στάνφορντ εκπαίδευσαν την εφαρμογή χρησιμοποιώντας 100.000 αρχικές τοποθεσίες από την GeoGuessr, οι οποίες δειγματολήφθηκαν τυχαία. Οι απόφοιτοι κατέβασαν επίσης τέσσερις εικόνες για να καλύπτουν ένα ολόκληρο «πανόραμα» σε μια δεδομένη τοποθεσία, μεταφράζοντας σε 400.000 εικόνες.
Σύμφωνα με έναν από τους αποφοίτους, μέρος του έργου PIGEON:
“Δημιουργήσαμε το δικό μας σύνολο δεδομένων με περίπου 500.000 εικόνες street view. Στην πραγματικότητα
δεν είναι
τόσο πολλά δεδομένα, [and] καταφέραμε να έχουμε αρκετά θεαματική απόδοση».
Το PIGEON μπορεί να βρει σημαντικές λεπτομέρειες, όπως το φύλλωμα και τον καιρό, όταν προσδιορίζει μια συγκεκριμένη τοποθεσία. Αυτός είναι ο κύριος λόγος που εμφανίζει απίστευτη απόδοση σε σύγκριση με άλλα μοντέλα όπως το DALL-E 2 του OpenAI. Συγκριτικά, το τελευταίο εκπαιδεύεται χρησιμοποιώντας εκατομμύρια εικόνες, χωρίς να ξεχνάμε τους τεράστιους διαθέσιμους πόρους για να το κάνουμε ακόμα καλύτερο, αλλά και πάλι το PIGEON δημοσιεύει καλύτερα αποτελέσματα .
Επίκειται μεγάλη παραβίαση της ιδιωτικής ζωής
(Πίστωση εικόνας: Windows Central)
Αν και αυτό είναι ένα απίστευτο κατόρθωμα που μπορεί να οδηγήσει δυνητικά σε μεγάλη ανάπτυξη, δεν μπορώ παρά να σκεφτώ τις αρνητικές επιπτώσεις που θα έχει η εφαρμογή με τεχνητή νοημοσύνη εάν αποσταλεί σε γενική διαθεσιμότητα.
ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣ
ΟΤΕ
ΡΑ:
Οι New York Times μηνύουν τη Microsoft και το OpenAI για ζητήματα πνευματικών δικαιωμάτων
Οι απόφοιτοι του Στάνφορντ τόνισαν ότι η εφαρμογή μπορεί να αποτελέσει ένα αποτελεσματικό εργαλείο όταν πρόκειται για αυτόνομη οδήγηση, οπτικές έρευνες, ασφάλεια και πολλά άλλα. Ωστόσο, εάν η τεχνολογία πέσει σε λάθος χέρια και χρησιμοποιηθεί για κακούς σκοπούς άλλους από αυτούς για τους οποίους προορίζεται, η ζημιά που μπορεί να προκληθεί είναι εξαιρετικά ανησυχητική.
Για το σκοπό αυτό, το μοντέλο δεν έχει κυκλοφορήσει στο κοινό. Όπως κοινοποιήθηκε στο έργο, οι μαθητές μοιράστηκαν τον κώδικα μόνο για ακαδημαϊκούς σκοπούς.
Ως αποτέλεσμα, οι μαθητές αποφάσισαν να μην δημοσιοποιήσουν τα βάρη των μοντέλων και κυκλοφόρησαν μόνο τον κωδικό για ακαδημαϊκή επικύρωση, σύμφωνα με την
εφημερίδα
.
Ποιες είναι οι σκέψεις σας για αυτήν την αναδυόμενη τεχνολογία και τις μακροπρόθεσμες επιπτώσεις της στο απόρρητο και την ασφάλεια;
Ενημερώστε μας στα σχόλια.
VIA:
WindowsCentral

