Το Pixel 8 και η αποκάλυψη τι είναι φωτογραφία
Ένα από τα πρώτα γνωστά ψεύτικα φωτογραφιών, α
πορτρέτο του Αβραάμ Λίνκολν
, έγινε μόλις δεκαετίες μετά την αυγή της ίδιας της φωτογραφίας. Από τότε, οι φωτογράφοι έχουν βρεθεί σε ατελείωτες διαφωνίες σχετικά με το τι είναι πραγματικά μια φωτογραφία — τι είναι αληθινό, τι είναι ψεύτικο και πότε η επεξεργασία είναι υπερβολική; Τώρα, καθώς οδεύουμε σε μια εποχή όπου τα εργαλεία που τροφοδοτούνται με AI είναι παντού και εύκολα προσβάσιμα, η συζήτηση θα είναι πιο μπερδεμένη από ποτέ. Και με το Pixel 8, η Google έχει ανατρέψει το ερώτημα «τι είναι μια φωτογραφία».
Η Google ηγείται της φωτογραφίας smartphone σε αυτόν τον δρόμο εδώ και πολλά χρόνια. Η εταιρεία πρωτοστάτησε στην ιδέα της υπολογιστικής φωτογραφίας, όπου οι
κάμερες
smartphone πραγματοποιούν μια τεράστια ποσότητα επεξεργασίας στα παρασκήνια για να φτύνουν μια φωτογραφία που περιέχει περισσότερες λεπτομέρειες από αυτές που μπορεί να εντοπίσει ο αισθητήρας της κάμερας σε ένα μόνο στιγμιότυπο. Τα περισσότερα σύγχρονα smartphone χρησιμοποιούν ένα σύστημα όπως αυτό της Google
Τεχνολογία HDR Plus
για να τραβήξετε μια ριπή εικόνων και να τις συνδυάσετε σε μια υπολογιστικά δημιουργημένη εικόνα, συγχωνεύοντας τονισμένα στιγμιότυπα, σκιές, λεπτομέρειες και άλλα δεδομένα για να παραδώσετε μια πιο παρθένα φωτογραφία. Είναι αποδεκτή πρακτική σε αυτό το σημείο, αλλά σημαίνει επίσης ότι μια βασική φωτογραφία smartphone είναι ήδη κάτι περισσότερο από μια απλή «φωτογραφία» — είναι πολλές από αυτές, με τα καλύτερα μέρη τους σε συνδυασμό.
Η σειρά Pixel 8 περιπλέκει περαιτέρω τα πράγματα αρχίζοντας να μεταμορφώνει πόσο εύκολα μπορεί να αλλάξει μια φωτογραφία
μετά
η εικόνα είναι τραβηγμένη. Παρουσιάζει εύχρηστα εργαλεία επεξεργασίας αρκετά ισχυρά για να δημιουργήσουν μια εντελώς διαφορετική εικόνα από την αρχική φωτογραφία που τραβήξατε όταν πατήσετε το κουμπί κλείστρου και αυτά τα εργαλεία διατίθενται στο εμπόριο ως αναπόσπαστα μέρη του τηλεφώνου και της κάμερας. Τα εργαλεία επεξεργασίας φωτογραφιών υπάρχουν από την αρχή της φωτογραφίας, αλλά το Pixel 8 θολώνει τη γραμμή μεταξύ λήψης και επεξεργασίας με νέους και σημαντικούς τρόπους.
Magic Eraser, Best Take και Magic Editor
Αυτό ξεκινά με το Magic Eraser, μια λειτουργία δύο ετών που η Google έχει αναθεωρήσει με γενετικό AI για το Pixel 8 Pro. Η αρχική έκδοση θα μπορούσε να αφαιρέσει τα ανεπιθύμητα αντικείμενα από τις εικόνες «αναμειγνύοντας τα γύρω pixels» — δηλαδή παίρνοντας ό,τι υπάρχει ήδη εκεί και μουτζουρώνοντάς το για να κρύψει μικρά αντικείμενα και ατέλειες. Αυτή η αναβαθμισμένη έκδοση “δημιουργεί εντελώς νέα pixel” χρησιμοποιώντας γενετική τεχνητή νοημοσύνη, σύμφωνα με τον ηγέτη υλικού της Google, Rick Osterloh. το αποτέλεσμα
δεν είναι
πλέον απλώς η φωτογραφία σας, αλλά η φωτογραφία σας συν κάποια ζωγραφική με τη βοήθεια AI. Σε
ένα παράδειγμα
, η Google έδειξε πώς το εργαλείο μπορούσε να αφαιρέσει απρόσκοπτα ένα ολόκληρο αυτοκίνητο και να συμπληρώσει λεπτομέρειες όπως ξύλινα πηχάκια πίσω του. Σε μια άλλη εικόνα, η Google χρησιμοποίησε τη νέα Magic Eraser για να φέρει βασικά ο Thanos δύο ανθρώπους στη λήθη και να γεμίσει τον ορίζοντα πίσω τους.
Το Pixel 8 κάνει επίσης το ντεμπούτο ενός εργαλείου που αψηφά την πραγματικότητα που ονομάζεται Best Take, το οποίο προσπαθεί να λύσει το πρόβλημα κάποιου που αναβοσβήνει σε μια φωτογραφία, επιτρέποντάς σας να αλλάξετε το πρόσωπό του από μια άλλη πρόσφατη εικόνα. Φαίνεται ότι μπορεί να λειτουργήσει καλά. με βάση αυτά που είδα από τις δοκιμές μας στην εκδήλωση της Google,
μπορεί να κάνει μερικές απρόσκοπτες εναλλαγές προσώπου
.
Και μετά υπάρχει το μεγάλο: Magic Editor. Ανακοινώθηκε για πρώτη φορά στο
Google I/O
τον Μάιο, το Magic Editor χρησιμοποιεί γενετική τεχνητή νοημοσύνη για να σας βοηθήσει να προσαρμόσετε ολόκληρα μέρη της φωτογραφίας με κάποιους εντυπωσιακούς τρόπους. Μπορείτε να μετακινήσετε ένα άτομο ώστε να είναι σε καλύτερη θέση απλά πατώντας το και σύροντάς το γύρω. Μπορείτε να αλλάξετε το μέγεθος αυτού του ατόμου με ένα τσίμπημα. Μπορείτε ακόμη να χρησιμοποιήσετε το Magic Editor για να αλλάξετε το χρώμα του ουρανού.
Όπου το Magic Eraser και το Best Take αφορούν περισσότερο τη «διόρθωση» φωτογραφιών — επιδιόρθωση βλεφαρίδων και περιπλανώμενων αγνώστων — το Magic Editor ακολουθεί πλήρως το δρόμο της «αλλαγής» μιας φωτογραφίας: μετατρέποντας την πραγματικότητα από μια ατελής έκδοση σε μια πολύ πιο δροσερή έκδοση. Πάρτε δύο παραδείγματα
από ένα βίντεο της Google
. Σε ένα, κάποιος επεξεργάζεται μια φωτογραφία ενός μπαμπά που πετάει ένα μωρό στον αέρα για να το ανεβάσει ψηλότερα. Ένας άλλος δείχνει κάποιον να χοροπηδά για ένα slam dunk σε ένα στεφάνι μπάσκετ, αλλά στη συνέχεια αφαιρεί τον πάγκο που χρησιμοποίησε το άτομο για να πάρει το ύψος για το άλμα.
Δεν υπάρχει τίποτα εγγενώς λάθος με το να χειρίζεστε τις δικές σας φωτογραφίες. Οι άνθρωποι το έχουν κάνει εδώ και πολύ καιρό. Ωστόσο, τα εργαλεία της Google θέτουν πανίσχυρα χαρακτηριστικά χειραγώγησης φωτογραφιών – τα είδη των επεξεργασιών που προηγουμένως ήταν διαθέσιμα μόνο με κάποιες γνώσεις Photoshop και ώρες εργασίας – στα χέρια όλων και ενθαρρύνουν τη χρήση τους σε ευρεία κλίμακα, χωρίς κανένα ιδιαίτερο προστατευτικό κιγκλίδωμα ή σκέψη για αυτό. μπορεί να σημαίνει. Ξαφνικά, σχεδόν κάθε φωτογραφία που τραβάτε μπορεί να μετατραπεί αμέσως σε ψεύτικη.
Υπάρχουν τρόποι για να πουν άλλοι πότε έχουν γίνει χειραγώγηση των φωτογραφιών Pixel, αλλά θα πρέπει να το ψάξουν. “Οι φωτογραφίες που έχουν υποστεί επεξεργασία με το Magic Editor θα περιλαμβάνουν μεταδεδομένα”, λέει ο εκπρόσωπος της Google, Michael Marconi.
Το χείλος
. Ο Marconi προσθέτει ότι «τα μεταδεδομένα βασίζονται σε τεχνικά πρότυπα από [International Press Telecommunications Council]» και ότι «ακολουθούμε
την καθοδήγησή του
για την προσθήκη ετικετών σε εικόνες που έχουν επεξεργαστεί με χρήση γενετικής τεχνητής νοημοσύνης.”
Θεωρητικά, όλα αυτά σημαίνουν ότι αν δείτε μια εικόνα Pixel όπου το μωρό φαίνεται να είναι πολύ ψηλά στον αέρα, θα μπορείτε να ελέγξετε κάποια μεταδεδομένα για να δείτε εάν η τεχνητή νοημοσύνη βοήθησε στη δημιουργία αυτής της ψευδαίσθησης. (Ο Marconi δεν απάντησε σε ερωτήσεις σχετικά με το πού θα αποθηκευτούν αυτά τα μεταδεδομένα ή εάν θα μπορούσαν να τροποποιηθούν ή να αφαιρεθούν, όπως είναι τα τυπικά δεδομένα EXIF.) Η Google προσθέτει επίσης μεταδεδομένα για φωτογραφίες που έχουν επεξεργαστεί με Magic Eraser, λέει ο Marconi, και αυτό ισχύει για παλαιότερα Pixel που μπορεί να χρησιμοποιήσει και το Magic Eraser.
Η χρήση της Best Take δεν προσθέτει μεταδεδομένα στις φωτογραφίες, λέει ο Marconi, αλλά υπάρχουν ορισμένοι περιορισμοί στη λειτουργία που θα μπορούσαν να αποτρέψουν την αχρείαστη χρήση της. Το Best Take δεν δημιουργεί νέες εκφράσεις προσώπου και «χρησιμοποιεί έναν αλγόριθμο ανίχνευσης προσώπου στη συσκευή για να ταιριάξει ένα πρόσωπο σε έξι φωτογραφίες που τραβήχτηκαν μέσα σε δευτερόλεπτα η μία από την άλλη», σύμφωνα με τον Marconi. Επίσης, δεν μπορεί να αντλήσει εκφράσεις από φωτογραφίες εκτός αυτού του χρονικού πλαισίου. Ο Marconi λέει ότι οι εικόνες πηγής για το Best Take «απαιτούν μεταδεδομένα που δείχνουν ότι τραβήχτηκαν μέσα σε ένα παράθυρο 10 δευτερολέπτων».
Μικρές αλλαγές μπορούν να βελτιώσουν αναμφίβολα μια φωτογραφία και να καθορίσουν καλύτερα τι προσπαθείτε να τραβήξετε. Και ομάδες που ενδιαφέρονται πολύ για την ακρίβεια των φωτογραφιών έχουν ήδη βρει πολύ συγκεκριμένους κανόνες σχετικά με το τι είδους αλλαγές είναι εντάξει. ο
Associated Press
για παράδειγμα, είναι
πρόστιμο με “μικρές προσαρμογές”
όπως η περικοπή και η αφαίρεση της σκόνης στους αισθητήρες της κάμερας, αλλά δεν επιτρέπει τη διόρθωση των κόκκινων ματιών. Η πολιτική της Getty Images για εκδοτική κάλυψη είναι να «αποφεύγεται αυστηρά τυχόν τροποποιήσεις στην εικόνα», λέει ο CEO Craig Peters.
Το χείλος
. Οργανισμοί όπως ο
Content Authenticity Initiative
εργάζονται σε λύσεις διβιομηχανικής προέλευσης περιεχομένου, οι οποίες θα μπορούσαν να διευκολύνουν τον εντοπισμό περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη. Η Google, από την άλλη πλευρά, κάνει τα εργαλεία της απλά στη χρήση, και ενώ έχει αρχές για το πώς το κάνει
αναπτύσσεται
τα εργαλεία AI του
δεν έχει οδηγίες για το πώς θα έπρεπε οι άνθρωποι
χρήση
τους.
Η ευκολία χρήσης της γενετικής τεχνητής νοημοσύνης μπορεί να είναι κακή, υποστήριξε ο Peters τον περασμένο μήνα σε μια συνομιλία με
Το χείλος
ο αρχισυντάκτης του, Nilay Patel. «Σε έναν κόσμο όπου η γενετική τεχνητή νοημοσύνη μπορεί να παράγει περιεχόμενο σε κλίμακα και μπορείτε να διαδώσετε αυτό το περιεχόμενο σε εύρος και εμβέλεια και σε ένα χρονοδιάγραμμα που είναι τεράστιο, τελικά, η αυθεντικότητα παραγκωνίζεται», είπε ο Peters. Και ο Peters πιστεύει ότι οι εταιρείες πρέπει να κοιτάξουν πέρα από τα μεταδεδομένα ως απάντηση. «Τα εργαλεία παραγωγής θα πρέπει να επενδύουν προκειμένου να δημιουργηθούν οι σωστές λύσεις γύρω από αυτό», είπε. “Στην τρέχουσα άποψη, είναι σε μεγάλο βαθμό στα μεταδεδομένα, τα οποία αφαιρούνται εύκολα.”
Επί του παρόντος, βρισκόμαστε στην αρχή της εποχής της φωτογραφίας με τεχνητή νοημοσύνη και ξεκινάμε με εργαλεία που είναι απλά στη χρήση και απλά στην απόκρυψη. Ωστόσο, οι τελευταίες ενημερώσεις της Google κάνουν τη χειραγώγηση φωτογραφιών πιο εύκολη από ποτέ, και υποθέτω ότι εταιρείες όπως η Apple και η
Samsung
θα ακολουθήσουν το παράδειγμά τους με παρόμοια εργαλεία που θα μπορούσαν να αλλάξουν ριζικά την ερώτηση “τι είναι μια φωτογραφία;” Τώρα, το ερώτημα θα γίνεται όλο και περισσότερο: είναι κάτι φωτογραφία;
