Η Google θέλει ένα αόρατο ψηφιακό υδατογράφημα για να προσφέρει διαφάνεια στην τέχνη της τεχνητής νοημοσύνης

By

Marizas Dimitris

On

Αυγ 30, 2023

Η Google έκανε ένα βήμα προς τη διαφάνεια στις εικόνες που δημιουργούνται με τεχνητή νοημοσύνη σήμερα.

Google DeepMind

ανακοινώθηκε

SynthID, ένα εργαλείο υδατογράφησης / αναγνώρισης για γενετική τέχνη. Η εταιρεία λέει ότι η τεχνολογία ενσωματώνει ένα ψηφιακό υδατογράφημα, αόρατο στο ανθρώπινο μάτι, απευθείας στα pixel μιας εικόνας. Το SynthID κυκλοφορεί πρώτα σε «περιορισμένο αριθμό» πελατών που χρησιμοποιούν το Imagen, τη γεννήτρια τέχνης της Google που διατίθεται στη σουίτα εργαλείων τεχνητής νοημοσύνης που βασίζονται σε σύννεφο.

Ένα από τα πολλά ζητήματα με τη γενετική τέχνη —εκτός από τις ηθικές συνέπειες της εκπαίδευσης στη δουλειά των καλλιτεχνών— είναι η δυνατότητα δημιουργίας deepfakes. Για παράδειγμα, η νέα καυτή ενδυμασία hip-hop του Πάπα (μια εικόνα τεχνητής νοημοσύνης που δημιουργήθηκε με το MidJourney) που έγινε viral στα μέσα κοινωνικής δικτύωσης ήταν ένα πρώιμο παράδειγμα του τι θα μπορούσε να γίνει πιο συνηθισμένο καθώς εξελίσσονται τα εργαλεία παραγωγής. Δεν χρειάζεται πολλή φαντασία για να δείτε πώς κάτι σαν πολιτικές διαφημίσεις που χρησιμοποιούν τέχνη που δημιουργείται από την τεχνητή νοημοσύνη θα μπορούσε να κάνει πολύ μεγαλύτερη ζημιά από μια αστεία εικόνα που κυκλοφορεί στο Twitter. «Η υδατογράφηση ακουστικού και οπτικού περιεχομένου για να καταστεί σαφές ότι το περιεχόμενο δημιουργείται από AI» ήταν μια από τις εθελοντικές δεσμεύσεις που συμφώνησαν να αναπτύξουν επτά εταιρείες τεχνητής νοημοσύνης μετά από μια συνάντηση τον Ιούλιο στον Λευκό Οίκο. Η Google είναι η πρώτη από τις εταιρείες που εγκαινίασε ένα τέτοιο σύστημα.

Η Google δεν πηγαίνει πολύ μακριά στην τεχνική υλοποίηση του SynthID (πιθανόν να αποτρέψει λύσεις), αλλά λέει ότι το υδατογράφημα δεν μπορεί να αφαιρεθεί εύκολα μέσω απλών τεχνικών επεξ

εργασία

ς. «Η εύρεση της σωστής ισορροπίας μεταξύ της ανεπαίσθητης και ανθεκτικότητας στους χειρισμούς εικόνας είναι δύσκολη», έγραψε η εταιρεία σε μια ανάρτηση ιστολογίου της DeepMind που δημοσιεύτηκε σήμερα. «Σχεδιάσαμε το SynthID ώστε να μην διακυβεύει την ποιότητα της εικόνας και επιτρέπει στο υδατογράφημα να παραμένει ανιχνεύσιμο, ακόμη και μετά από τροποποιήσεις όπως η προσθήκη φίλτρων, η αλλαγή χρωμάτων και η αποθήκευση με διάφορα σχήματα συμπίεσης με απώλειες — που χρησιμοποιούνται πιο συχνά για JPEG», οι επικεφαλής του έργου SynthID της DeepMind Έγραψαν οι Sven Gowal και Pushmeet Kohli.

Google DeepMind

Το τμήμα αναγνώρισης του SynthID βαθμολογεί την εικόνα με βάση τρία επίπεδα εμπιστοσύνης ψηφιακού υδατογραφήματος: ανιχνεύθηκε, δεν ανιχνεύτηκε και ενδεχομένως ανιχνεύτηκε. Δεδομένου ότι το εργαλείο είναι ενσωματωμένο στα pixel της εικόνας, η Google λέει ότι το σύστημά της μπορεί να λειτουργήσει παράλληλα με προσεγγίσεις που βασίζονται σε μεταδεδομένα, όπως αυτή που χρησιμοποιεί η Adobe με τις δυνατότητες δημιουργίας του Photoshop, που είναι προς το παρόν διαθέσιμες σε ανοιχτή έκδοση beta.

Το SynthID περιλαμβάνει ένα ζευγάρι μοντέλων βαθιάς μάθησης: ένα για υδατοσήμανση και το άλλο για αναγνώριση. Η Google λέει ότι και οι δύο εκπαιδεύτηκαν σε διαφορετικές εικόνες, με αποκορύφωμα ένα συνδυασμένο μοντέλο ML. «Το συνδυασμένο μοντέλο έχει βελτιστοποιηθεί για μια σειρά στόχων, συμπεριλαμβανομένης της σωστής αναγνώρισης περιεχομένου με υδατοσήμανση και της βελτίωσης της ανεπαίσθητης εικόνας, ευθυγραμμίζοντας οπτικά το υδατογράφημα με το αρχικό περιεχόμενο», έγραψαν οι Gowal και Kohli.

Η Google αναγνώρισε ότι δεν είναι η τέλεια λύση, προσθέτοντας ότι «δεν είναι αλάνθαστη έναντι των ακραίων χειρισμών εικόνας». Ωστόσο, περιγράφει το υδατογράφημα ως «μια πολλά υποσχόμενη τεχνική προσέγγιση για την ενδυνάμωση των ανθρώπων και των οργανισμών να εργαστούν με περιεχόμενο που δημιουργείται από AI υπεύθυνα». Η εταιρεία λέει ότι το εργαλείο θα μπορούσε να επεκταθεί και σε άλλα μοντέλα τεχνητής νοημοσύνης, συμπεριλαμβανομένων εκείνων που επιφορτίζονται με τη δημιουργία κειμένου (όπως το ChatGPT), βίντεο και ήχου.

Αν και τα υδατογραφήματα θα μπορούσαν να βοηθήσουν με τα βαθιά ψεύτικα, είναι εύκολο να φανταστεί κανείς το ψηφιακό υδατογράφημα να μετατρέπεται σε κούρσα εξοπλισμών με χάκερ, με τις υπηρεσίες που υιοθετούν το SynthID να απαιτούν συνεχή

ενημέρωση

.

Επιπλέον

, η φύση ανοιχτού κώδικα του Stable Diffusion, ενός από τα κορυφαία εργαλεία παραγωγής, θα μπορούσε να καταστήσει την υιοθέτηση του SynthID ή οποιασδήποτε παρόμοιας λύσης σε ολόκληρη τη βιομηχανία πολύ μεγάλη: Έχει ήδη αμέτρητες προσαρμοσμένες εκδόσεις που μπορούν να εκτελεστούν σε τοπικούς υπολογιστές στο άγριος. Ανεξάρτητα από αυτό, η Google ελπίζει να διαθέσει το SynthID σε τρίτα μέρη «στο εγγύς

μέλλον

» για να βελτιώσει τουλάχιστον τη διαφάνεια της τεχνητής νοημοσύνης σε ολόκληρο τον κλάδο.