Μπορεί η ψηφιακή υδατοσήμανση να μας προστατεύσει από τη γενετική τεχνητή νοημοσύνη;

By

Marizas Dimitris

On

Δεκ 1, 2023

Ο Μπάιντεν ο Λευκός Οίκος ψήφισε πρόσφατα

το τελευταίο του εκτελεστικό διάταγμα

έχει σχεδιαστεί για να δημιουργήσει ένα πλαίσιο καθοδήγησης για την ανάπτυξη γενετικής τεχνητής νοημοσύνης — συμπεριλαμβανομένου του ελέγχου ταυτότητας περιεχομένου και της χρήσης ψηφιακών υδατογραφημάτων για να υποδείξει πότε δημιουργούνται ψηφιακά στοιχεία από την ομοσπονδιακή κυβέρνηση. Δείτε πώς αυτό και παρόμοιες τεχνολογίες προστασίας από αντιγραφή θα μπορούσαν να βοηθήσουν τους δημιουργούς περιεχομένου να ελέγχουν με μεγαλύτερη ασφάλεια την ταυτότητα των έργων τους στο διαδίκτυο σε μια εποχή γενετικής παραπληροφόρησης τεχνητής νοημοσύνης.

Μια γρήγορη ιστορία υδατογραφήματος

Οι τεχνικές αναλογικής υδατοσήμανσης αναπτύχθηκαν για πρώτη φορά στην Ιταλία το 1282. Οι χαρτοποιοί εμφύτευαν λεπτά σύρματα στο καλούπι χαρτιού, το οποίο θα δημιουργούσε σχεδόν ανεπαίσθητα λεπτότερες περιοχές του φύλλου που θα γίνονταν εμφανείς όταν κρατούνταν σε επαφή με το φως. Όχι μόνο χρησιμοποιήθηκαν αναλογικά υδατογραφήματα για τον έλεγχο ταυτότητας πού και πώς παράγονται τα προϊόντα μιας εταιρείας, τα σήματα θα μπορούσαν επίσης να χρησιμοποιηθούν για να περάσουν κρυφά, κωδικοποιημένα μηνύματα. Μέχρι τον 18ο αιώνα, η τεχνολογία είχε εξαπλωθεί στην κρατική χρήση ως μέσο για την πρόληψη της παραχάραξης νομισμάτων. Περίπου την ίδια περίοδο αναπτύχθηκαν τεχνικές έγχρωμων υδατογραφημάτων, οι οποίες τοποθετούσαν βαμμένα υλικά ανάμεσα σε στρώματα χαρτιού.

Αν και ο όρος «ψηφιακή υδατογράφηση» επινοήθηκε μέχρι το 1992, η τεχνολογία πίσω από αυτό ήταν η πρώτη

κατοχυρώθηκε με δίπλωμα ευρεσιτεχνίας από την Muzac Corporation το 1954

. Το σύστημα που κατασκεύασαν και το οποίο χρησιμοποιούσαν έως ότου πουλήθηκε η εταιρεία τη δεκαετία του 1980, θα εντόπιζε τη μουσική που ανήκε στον Muzac χρησιμοποιώντας ένα «

φίλτρο εγκοπής

” για να μπλοκάρετε το ηχητικό σήμα στο 1 kHz σε συγκεκριμένες ριπές, όπως ο κώδικας Μορς, για να αποθηκεύσετε πληροφορίες αναγνώρισης.

Εταιρείες παρακολούθησης διαφημίσεων και μέτρησης κοινού, όπως η Nielsen Company, χρησιμοποιούν από καιρό τεχνικές υδατογράφησης

για να προσθέσετε ετικέτες στα ηχητικά κομμάτια τηλεοπτικών εκπομπών

να παρακολουθούν και να κατανοούν τι παρακολουθούν τα αμερικανικά νοικοκυριά. Αυτές οι στεγανογραφικές μέθοδοι έχουν φτάσει ακόμη και στο σύγχρονο πρότυπο Blu-Ray (

το σύστημα Cinavia

), καθώς και σε κυβερνητικές εφαρμογές όπως ο έλεγχος ταυτότητας

άδειες οδήγησης

,

εθνικά νομίσματα

και άλλα ευαίσθητα έγγραφα. Η εταιρεία Digimarc, για παράδειγμα, έχει

ανέπτυξε ένα υδατογράφημα για τη συσκευασία

που εκτυπώνει τον γραμμωτό κώδικα ενός προϊόντος σχεδόν αόρατα σε όλο το κουτί, επιτρέποντας σε οποιονδήποτε ψηφιακό σαρωτή να τον διαβάσει. Έχει επίσης χρησιμοποιηθεί σε εφαρμογές που κυμαίνονται από

μάρκα κατά της παραχάραξης

προς την

βελτιωμένη απόδοση ανακύκλωσης υλικών

.

Το εδώ και τώρα

Η σύγχρονη ψηφιακή υδατογράφηση λειτουργεί με τις ίδιες αρχές, ενσωματώνοντας ανεπαίσθητα πρόσθετες πληροφορίες σε ένα κομμάτι περιεχομένου (είτε είναι εικόνα, βίντεο ή ήχος) χρησιμοποιώντας ειδικό λογισμικό κωδικοποίησης. Αυτά τα υδατογραφήματα διαβάζονται εύκολα από μηχανές, αλλά είναι σε μεγάλο βαθμό αόρατα στους ανθρώπους. Η πρακτική διαφέρει από τις υπάρχουσες κρυπτογραφικές προστασίες, όπως τα κλειδιά προϊόντος ή τα προστατευτικά dongles λογισμικού, καθώς τα υδατογραφήματα δεν αποτρέπουν ενεργά τη μη εξουσιοδοτημένη τροποποίηση ή αντιγραφή ενός τμήματος περιεχομένου, αλλά παρέχουν ένα αρχείο για το πού προέρχεται το περιεχόμενο ή ποιος είναι ο κάτοχος των πνευματικών δικαιωμάτων.

Ωστόσο, το σύστημα δεν είναι τέλειο. «Δεν υπάρχει τίποτα, κυριολεκτικά τίποτα, που να προστατεύει τα έργα που προστατεύονται από πνευματικά δικαιώματα από την εκπαίδευση [by generative AI models]εκτός από τη μη επαληθεύσιμη, ανεφάρμοστη λέξη των εταιρειών τεχνητής νοημοσύνης», είπε ο Δρ. Ben Zhao, Καθηγητής Επιστήμης Υπολογιστών Neubauer στο Πανεπιστήμιο του Σικάγο, στο Engadget μέσω email.

«Δεν υπάρχουν υπάρχουσες κρυπτογραφικές ή ρυθμιστικές μέθοδοι για την προστασία έργων που προστατεύονται από πνευματικά δικαιώματα —

κανένας

,” αυτός είπε. «Οι λίστες εξαίρεσης έχουν γίνει χλεύη από

σταθερότητα.ai

(αυτοί

άλλαξε το όνομα του μοντέλου σε SDXL

να αγνοήσει όλους όσους εγγράφηκαν για να εξαιρεθούν από το SD 3.0) και το

Facebook

/Meta, που απάντησαν στους χρήστες στην πρόσφατη εξαίρεση τους

λίστα με ένα μήνυμα που έλεγε

“Δεν μπορείτε να αποδείξετε ότι είχατε ήδη εκπαιδευτεί στο μοντέλο μας, επομένως δεν μπορείτε να εξαιρεθείτε.”

Ο Ζάο λέει ότι ενώ το εκτελεστικό διάταγμα του Λευκού Οίκου είναι «φιλόδοξο και καλύπτει τεράστιο έδαφος», τα σχέδια που έχει εκπονήσει μέχρι σήμερα ο Λευκός Οίκος δεν έχουν πολλά σε σχέση με «τεχνικές λεπτομέρειες για το πώς θα επιτύχει πραγματικά τους στόχους που έθεσε».

Σημειώνει ότι «υπάρχουν πολλές εταιρείες που δεν υπόκεινται σε καμία κανονιστική ή νομική πίεση να μπουν στον κόπο να υδατογραφήσουν την παραγωγή genAI τους. Τα εθελοντικά μέτρα δεν λειτουργούν σε ένα περιβάλλον αντιπαράθεσης όπου τα ενδιαφερόμενα μέρη έχουν κίνητρα να αποφύγουν ή να παρακάμψουν τους κανονισμούς και την εποπτεία».

«Είτε μας αρέσει είτε όχι, οι εμπορικές εταιρείες έχουν σχεδιαστεί για να βγάζουν χρήματα και είναι προς το συμφέρον τους να αποφεύγουν τους κανονισμούς», πρόσθεσε.

Θα μπορούσαμε επίσης πολύ εύκολα να δούμε την επόμενη προεδρική διοίκηση

να αναλάβουν τα καθήκοντά τους και να διαλύσουν το εκτελεστικό διάταγμα του Μπάιντεν

και όλη την ομοσπονδιακή υποδομή που προχώρησε στην εφαρμογή του, δεδομένου ότι ένα εκτελεστικό διάταγμα στερείται το συνταγματικό κύρος της νομοθεσίας του Κογκρέσου. Αλλά μην υπολογίζετε ότι η Βουλή και η Γερουσία θα κάνουν τίποτα για το θέμα.

«Το Κογκρέσο είναι βαθιά πολωμένο και ακόμη και δυσλειτουργικό σε βαθμό που είναι πολύ απίθανο να δημιουργήσει κάποια ουσιαστική νομοθεσία για την

τεχνητή νοημοσύνη

στο εγγύς μέλλον», είπε η Anu Bradford, καθηγήτρια νομικής στο Πανεπιστήμιο Columbia.

MIT Tech Review

. Μέχρι στιγμής, οι μηχανισμοί επιβολής για αυτά τα συστήματα υδατοσήμανσης έχουν περιοριστεί γενικά σε ροζ βρισιές από τους μεγάλους παίκτες του κλάδου.

Πώς λειτουργούν τα διαπιστευτήρια περιεχομένου

Με τους τροχούς της κυβέρνησης να γυρίζουν τόσο αργά, οι εναλλακτικές λύσεις του κλάδου αποδεικνύονται απαραίτητες. Ξεκίνησαν η Microsoft, οι New York Times, το CBC/Radio-Canada και το BBC

Προέλευση έργου

το 2019 για την προστασία της ακεραιότητας του περιεχομένου, ανεξάρτητα από την πλατφόρμα στην οποία καταναλώνεται. Ταυτόχρονα, η Adobe και οι συνεργάτες της λάνσαρε το

Content Authenticity Initiative

(CAI), προσεγγίζοντας το θέμα από τη σκοπιά του δημιουργού. Τελικά η CAI και η Project Origin συνδύασαν τις προσπάθειές τους για να δημιουργήσουν το

Συνασπισμός για την προέλευση και την αυθεντικότητα περιεχομένου

(C2PA). Από αυτόν τον συνασπισμό συνασπισμών προήλθαν τα Content Credentials («CR» για συντομία), τα οποία

Η Adobe ανακοίνωσε στην εκδήλωση Max

το 2021.

CR

επισυνάπτει πρόσθετες πληροφορίες

σχετικά με μια εικόνα κάθε φορά που γίνεται εξαγωγή ή λήψη της με τη μορφή κρυπτογραφικά ασφαλούς δήλωσης. Το μανιφέστο αντλεί δεδομένα από την κεφαλίδα της εικόνας ή του βίντεο — πληροφορίες του δημιουργού, πού τραβήχτηκαν, πότε τραβήχτηκαν, ποια συσκευή το πήρε, αν χρησιμοποιήθηκαν συστήματα τεχνητής νοημοσύνης όπως το DALL-E ή το Stable Diffusion και ποιες αλλαγές έχουν γίνει από τότε — επιτρέποντας στους ιστότοπους να ελέγχουν αυτές τις πληροφορίες σε σχέση με τους ισχυρισμούς προέλευσης που διατυπώνονται στο δηλωτικό. Όταν συνδυάζεται με την τεχνολογία υδατογράφησης, το αποτέλεσμα είναι μια μοναδική μέθοδος ελέγχου ταυτότητας που δεν μπορεί εύκολα να αφαιρεθεί όπως το EXIF και τα μεταδεδομένα (δηλαδή οι τεχνικές λεπτομέρειες που προστίθενται αυτόματα από το λογισμικό ή τη συσκευή που τράβηξε την εικόνα) όταν ανεβαίνουν σε ιστότοπους κοινωνικών μέσων (λόγω υπογραφή κρυπτογραφικού αρχείου). Όχι σε αντίθεση με την τεχνολογία blockchain!

Τα μεταδεδομένα συνήθως δεν επιβιώνουν από κοινές ροές εργασίας, καθώς το περιεχόμενο ανακατεύεται στο διαδίκτυο, επειδή, όπως εξήγησε στο Engadget ο Chief Product Officer της Digimarc, Ken Sickles, πολλά διαδικτυακά συστήματα δεν κατασκευάστηκαν για να τα υποστηρίζουν ή να τα διαβάζουν και έτσι απλά αγνοούν τα δεδομένα.

«Η αναλογία που έχουμε χρησιμοποιήσει στο παρελθόν είναι μια αναλογία», είπε στο Engadget ο Chief Technology Officer της Digimarc, Tony Rodriguez. Όπως ένας φάκελος, το πολύτιμο περιεχόμενο που θέλετε να στείλετε τοποθετείται μέσα «και εκεί βρίσκεται το υδατογράφημα. Στην πραγματικότητα είναι μέρος των pixel, του ήχου, ό,τι κι αν είναι αυτό το μέσο. Τα μεταδεδομένα, όλες αυτές οι άλλες πληροφορίες, αναγράφονται στο εξωτερικό του φακέλου.»

Εάν κάποιος καταφέρει να αφαιρέσει το υδατογράφημα (αποδεικνύεται ότι δεν είναι τόσο δύσκολο, απλώς τραβήξτε την εικόνα και κόψτε το εικονίδιο), τα διαπιστευτήρια μπορούν να επισυναφθούν ξανά μέσω

Επαληθεύω

, το οποίο εκτελεί αλγόριθμους μηχανικής όρασης έναντι μιας μεταφορτωμένης εικόνας για να βρει αντιστοιχίσεις στο αποθετήριο της. Εάν η μεταφορτωμένη εικόνα μπορεί να αναγνωριστεί, τα διαπιστευτήρια εφαρμόζονται ξανά. Εάν ένας χρήστης συναντήσει το περιεχόμενο εικόνας στη φύση, μπορεί να ελέγξει τα διαπιστευτήριά του κάνοντας κλικ στο εικονίδιο CR για να εμφανίσει το πλήρες μανιφέστο και να επαληθεύσει τις πληροφορίες για τον εαυτό του και να λάβει μια πιο τεκμηριωμένη απόφαση σχετικά με το περιεχόμενο στο διαδίκτυο που θα εμπιστευτεί.

Το Sickles οραματίζεται αυτά τα συστήματα ελέγχου ταυτότητας που λειτουργούν σε επίπεδα συντονισμού, όπως ένα σύστημα οικιακής ασφάλειας που συνδυάζει κλειδαριές και εξαρτήματα με κάμερες και αισθητήρες κίνησης για να αυξήσει την κάλυψή του. “Αυτή είναι η ομορφιά των Διαπιστευτηρίων Περιεχομένου και των υδατογραφημάτων μαζί”, είπε ο Sickles. “Γίνονται ένα πολύ, πολύ ισχυρότερο σύστημα ως βάση για την αυθεντικότητα και την κατανόηση της προέλευσης γύρω από μια εικόνα” από ό,τι θα έκαναν μεμονωμένα.” Η Digimarc διανέμει ελεύθερα το εργαλείο ανίχνευσης υδατογραφήματος σε παραγωγούς προγραμματιστές τεχνητής νοημοσύνης και ενσωματώνει το πρότυπο Content Credentials στο υπάρχον πρότυπο

Επικυρώνω

διαδικτυακή πλατφόρμα προστασίας αντιγραφής.

Στην πράξη, βλέπουμε ήδη το πρότυπο να ενσωματώνεται σε φυσικά εμπορικά προϊόντα, όπως το Leica M11-P, το οποίο θα τοποθετεί αυτόματα ένα διαπιστευτήριο CR στις εικόνες κατά τη λήψη τους. ο

Νιου Γιορκ Ταιμς

έχει

διερεύνησε τη χρήση του σε δημοσιογραφικές προσπάθειες

Reuters

το χρησιμοποίησε για τη φιλόδοξη λειτουργία του 76 Days

και η Microsoft το έχει προσθέσει επίσης στο Bing Image Creator και στο Bing AI chatbot. Η Sony φέρεται να εργάζεται για να ενσωματώσει το πρότυπο στις ψηφιακές φωτογραφικές μηχανές

Alpha

9 III, επιτρέποντας ενημερώσεις υλικολογισμικού για τα μοντέλα Alpha 1 και Alpha 7S III που θα φτάσουν το 2024. Το CR είναι επίσης διαθέσιμο στην εκτεταμένη σουίτα εργαλείων επεξεργασίας φωτογραφιών και βίντεο της Adobe, συμπεριλαμβανομένων των Illustrator, Adobe Express , Stock and Behance. Το Generative AI της εταιρείας, Firefly, θα περιλαμβάνει αυτόματα μη προσωπικά αναγνωρίσιμες πληροφορίες σε ένα CR για ορισμένες λειτουργίες όπως το generative fill (ουσιαστικά σημειώνοντας ότι η δυνατότητα δημιουργίας χρησιμοποιήθηκε, αλλά όχι από ποιον), αλλά διαφορετικά θα ενεργοποιηθεί.

Τούτου λεχθέντος, το πρότυπο C2PA και τα διαπιστευτήρια περιεχομένου διεπαφής δεν έχουν αναπτυχθεί και επί του παρόντος είναι εξαιρετικά δύσκολο να βρεθούν στα μέσα κοινωνικής δικτύωσης. «Πιστεύω ότι πραγματικά οφείλεται στην ευρεία υιοθέτηση αυτών των τεχνολογιών και στο πού υιοθετούνται. τόσο από την άποψη της επισύναψης των διαπιστευτηρίων περιεχομένου και της εισαγωγής του υδατογραφήματος για τη σύνδεσή τους», είπε ο Sickles.

Nightshade: Η εναλλακτική λύση CR που είναι θανατηφόρα για τις βάσεις δεδομένων

Ορισμένοι ερευνητές ασφάλειας περιμένουν αρκετά να γραφτούν νόμοι ή να ριζώσουν τα πρότυπα του κλάδου και αντ’ αυτού έχουν πάρει στα χέρια τους την προστασία αντιγραφής. Ομάδες από το Εργαστήριο SAND του Πανεπιστημίου του Σικάγο, για παράδειγμα, έχουν αναπτύξει ένα ζευγάρι απολύτως δυσάρεστα συστήματα προστασίας από αντιγραφή για χρήση ειδικά κατά των γενεσιουργών AI.

Ο Zhao και η ομάδα του έχουν αναπτύξει το Glaze, ένα σύστημα για δημιουργούς που διαταράσσει το στυλ μίμησης μιας γενετικής τεχνητής νοημοσύνης (εκμεταλλευόμενος την έννοια του

αντίθετα παραδείγματα

). Μπορεί να αλλάξει τα εικονοστοιχεία σε ένα δεδομένο έργο

τέχνη

ς με τρόπο που δεν είναι ανιχνεύσιμος από το ανθρώπινο μάτι, αλλά που φαίνεται ριζικά διαφορετικός από ένα σύστημα μηχανικής όρασης. Όταν ένα σύστημα παραγωγής τεχνητής νοημοσύνης εκπαιδεύεται σε αυτές τις «γυαλισμένες» εικόνες, δεν μπορεί να αναπαραγάγει ακριβώς το επιδιωκόμενο στυλ τέχνης — ο κυβισμός γίνεται καρτούν, τα αφηρημένα στυλ μετατρέπονται σε anime. Αυτό θα μπορούσε να αποδειχτεί ένα όφελος για γνωστούς και συχνά μιμούμενους καλλιτέχνες, ειδικά για τη διατήρηση των επώνυμων καλλιτεχνικών τους στυλ εμπορικά ασφαλή.

Ενώ το Glaze εστιάζει σε προληπτικές ενέργειες για να εκτρέψει τις προσπάθειες των παράνομων αποξεστών δεδομένων, το νεότερο εργαλείο της SAND Lab είναι ολόψυχα τιμωρητικό. Μεταγλωττισμένη

Στρύχνος

το σύστημα θα αλλάξει διακριτικά τα εικονοστοιχεία σε μια δεδομένη εικόνα, αλλά αντί να μπερδεύει τα μοντέλα με τα οποία έχει εκπαιδευτεί όπως κάνει το Glaze, η δηλητηριασμένη εικόνα θα καταστρέψει τη βάση δεδομένων εκπαίδευσης που εισήχθη στη χονδρική, αναγκάζοντας τους προγραμματιστές να επανέλθουν και να αφαιρέσουν χειροκίνητα κάθε επιβλαβή εικόνα για να επιλύσετε το πρόβλημα — διαφορετικά το σύστημα απλώς θα επανεκπαιδευτεί στα κακά δεδομένα και θα αντιμετωπίσει ξανά τα ίδια προβλήματα.

Το εργαλείο προορίζεται ως «έσχατη λύση» για τους δημιουργούς περιεχομένου, αλλά δεν μπορεί να χρησιμοποιηθεί ως φορέας επίθεσης. «Αυτό ισοδυναμεί με το να βάζεις καυτή σάλτσα στο μεσημεριανό σου γιατί κάποιος την κλέβει συνέχεια από το ψυγείο», υποστήριξε ο Zhao.

Ο Zhao έχει ελάχιστη συμπάθεια για τους ιδιοκτήτες μοντέλων που το Nightshade καταστρέφει. «Οι εταιρείες που σκόπιμα παρακάμπτουν τις λίστες εξαίρεσης και τις οδηγίες «μην σκουπίζουν» γνωρίζουν τι κάνουν», είπε. «Δεν υπάρχει «τυχαία» λήψη και εκπαίδευση σε δεδομένα. Χρειάζεται πολλή δουλειά και πλήρης πρόθεση για να πάρετε το περιεχόμενο κάποιου, να το κατεβάσετε και να εκπαιδευτείτε σε αυτό.»

VIA:

engadget.com

Παρόμοια άρθρα