Ένα σύνολο δεδομένων με επιρροή AI περιέχει χιλιάδες εικόνες ύποπτης σεξουαλικής κακοποίησης παιδιών

By

Marizas Dimitris

On

Δεκ 21, 2023

Εικόνα

:

Ράιαν Ντε Μπεραρντίνις

(

Shutterstock

)

Ένα επιδραστικό σύνολο δεδομένων μηχανικής μάθησης -όπως του οποίου έχει χρησιμοποιηθεί για την εκπαίδευση πολλών δημοφιλών εφαρμογών δη

μι

ουργίας εικόνων- περιλαμβάνει χιλιάδες ύποπτες εικόνες σεξουαλικής

κακοποίηση

ς παιδιών, αποκαλύπτει μια νέα ακαδημαϊκή έκθεση.

Με τη διαφήμιση AI, τίποτα

δεν είναι

πραγματικό | AI Ξεκλείδωτο

ο

κανω ΑΝΑΦΟΡΑ

που συντάχθηκε από το Παρατηρητήριο Διαδικτύου του Πανεπιστημίου Στάνφορντ, λέει ότι το LAION-5B, μια τεράστια δόση οπτικών μέσων, περιλαμβάνει έναν σημαντικό αριθμό εικόνων παράνομης κακοποίησης.

Το LAION-5B διατηρείται από τον μη κερδοσκοπικό οργανισμό LAION (συντομογραφία του Ανοικτού Δικτύου Τεχνητής Νοημοσύνης μεγάλης κλίμακας) και δεν είναι στην πραγματικότητα μια αποθηκευμένη συλλογή εικόνων, αλλά είναι μια λίστα με συνδέσμους προς εικόνες που έχουν ευρετηριαστεί από τον οργανισμό. Οι σύνδεσμοι περιλαμβάνουν μεταδεδομένα για κάθε εικόνα, τα οποία βοηθούν τα μοντέλα μηχανικής εκμάθησης να βρίσκουν εικόνες για να σχεδιάσουν για εκπαίδευση.

Για να ξεπεράσουν αυτή την εκτεταμένη δόση δεδομένων, οι ερευνητές χρησιμοποίησαν το PhotoDNA, α

αποκλειστικό εργαλείο φιλτραρίσματος περιεχομένου

αναπτύχθηκε από τη

Microsoft

για να βοηθήσει τους οργανισμούς να εντοπίσουν και να αναφέρουν ορισμένους τύπους απαγορευμένου περιεχομένου, συμπεριλαμβανομένου του CSAM. Κατά τη διάρκεια της κύλισής τους στο σύνολο δεδομένων του LAION, οι ερευνητές λένε ότι το PhotoDNA βρήκε περίπου 3.226 περιπτώσεις ύποπτου υλικού κακοποίησης παιδιών. Συμβουλευόμενοι εξωτερικούς οργανισμούς, οι ερευνητές μπόρεσαν να προσδιορίσουν ότι πολλές από αυτές τις εικόνες ήταν επιβεβαιωμένες περιπτώσεις CSAM. Ενώ το εν λόγω σύνολο δεδομένων περιλαμβάνει δισεκατομμύρια εικόνες, η ύπαρξη οποιουδήποτε όγκου περιεχομένου κατάχρησης στο περιεχόμενό του θα πρέπει να είναι ανησυχητική.

Την Τρίτη, αφού έλαβε ένα αντίγραφο της έκθεσης του Stanford με αποκλεισμό, η LAION έβγαλε το σύνολο δεδομένων εκτός σύνδεσης και

εξέδωσε ανακοίνωση

για να αντιμετωπίσει τη διαμάχη. Αναφέρει εν μέρει:

Η LAION έχει πολιτική μηδενικής ανοχής για παράνομο

περιεχόμενο

. Συνεργαζόμαστε με οργανισμούς όπως

IWF

και άλλους να παρακολουθούν και να επικυρώνουν συνεχώς συνδέσμους στα δημόσια διαθέσιμα σύνολα δεδομένων LAION. Τα σύνολα δεδομένων επικυρώνονται επίσης μέσω εντατικών εργαλείων φιλτραρίσματος που έχουν αναπτυχθεί από την κοινότητά μας και τους συνεργαζόμενους οργανισμούς για να διασφαλιστεί ότι είναι ασφαλή και συμμορφώνονται με τη νομοθεσία.

…Με μεγάλη προσοχή, έχουμε θέσει το LAION 5B εκτός σύνδεσης και εργαζόμαστε γρήγορα με την IWF και άλλους για να βρούμε και να αφαιρέσουμε συνδέσμους που ενδέχεται να παραπέμπουν σε ύποπτο, δυνητικά παράνομο περιεχόμενο στον δημόσιο ιστό.

Το LAION-5B έχει χρησιμοποιηθεί για την εκπαίδευση πολλών εφαρμογών τεχνητής νοημοσύνης,

συμπεριλαμβανομένης της δημοφιλούς εφαρμογής δημιουργίας εικόνας Stable Diffusion

δημιουργήθηκε από το Stability AI. Το Gizmodo απευθύνθηκε στο Stability AI για σχόλια και θα ενημερώσει αυτήν την ιστορία εάν ανταποκριθεί.

VIA:

gizmodo.com