Το OpenAI μηνύεται για εκπαίδευση του ChatGPT με «κλεμμένα» προσωπικά δεδομένα

Μια δικηγορική εταιρεία στην Καλιφόρνια κατέθεσε α

ομαδική αγωγή

(ανοίγει σε νέα καρτέλα)


εναντίον του OpenAI για «κλοπή» προσωπικών δεδομένων για την εκπαίδευση του ChatGPT.

Η δικηγορική εταιρεία Clarkson, σε μια καταγγελία που κατατέθηκε στο δικαστήριο της Βόρειας Περιφέρειας της Καλιφόρνια την Τετάρτη, ισχυρίζεται ότι η ChatGPT και η Dall-E «χρησιμοποιούν κλεμμένες ιδιωτικές πληροφορίες, συμπεριλαμβανομένων στοιχείων προσωπικής ταυτοποίησης, από εκατοντάδες εκατομμύρια χρήστες του Διαδικτύου, συμπεριλαμβανομένων παιδιών όλων των ηλικιών, χωρίς ενημερωμένη συγκατάθεση ή γνώση τους». Για να εκπαιδεύσει το μεγάλο γλωσσικό μοντέλο του, το OpenAI ξέσπασε 300 δισεκατομμύρια λέξεις από το διαδίκτυο, συμπεριλαμβανομένων προσωπικών πληροφοριών και αναρτήσεων από ιστότοπους κοινωνικών μέσων όπως το Twitter και το Reddit. Η δικηγορική εταιρεία ισχυρίζεται ότι το OpenAI «το έκανε κρυφά και χωρίς να εγγραφεί ως μεσίτης δεδομένων, όπως έπρεπε να κάνει σύμφωνα με την ισχύουσα νομοθεσία».


ΔΕΙΤΕ ΕΠΙΣΗΣ:

Οι δικηγόροι επέβαλαν πρόστιμο 5.000 $ για τη χρήση του ChatGPT για την υποβολή αγωγής γεμάτη με ψεύτικες υποθέσεις

Το OpenAI έχει αποτελέσει αντικείμενο διαμάχης για το πώς και ποια δεδομένα συλλέγει για την εκπαίδευση και την περαιτέρω ανάπτυξη του ChatGPT. Μέχρι πρόσφατα, δεν υπήρχε σαφής τρόπος για τους χρήστες να εξαιρεθούν από το να επιτρέψουν στο OpenAI να χρησιμοποιεί τις συνομιλίες και τα προσωπικά τους στοιχεία για να τροφοδοτήσει το μοντέλο. Το ChatGPT αρχικά απαγορεύτηκε στην Ιταλία, χρησιμοποιώντας τον Ευρωπαϊκό Γενικό Κανονισμό Προστασίας Δεδομένων (GDPR), για ανεπαρκή προστασία των δεδομένων χρηστών, ειδικά όταν πρόκειται για ανηλίκους. Αυτή η μήνυση περιλαμβάνει τις αδιαφανείς πολιτικές απορρήτου του OpenAI για τους υπάρχοντες χρήστες, αλλά εστιάζει σε μεγάλο βαθμό σε δεδομένα που έχουν αφαιρεθεί από τον ιστό που δεν προοριζόταν ποτέ να κοινοποιηθούν ρητά στο ChatGPT. Μέσω επενδύσεων δισεκατομμυρίων δολαρίων από τη Microsoft και εσόδων συνδρομητών για το ChatGPT Plus, το OpenAI επωφελήθηκε από αυτά τα δεδομένα χωρίς να αποζημιώσει την πηγή τους.

Οι 15 κατηγορίες στην καταγγελία περιλαμβάνουν παραβίαση του απορρήτου, αμέλεια για αποτυχία προστασίας προσωπικών δεδομένων και κλοπή μέσω της παράνομης απόκτησης τεράστιων ποσοτήτων προσωπικών δεδομένων για την εκπαίδευση των μοντέλων της. Σύνολα δεδομένων όπως το Common Crawl, η Wikipedia και το Reddit, που περιλαμβάνουν προσωπικά στοιχεία, είναι δημόσια διαθέσιμα εφόσον οι εταιρείες ακολουθούν τα πρωτόκολλα για την αγορά και τη χρήση αυτών των δεδομένων. Ωστόσο, το OpenAI φέρεται να χρησιμοποίησε αυτά τα δεδομένα χωρίς την άδεια ή τη συγκατάθεση των χρηστών στο πλαίσιο του ChatGPT. Παρόλο που τα προσωπικά στοιχεία των ανθρώπων είναι δημόσια σε ιστότοπους κοινωνικών μέσων, ιστολόγια και άρθρα, εάν τα δεδομένα χρησιμοποιούνται εκτός της προβλεπόμενης πλατφόρμας, μπορεί να θεωρηθούν παραβίαση του απορρήτου.

Στην Ευρώπη, υπάρχει μια νομική διάκριση μεταξύ δεδομένων δημόσιου τομέα και δεδομένων ελεύθερης χρήσης, χάρη στο νόμο GDPR, αλλά στις ΗΠΑ, αυτό είναι ακόμα προς συζήτηση. Ο Nader Henein, αντιπρόεδρος της Gartner για την έρευνα απορρήτου, ο οποίος πιστεύει ότι το συναίσθημα της αγωγής είναι έγκυρο, είπε: «Οι άνθρωποι θα πρέπει να έχουν τον έλεγχο ως προς τον τρόπο χρήσης των δεδομένων τους, ακόμη και όταν είναι διαθέσιμα στο δημόσιο τομέα». Αλλά ο Henein δεν είναι σίγουρος εάν το νομικό σύστημα των ΗΠΑ θα συμφωνούσε.

Ο Ryan Clarkson, διευθύνων εταίρος είπε στην εταιρεία

ανάρτηση

(ανοίγει σε νέα καρτέλα)


, είναι κρίσιμο να δράσουμε τώρα με τους υπάρχοντες νόμους αντί να περιμένουμε την εκτελεστική και δικαστική εξουσία να ανταποκριθεί με ομοσπονδιακό κανονισμό. “Δεν έχουμε την πολυτέλεια να πληρώσουμε το κόστος των αρνητικών αποτελεσμάτων με την τεχνητή νοημοσύνη όπως κάναμε με τα μέσα κοινωνικής δικτύωσης ή όπως κάναμε με τα πυρηνικά. Ως κοινωνία, το τίμημα που θα πληρώσουμε όλοι είναι πολύ μεγάλο.”


mashable.com



You might also like


Leave A Reply



Cancel Reply

Your email address will not be published.