Το OpenAI απορρίπτει τη αγωγή των NYT, λέει ότι η δημοσίευση εξαπάτησε το ChatGPT για να αντιγράψει τα άρθρα του

By

Marizas Dimitris

On

Ιαν 9, 2024

Το OpenAI δημοσίευσε μια επίσημη απάντηση στη μήνυση που κατατέθηκε από τους New York Times υποστηρίζοντας ότι η εταιρεία χρησιμοποίησε τα άρθρα της χωρίς άδεια για να εκπαιδεύσει το Large Language Model (LLM).

Σε ένα

Επιστολή που δημοσιεύθηκε από το OpenAI

, η εταιρεία διέψευσε τους ισχυρισμούς των New York Times, ενώ σημείωσε ότι η δημοσίευση κατασκεύασε τις προτροπές για την ανάκτηση δεδομένων που σχετίζονται με άρθρα των Times. Η παλινδρόμηση είναι μια διαδικασία όπου τα μοντέλα τεχνητής νοημοσύνης παρέχουν επί λέξει δεδομένα εκπαίδευσης όταν ζητούνται με συγκεκριμένο τρόπο.

Είναι ενδιαφέρον ότι οι παλινδρομήσεις που προκάλεσαν οι New York Times φαίνεται να προέρχονται από άρθρα παλιάς ηλικίας που έχουν πολλαπλασιαστεί σε πολλούς ιστότοπους τρίτων. Φαίνεται ότι σκόπιμα χειραγωγούσαν τις προτροπές, που συχνά περιλαμβάνουν μεγάλα αποσπάσματα άρθρων, προκειμένου να κάνουν το μοντέλο μας να ανακάμψει. Ακόμη και όταν χρησιμοποιούν τέτοιες προτροπές, τα μοντέλα μας δεν συμπεριφέρονται συνήθως με τον τρόπο που υπαινίσσονται οι New York Times, κάτι που υποδηλώνει ότι είτε έδωσαν εντολή στο μοντέλο να αναμείξει ή επέλεξαν τα παραδείγματά τους από πολλές προσπάθειες.

Η εταιρεία αναφέρει ότι δεν είχαν πληροφορίες για τη μήνυση και το έμαθαν όταν τη διάβασαν στους New York Times.

Είχαμε εξηγήσει στους New York Times ότι, όπως κάθε μεμονωμένη πηγή, το περιεχόμενό τους δεν συνέβαλε ουσιαστικά στην εκπαίδευση των υφιστάμενων μοντέλων μας και επίσης δεν θα είχε επαρκή αντίκτυπο για μελλοντική εκπαίδευση. Η αγωγή τους στις 27 Δεκεμβρίου —για την οποία μάθαμε διαβάζοντας τους New York Times— μας προκάλεσε έκπληξη και απογοήτευση.

Το OpenAI είπε επίσης ότι οι Times είχαν αναφέρει περιπτώσεις παλινδρόμησης όταν τα δύο μέρη συνεργάζονταν, αλλά δεν παρείχαν παραδείγματα όταν ρωτήθηκαν σχετικά. Η εταιρεία σημείωσε ότι αντιμετωπίζει τους ισχυρισμούς για παλινδρόμηση με ύψιστη προτεραιότητα και παρείχε παράδειγμα αφαίρεσης του Bing Integration για να υποστηρίξει τον ισχυρισμό τους.

Στην πορεία, είχαν αναφέρει ότι είδαν κάποια παλινδρόμηση του περιεχομένου τους, αλλά αρνήθηκαν επανειλημμένα να μοιραστούν οποιοδήποτε παράδειγμα, παρά τη δέσμευσή μας να διερευνήσουμε και να διορθώσουμε τυχόν προβλήματα. Έχουμε αποδείξει πόσο σοβαρά αντιμετωπίζουμε αυτό ως προτεραιότητα, όπως τον Ιούλιο, όταν καταργήσαμε μια λειτουργία ChatGPT αμέσως αφού μάθαμε ότι μπορούσε να αναπαράγει περιεχόμενο σε πραγματικό χρόνο με ακούσιους τρόπους.

Η επιστολή επικεντρώθηκε επίσης σε άλλα σημεία, συμπεριλαμβανομένης της συμφωνίας αδειοδότησης μεταξύ πρακτορείων ειδήσεων όπως το Associated Press, το Axel Springer, το American Journalism Project και το NYU. Το OpenAI μίλησε επίσης για τη δίκαιη χρήση λέγοντας ότι εάν το περιεχόμενο είναι διαθέσιμο στο Διαδίκτυο, εμπίπτει στον κανονισμό ορθής χρήσης και μπορεί να χρησιμοποιηθεί για την εκπαίδευση μοντέλων AI.

Η εκπαίδευση μοντέλων τεχνητής νοημοσύνης χρησιμοποιώντας δημοσίως διαθέσιμο διαδικτυακό υλικό είναι δίκαιη χρήση, όπως υποστηρίζεται από μακροχρόνια και ευρέως αποδεκτά προηγούμενα. Θεωρούμε αυτή την αρχή ως δίκαιη για τους δημιουργούς, απαραίτητη για τους καινοτόμους και κρίσιμη για την ανταγωνιστικότητα των ΗΠΑ.

Ωστόσο, το OpenAI παρέχει μια επιλογή εξαίρεσης εάν κάποιος δεν θέλει τα δεδομένα του να χρησιμοποιηθούν για την εκπαίδευση μοντέλων AI. Σημείωσε επίσης ότι οι New York Times είχαν ασκήσει αυτήν την επιλογή τον Αύγουστο του 2023.

Τούτου λεχθέντος, το νόμιμο δικαίωμα είναι λιγότερο σημαντικό για εμάς από το να είμαστε καλοί πολίτες. Έχουμε οδηγήσει τον κλάδο της τεχνητής νοημοσύνης στην παροχή μιας απλής διαδικασίας εξαίρεσης για τους εκδότες (την οποία υιοθέτησαν οι New York Times τον Αύγουστο του 2023) για να εμποδίσουν τα εργαλεία μας να έχουν πρόσβαση στους ιστότοπούς τους.

Οι New York Times δεν είναι οι μόνοι που μήνυσαν την OpenAI και τη Microsoft για μη εξουσιοδοτημένη χρήση δεδομένων. Νωρίτερα αυτή την εβδομάδα, δύο συγγραφείς κατέθεσαν επίσης μήνυση υποστηρίζοντας ότι το OpenAI χρησιμοποίησε τη δημοσιευμένη εργασία τους για να εκπαιδεύσει τα μοντέλα τεχνητής νοημοσύνης του.

VIA:

NeoWin.net