Χρήση αναρτήσεων σε Tumblr και WordPress για εκπαίδευση των OpenAI και Midjourney
Το Tumblr και το WordPress φέρεται να συνάψουν συμφωνίες για την πώληση δεδομένων χρηστών στις εταιρείες τεχνητής νοημοσύνης OpenAI και Midjourney.
404 Μέσα
Αναφορές
ότι η μητρική εταιρεία των πλατφορμών,
Automattic
, πλησιάζει στην ολοκλήρωση μιας συμφωνίας για την παροχή δεδομένων που θα βοηθήσουν στην εκπαίδευση των μοντέλων των εταιρειών AI.
Δεν είναι σαφές ποια δεδομένα θα συμπεριληφθούν, αλλά η αναφορά υποδηλώνει ότι η Automattic μπορεί να είχε υπερβεί αρχικά. Μια υποτιθέμενη εσωτερική ανάρτηση από τον υπεύθυνο προϊόντων του Tumblr, Cyle Gage, προτείνει ότι η Automattic είναι έτοιμη να στείλει προσωπικά δεδομένα ή δεδομένα που σχετίζονται με συνεργάτες που δεν έπρεπε να συμπεριληφθούν στη συμφωνία. Το αμφισβητήσιμο
περιεχόμενο
φέρεται να περιελάμβανε ιδιωτικές αναρτήσεις σε δημόσιες αναρτήσεις ιστολογίου, διαγραμμένα ή σε αναστολή ιστολογίων, αναπάντητα (επομένως, μη δημοσιευμένα) ερωτήσεις, ιδιωτικές απαντήσεις, αναρτήσεις με ρητά επισήμανση και περιεχόμενο από ιστολόγια συνεργατών premium (όπως ο πρώην ιστότοπος
μουσική
ς της Apple).
Η εσωτερική ανάρτηση υποδηλώνει ότι οι μηχανικοί της Automattic ετοιμάζουν μια λίστα με αναγνωριστικά αναρτήσεων που θα έπρεπε να είχαν αποκλειστεί. Δεν είναι σαφές εάν τα δεδομένα είχαν ήδη σταλεί στις εταιρείες τεχνητής νοημοσύνης.
Το Engadget έστειλε μήνυμα ηλεκτρονικού ταχυδρομείου στο Automattic για να ζητήσει σχόλιο για την αναφορά. Η εταιρεία απάντησε με α
δημοσιευμένη δήλωση
, υποστηρίζοντας, “Θα κοινοποιήσουμε μόνο δημόσιο περιεχόμενο που φιλοξενείται στο WordPress.com και στο Tumblr από ιστότοπους που δεν έχουν εξαιρεθεί.” Η δήλωση σημειώνει ότι οι νομικοί κανονισμοί δεν απαιτούν επί του παρόντος από τους ανιχνευτές ιστού των εταιρειών τεχνητής νοημοσύνης να συμμορφώνονται με τις προτιμήσεις εξαίρεσης των χρηστών.
Η τελευταία γραμμή της δήλωσης της Automattic φαίνεται να ευθυγραμμίζεται με τις αναφερόμενες συμφωνίες. «Εργαζόμαστε επίσης απευθείας με επιλεγμένες εταιρείες τεχνητής νοημοσύνης, εφόσον τα σχέδιά τους ευθυγραμμίζονται με αυτό που ενδιαφέρει η κοινότητά μας: απόδοση, εξαιρέσεις και έλεγχος», έγραψε η Automattic. «Οι συνεργασίες μας θα σέβονται όλες τις ρυθμίσεις εξαίρεσης. Σχεδιάζουμε επίσης να το κάνουμε ένα βήμα παραπέρα και να ενημερώνουμε τακτικά οποιονδήποτε συνεργάτη σχετικά με άτομα που εξαιρούνται πρόσφατα και ζητούν να αφαιρεθεί το περιεχόμενό τους από προηγούμενες πηγές και μελλοντική εκπαίδευση.”
Ο Διευθύνων Σύμβουλος της OpenAI, Sam Altman
(Μάικ Κόπολα μέσω Getty Images)
Η εταιρεία φέρεται να σχεδιάζει να λανσάρει ένα νέο εργαλείο εξαίρεσης την Τετάρτη που ισχυρίζεται ότι επιτρέπει στους χρήστες να αποκλείουν τρίτα μέρη – συμπεριλαμβανομένων εταιρειών τεχνητής νοημοσύνης – από την εκπαίδευση στα δεδομένα τους.
404 Μέσα
εξέτασε μια υποτιθέμενη εσωτερική Συχνές Ερωτήσεις Automattic που προετοιμάστηκε για το εργαλείο, η οποία περιλαμβάνει την απάντηση: “Εάν εξαιρεθείτε από την αρχή, θα αποκλείσουμε τα προγράμματα ανίχνευσης από την πρόσβαση στο περιεχόμενό σας προσθέτοντας τον ιστότοπό σας σε μια απαγορευμένη λίστα. Εάν αλλάξετε γνώμη αργότερα, σκοπεύουμε επίσης να ενημερώσουμε τυχόν συνεργάτες σχετικά με άτομα που εξαιρούνται πρόσφατα και ζητάμε να αφαιρεθεί το περιεχόμενό τους από προηγούμενες πηγές και μελλοντική εκπαίδευση.”
Η φράση, που την περιγράφει ως «ζητώντας» από τις εταιρείες τεχνητής νοημοσύνης να αφαιρέσουν τα δεδομένα, μπορεί να είναι σχετική.
Ένα εικαζόμενο εσωτερικό έγγραφο από τον επικεφαλής AI της Automattic, Andrew Spittle, απαντώντας σε ερώτηση του προσωπικού σχετικά με τις διαβεβαιώσεις αφαίρεσης δεδομένων κατά τη χρήση του εργαλείου, εξηγεί: «Θα ειδοποιούμε τους υπάρχοντες συνεργάτες σε τακτική βάση για οποιονδήποτε έχει εξαιρεθεί από την τελευταία φορά που παρείχαμε μια λίστα. Θέλω αυτή να είναι μια συνεχής διαδικασία όπου υποστηρίζουμε τακτικά τον αποκλεισμό του παρελθόντος περιεχομένου με βάση τις τρέχουσες προτιμήσεις. Θα ζητήσουμε να διαγραφεί το περιεχόμενο και να αφαιρεθεί από τυχόν μελλοντικές εκπαιδεύσεις. Πιστεύω ότι οι συνεργάτες θα το τιμήσουν με βάση τις συνομιλίες μας μαζί τους μέχρι εδώ. Δεν νομίζω ότι κερδίζουν πολλά συνολικά διατηρώντας το».
Έτσι, εάν ένας χρήστης του Tumblr ή του WordPress ζητήσει να εξαιρεθεί από την εκπαίδευση τεχνητής νοημοσύνης, η Automattic φέρεται να «ζητήσει» και «υποστηρίξει» την κατάργησή τους. Και το αφεντικό AI της εταιρείας «πιστεύει» ότι οι εταιρείες τεχνητής νοημοσύνης θα το βρουν προς το συμφέρον τους να συμμορφωθούν «βάσει των συνομιλιών μας». (Πώς είναι αυτό για σιγουριά!)
Οι συμφωνίες εκπαίδευσης δεδομένων τεχνητής νοημοσύνης έχουν γίνει μια προσοδοφόρα ευκαιρία για ιστότοπους που βαδίζουν στο νερό στο σημερινό ολισθηρό τοπίο των διαδικτυακών εκδόσεων. (Το προσωπικό του Tumblr φέρεται να μειώθηκε σε πλήρωμα σκελετού στα τέλη του 2023.) Την περασμένη εβδομάδα, η Google συνήψε συμφωνία με το Reddit (πριν από την IPO του τελευταίου) για εκπαίδευση στην τεράστια βάση γνώσεων της
πλατφόρμα
ς για περιεχόμενο που δημιουργήθηκε από χρήστες. Εν τω μεταξύ, το OpenAI ξεκίνησε ένα πρόγραμμα συνεργασίας πέρυσι για τη συλλογή συνόλων δεδομένων από τρίτους για να βοηθήσει στην εκπαίδευση των μοντέλων AI.
Ενημέρωση, 27 Φεβρουαρίου
2024
, 3:56 μ.μ. ET
: Αυτή η ιστορία έχει ενημερωθεί για να προσθέσει μια δημοσιευμένη δήλωση από τη μητρική εταιρεία του WordPress και του Tumblr, Automattic.
VIA:
engadget.com

