Ο ιστότοπος Fiction Analytics Το Prosecraft τερματίστηκε μετά από αντιδράσεις
Το Prosecraft.io, ένας ιστότοπος που χρησιμοποίησε μυθιστορήματα για να βοηθήσει στην εξουσία α
έργο που βασίζεται σε δεδομένα
για την εμφάνιση του αριθμού λέξεων, της παθητικής φωνής και άλλων πολύ πιο υποκειμενικών δεικτών σε στυλ γραφής, όπως η ζωηρότητα, έκλεισε σήμερα αφού οι συγγραφείς διαμαρτυρήθηκαν για το έργο. Η Prosecraft χρησιμοποίησε το
πλήρες κείμενο με περισσότερα από 25.000 βιβλία
—το οποίο είναι εξ ολοκλήρου αντιγραφικό υλικό— προκειμένου να αναπτυχθεί μια βιβλιοθήκη δεδομένων. Οι συγγραφείς, μόλις αντιλήφθηκαν τι συνέβαινε,
το μίσησε αμέσως αυτό
.
Ο Zach Rosenberg ήταν ο συγγραφέας που έφερε για πρώτη φορά αυτόν τον ιστότοπο στην ευρύτερη προσοχή των συγγραφέων στο X, τον ιστότοπο που ήταν παλαιότερα γνωστός ως Twitter. Πολύ σύντομα, όλο και περισσότεροι συγγραφείς μίλησαν, μεταξύ των οποίων και συγγραφείς υψηλού προφίλ όπως ο Jeff VanderMeer (
Η νότια προσέγγιση
τριλογία), Indra Das (
Οι Καταβροχθιστές
), Γκρέτσεν Φέλκερ-Μάρτιν (
Ανθρωποκυνηγητό
)
Μέρος αυτού οφείλεται στο γεγονός ότι η Prosecraft έχει παραδεχτεί ότι χρησιμοποιεί “
Αλγόριθμοι AI
.» Σε μια ανάρτηση ιστολογίου με ημερομηνία 5 Οκτωβρίου 2018, ο Benji Smith, ο προγραμματιστής τόσο του Prosecraft όσο και του προγράμματος γραφής Shaxpir που βασίστηκε στα δεδομένα που εξάχθηκαν από τη βιβλιοθήκη του Prosecraft, δήλωσε ότι «διδάξαμε τη μηχανική μας μάθηση [AI] αλγόριθμους για να αναγνωρίσουν ποια είδη λέξεων μπορούν να χρησιμοποιηθούν σε ποια είδη συμφραζομένων, εξετάζοντας τους τύπους λέξεων και φράσεων που τείνουν να εμφανίζονται σε παρόμοιες προτάσεις και παραγράφους.” Επιπλέον, έγραψε ότι ο Shaxpir “[analyzed] περισσότερες από 560 εκατομμύρια λέξεις μυθοπλασίας, από περισσότερα από 5.800 βιβλία, γραμμένα από περισσότερους από 3.300 δημοφιλείς συγγραφείς». Δεν αποκαλύπτει πού έλαβε αυτά τα έργα μυθοπλασίας ή αν έλαβε ή όχι άδεια να το κάνει.
Ενώ η τεχνολογία που χρησιμοποιείται δεν είναι
αναγκαίως
ένα μεγάλο μοντέλο παραγωγής γλωσσών όπως το ChatGPT, δεν είναι κουραστικό να πούμε ότι η ενσωμάτωση αλγορίθμων δημιουργίας LLM θα μπορούσε να ήταν στον ορίζοντα για το Prosecraft. Και δεδομένου ότι ο ιστότοπος είχε μια τεράστια βιβλιοθήκη βιβλίων, οι φόβοι του συγγραφέα είναι απίστευτα βάσιμοι. Στον απόηχο αυτής της αντίδρασης, ο Smith έγραψε α
μακροσκελές ιστολόγιο σε μέσο
εξηγώντας γιατί κατέρριψε οικειοθελώς το Prosecraft.
Αν και η Prosecraft χρησιμοποιούσε μόνο τμήματα του κειμένου, δεν είχε άδεια από κανέναν συγγραφέα ή εκδότη να δημιουργήσει μια βάση δεδομένων με βάση το σύνολο του έργου ενός συγγραφέα ή το πλήρες κείμενο ενός βιβλίου. Ο Smith έγραψε στο ιστολόγιο, «καθώς δημοσίευα μόνο συνοπτικά στατιστικά στοιχεία και μικρά αποσπάσματα από το κείμενο αυτών των βιβλίων, πίστευα ότι τιμούσα το πνεύμα του δόγματος της δίκαιης χρήσης, το οποίο δεν απαιτεί τη συγκατάθεση του αρχικού συγγραφέα. ”
Ενώ ισχύει αυτό
μερικοί
νερό, η Δίκαιη Χρήση δεν σας επιτρέπει, σε καμία περίπτωση, να χρησιμοποιήσετε ολόκληρο το συγγραφικό έργο ενός συγγραφέα χωρίς άδεια ως μέρος ενός προγράμματος εκπαίδευσης δεδομένων που τροφοδοτεί το δικό σας «AI
αλγόριθμος.” Αν και αυτή η κατάσταση θα είναι σίγουρα ένα μάθημα για πολλούς ανθρώπους, είναι σαφές ότι οι συγγραφείς δεν πρόκειται να επιτρέψουν τη χρήση της δουλειάς τους για την εκπαίδευση LLM και διανυσματικών δικτύων.
Θέλετε περισσότερα νέα για το io9; Δείτε πότε να περιμένετε τα νεότερα
Θαύμα
,
Πόλεμος των άστρων
και
Star Trek
κυκλοφορίες, τι ακολουθεί για το
DC Universe σε ταινίες και τηλεόραση
και όλα όσα πρέπει να γνωρίζετε για το μέλλον του
Γιατρός Who
.


