Το Reddit κερδίζει εκατομμύρια δολάρια με την αδειοδότηση δεδομένων – Μάθε πώς έγινε το θαύμα!
Οι προοπτικές του Reddit καθώς κινδυνεύει να εισαχθεί στο χρηματιστήριο έχουν πολύ περισσότερο να κάνουν με τις σχέσεις με προμηθευτές τεχνητής νοημοσύνης όπως το OpenAI από ό,τι θα περίμενε κανείς.
Στο ενημερωτικό δελτίο IPO
που
κατέθεσε σήμερα στην
Επιτροπή Κεφαλαιαγοράς
των ΗΠΑ, η Reddit τόνισε επανειλημμένα πόσα πιστεύει ότι μπορεί να κερδίσει – και έχει κερδίσει – από συμφωνίες αδειοδότησης δεδομένων με εταιρείες που εκπαιδεύουν μοντέλα τεχνητής νοημοσύνης στις πάνω από 1 δισεκατομμύριο αναρτήσεις της και σε περισσότερες από 16 δισεκατομμύρια σχόλια.
«Τον Ιανουάριο του 2024, συνάψαμε ορισμένες συμφωνίες αδειοδότησης δεδομένων με συνολική αξία συμβολαίου 203,0 εκατομμύρια δολάρια και όρους που κυμαίνονται από δύο έως τρία χρόνια», αναφέρει το ενημερωτικό δελτίο. «Αναμένουμε τουλάχιστον 66,4 εκατομμύρια δολάρια εσόδων να αναγνωριστούν κατά τη διάρκεια του έτους που λήγει στις 31 Δεκεμβρίου 2024 και το υπόλοιπο στη συνέχεια».
Τώρα, είναι ένα μυστήριο ως προς το ποιοι προμηθευτές τεχνητής νοημοσύνης αδειοδοτούν δεδομένα από το Reddit μέχρι στιγμής. Νωρίτερα αυτή την εβδομάδα, το Bloomberg και το Reuters
έχουν αναφερθεί
ότι μια «μεγάλη ανώνυμη εταιρεία τεχνητής νοημοσύνης» —
πιθανώς Google
— είχε συνάψει συμφωνία αδειοδότησης αξίας περίπου 60 εκατομμυρίων δολαρίων σε ετήσια βάση. Αλλά το OpenAI δεν θα ήταν επίσης
ένας
εκπληκτικός πελάτης, ειδικά αν σκεφτεί κανείς ότι ο CEO του OpenAI Sam Altman έχει 8,7%
στοίχημα
στο Reddit (καθιστώντας τον τον τρίτο μεγαλύτερο μέτοχο) και κάποτε ήταν μέλος του διοικητικού συμβουλίου της εταιρείας.
Γιατί τα δεδομένα του Reddit είναι πολύτιμα; Όπως εξηγεί το Reddit, τα μοντέλα τεχνητής νοημοσύνης «μαθαίνουν» από παραδείγματα για να κατασκευάζουν δοκίμια, κώδικα, email, άρθρα και άλλα, και προμηθευτές όπως το OpenAI σκουπίζουν τον ιστό εκατομμύρια έως δισεκατομμύρια από αυτά τα παραδείγματα για να τα προσθέσουν στα εκπαιδευτικά τους σετ. Μερικά παραδείγματα βρίσκονται σε δημόσιο τομέα. Άλλα δεν είναι, ή — στην περίπτωση του περιεχομένου του Reddit — υπόκεινται σε περιοριστικές άδειες που απαιτούν παραπομπές ή συγκεκριμένες μορφές αποζημίωσης.
Το Reddit προηγουμένως δεν παρείχε πρόσβαση στα δεδομένα του για σκοπούς εκπαίδευσης AI. Αλλά αντέστρεψε την πορεία του πέρυσι, υποστηρίζοντας ότι τα δεδομένα της δεν θα έπρεπε να είναι – σύμφωνα με τα λόγια του CEO Steve Huffman – «[given] σε μερικές από τις μεγαλύτερες εταιρείες στον κόσμο δωρεάν.”
“[Our] Τα API δεδομένων είναι σε θέση να παρέχουν πρόσβαση σε πραγματικό χρόνο σε εξελισσόμενα και δυναμικά θέματα όπως αθλήματα, ταινίες,
ειδήσεις
, μόδα και τις τελευταίες τάσεις», συνεχίζει το ενημερωτικό δελτίο. «Πιστεύουμε ότι το τεράστιο σύνολο δεδομένων και γνώσεων συνομιλίας του Reddit θα συνεχίσει να παίζει ρόλο στην εκπαίδευση και τη βελτίωση των μεγάλων γλωσσικών μοντέλων. Καθώς το περιεχόμενό μας ανανεώνεται και μεγαλώνει καθημερινά, αναμένουμε ότι τα μοντέλα θα θέλουν να αντανακλούν αυτές τις νέες ιδέες και να ενημερώνουν την εκπαίδευσή τους χρησιμοποιώντας δεδομένα του Reddit».
Οι παραγωγοί περιεχομένου, από βιβλιοθήκες μέσων μαζικής ενημέρωσης έως εκδότες ειδήσεων, στρέφονται όλο και περισσότερο σε συμφωνίες αδειοδότησης δεδομένων με προμηθευτές τεχνητής νοημοσύνης καθώς τα chatbots όπως το ChatGPT του OpenAI και το Gemini της Google απειλούν να μειώσουν την κυκλοφορία. Ένα πρόσφατο μοντέλο από το The Atlantic
βρέθηκαν
ότι, εάν μια μηχανή αναζήτησης όπως η Google ενσωματώνει την τεχνητή νοημοσύνη στην αναζήτηση, θα απαντούσε στο ερώτημα ενός χρήστη το 75% των περιπτώσεων χωρίς να απαιτείται κλικ στον ιστότοπό της.
Οι πωλητές, με τη σειρά τους, έχουν παρακινηθεί να επιδιώξουν συμφωνίες αδειοδότησης καθώς αντιμετωπίζουν έναν κατακλυσμό από αγωγές που ισχυρίζονται ότι δεν έχουν νομική δικαιολογία για την εκπαίδευση των μοντέλων τους σε δεδομένα χωρίς άδεια ή πληρωμή. Πρόσφατα, οι New York Times κατηγόρησαν την OpenAI ότι χτίζει αποτελεσματικά ανταγωνιστές εκδοτών ειδήσεων χρησιμοποιώντας τα έργα της, βλάπτοντας την επιχείρησή της.
Το OpenAI, για ένα, έχει συνάψει συμφωνίες με τη γκαλερί εικόνων Shutterstock καθώς και με εκδότες όπως ο Axel Springer, ο ιδιοκτήτης του Politico και του Business Insider. Οι άδειες είναι
έχουν αναφερθεί
να είναι αρκετά μικρό, ωστόσο — ξεπερνώντας τα 5 εκατομμύρια δολάρια ετησίως.
VIA:
techcrunch.com

