Το Πανεπιστήμιο του Μίσιγκαν λέει ότι δεν πουλά δεδομένα φοιτητών σε εταιρείες τεχνητής νοημοσύνης




πρωί της Πέμπτης, έγινε γνωστό ότι κάποιος κυκλοφορούσε πουλώντας δεδομένα φοιτητών από το Πανεπιστήμιο του Μίσιγκαν σε εργαζόμενους στον τομέα της τεχνολογίας που κατασκευάζουν τεχνολογία chatbot AI. Ένας υπάλληλος στο Google DeepMind, τον ερευνητικό κόμβο τεχνητής νοημοσύνης της εταιρείας, είπε ότι έλαβαν μια προσφορά για ηχογραφήσεις διαλέξεων, συζητήσεις φοιτητών και ώρες γραφείου, καθώς και δοκίμια γραμμένα από ηλικιωμένους και μεταπτυχιακούς φοιτητές, όλα διαθέσιμα με ένα ασήμαντο τέλος άδειας. Τώρα, το Πανεπιστήμιο λέει ότι όλα ήταν μια παρεξήγηση, ότι οι φοιτητές έδωσαν τη συγκατάθεσή τους και δεν υπάρχει τίποτα ανησυχητικό.

Η Susan Zhang, μηχανικός στο DeepMind, είπε ότι είχε λάβει ένα χορηγούμενο

στο LinkedIn που περιείχε τις πληροφορίες και πρόσφερε ένα δωρεάν δείγμα δεδομένων του Πανεπιστημίου του Μίσιγκαν για να αποδείξει την αξία του.

“Επικοινωνώ γιατί, με βάση το προφίλ σας, μπορεί να εργάζεστε με μοντέλα Large Language (LLM’s) ή επεξεργασία φυσικής γλώσσας”, ανέφερε το μήνυμα πωλήσεων. «Ήθελα να σας ενημερώσω ότι το Πανεπιστήμιο του Μίσιγκαν αδειοδοτεί ακαδημαϊκά δεδομένα ομιλίας και φοιτητικές εργασίες που θα μπορούσαν να είναι πολύ χρήσιμες για εκπαίδευση ή συντονισμό LLM».

Το μήνυμα προσφέρει δεδομένα από διαλέξεις διάρκειας 85 ωρών, ενότητες συζήτησης και συνεντεύξεις για 15.595 $, ένα δεύτερο σετ 829 εργασιών που γράφτηκαν από φοιτητές του Πανεπιστημίου του Μίσιγκαν σε διάφορους κλάδους για 12.595 $ ή ένα πακέτο έκπτωσης και για τα δύο σύνολα δεδομένων στα 25.000 $.

Ωστόσο, το μήνυμα “εστάλη από έναν

τρίτο προμηθευτή που μοιράστηκε ανακριβείς πληροφορίες και έκτοτε του ζητήθηκε να σταματήσει τη δουλειά του”, δήλωσε η Colleen Mastony, εκπρόσωπος του Πανεπιστημίου του Μίσιγκαν, σε ένα email. «Δεν έγινε καμία συναλλαγή ή κοινή χρήση περιεχομένου από τον προμηθευτή. Τα δεδομένα των φοιτητών δεν ήταν και δεν ήταν ποτέ προς πώληση από το Πανεπιστήμιο του Μίσιγκαν». Ο Mastony δεν μοιράστηκε λεπτομέρειες σχετικά με το ποιος ήταν αυτός ο πωλητής ή τι ακριβώς ήταν ανακριβές σχετικά με τις πληροφορίες που πρόσφεραν.

Το Πανεπιστήμιο μπορεί να μην πουλά τα δεδομένα απευθείας, αλλά προσφέρεται (ή προσφέρεται) προς πώληση από έναν οργανισμό που ονομάζεται Catalyst Research Alliance, ο οποίος ισχυρίζεται ότι συνεργάζεται με το Πανεπιστήμιο του Μίσιγκαν καθώς και το Κρατικό Πανεπιστήμιο της Βόρειας Καρολίνας. ο


ο ιστότοπος προσφέρει ένα δείγμα του συνόλου δεδομένων


το οποίο συνοδεύεται από ένα δοκίμιο με τίτλο «Οι δημοκρατικές ανεπάρκειες της Ευρωπαϊκής Ένωσης» και αυτό που φαίνεται να είναι ηχογράφηση μιας

ς συζήτησης στην τάξη.

Η Catalyst Research Alliance και το North Carolina State University δεν απάντησαν αμέσως στα αιτήματα για σχολιασμό.

Σύμφωνα με τον Mastony, οι ηχογραφήσεις και οι εργασίες συνεισφέρθηκαν από εθελοντές φοιτητές που συμμετείχαν σε ερευνητικές μελέτες δύο δεκαετιών και κανένα από τα δεδομένα δεν περιελάμβανε ονόματα μαθητών ή άλλες προσωπικές πληροφορίες. δωρεάν στους ακαδημαϊκούς –και πάλι χωρίς καμία πληροφορία ταυτοποίησης– και έχουν χρησιμοποιηθεί ως εργαλείο για τη βελτίωση της γραφής και της άρθρωσης στην εκπαίδευση», είπε ο Mastony.

“Πιστεύω ότι αξίζει να επιδιώξουμε ποια πανεπιστήμια πωλούν δεδομένα φοιτητών και ποιοι είναι οι όροι”, είπε ο Zhang στο Gizmodo σε ένα μήνυμα στο X. “Η αδειοδότηση είναι καλύτερη από την απόρριψη δεδομένων χωρίς αναφορά, αλλά οι αγωγοί απόδοσης εδώ πιθανότατα έχουν κατασκευαστεί μόνο στα μισά του δρόμου (γνωστός και ως πρωτότυπος οι δημιουργοί δεν θα βλέπουν δεκάρα, ενώ ο μεταπωλητής που αποθηκεύει δεδομένα θα έχει όλα τα κέρδη).»

Η εκπαίδευση μοντέλων μεγάλων γλωσσών, όπως το

που εκτελεί chatbots, όπως το ChatGPT και το Bard, απαιτεί τεράστια, σαφώς επισημασμένα σύνολα δεδομένων σε διάφορα θέματα και κλάδους. Ενώ το σύνολο δεδομένων του Πανεπιστημίου του Μίσιγκαν είναι μικρό, το καλά οργανωμένο περιεχόμενο σε μια στενή σειρά θεμάτων θα μπορούσε να είναι χρήσιμο για τον συντονισμό ορισμένων μοντέλων, ιδιαίτερα για εργαλεία που έχουν σχεδιαστεί για συγκεκριμένους σκοπούς που σχετίζονται με την ακαδημαϊκή κοινότητα, την επίσημη επικοινωνία ή την εκπαίδευση γενικότερων AI για τη βελτίωση τους. απόδοση σε επιμέρους τομείς εξειδίκευσης σε θέματα.


Ενημέρωση 15/02/2024, 5:45 μ.μ. ET:

Αυτή η ιστορία έχει ενημερωθεί με σχόλια από το Πανεπιστήμιο του Μίσιγκαν.


VIA:

gizmodo.com


Follow TechWar.gr on Google News


Leave A Reply



Cancel Reply

Your email address will not be published.