Όλοι θα πρέπει να ανησυχούμε για τη διείσδυση της τεχνητής νοημοσύνης σε εργασίες που προέρχονται από το crowdsource
Ένα νέο χαρτί
από ερευνητές στο ελβετικό πανεπιστήμιο EPFL
προτείνει
ότι μεταξύ 33% και 46% των κατανεμημένων εργαζομένων στο πλήθος στην υπηρεσία Mechanical Turk της
Amazon
φαίνεται να έχουν «απατήσει» όταν εκτελούσαν μια συγκεκριμένη εργασία που τους είχε ανατεθεί, καθώς χρησιμοποίησαν εργαλεία όπως το
ChatGPT
για να κάνουν μέρος της δουλειάς. Εάν αυτή η πρακτική είναι ευρέως διαδεδομένη, μπορεί να αποδειχθεί πολύ σοβαρό ζήτημα.
Μηχανικός Τούρκος της Amazon
είναι εδώ και καιρό καταφύγιο για απογοητευμένους προγραμματιστές που θέλουν να κάνουν δουλειά από ανθρώπους. Με λίγα λόγια, είναι μια διεπαφή προγραμματισμού εφαρμογών (API) που τροφοδοτεί εργασίες σε ανθρώπους, οι οποίοι τις εκτελούν και στη συνέχεια επιστρέφουν τα αποτελέσματα. Αυτές οι εργασίες είναι συνήθως το είδος στο οποίο θα θέλατε οι υπολογιστές να είναι καλύτεροι. Σύμφωνα με την Amazon, ένα παράδειγμα τέτοιων εργασιών θα ήταν: «Σχεδίαση οριοθετημένων πλαισίων για τη δημιουργία συνόλων δεδομένων υψηλής ποιότητας για μοντέλα υπολογιστικής όρασης, όπου η εργασία μπορεί να είναι πολύ ασαφής για μια καθαρά μηχανική λύση και πολύ μεγάλη ακόμη και για μια μεγάλη ομάδα ανθρώπων ειδικών. ”
Οι επιστήμονες δεδομένων αντιμετωπίζουν διαφορετικά τα σύνολα δεδομένων ανάλογα με την προέλευσή τους — εάν δημιουργούνται από άτομα ή ένα μεγάλο γλωσσικό μοντέλο (LLM). Ωστόσο, το πρόβλημα εδώ με το Mechanical Turk είναι χειρότερο από όσο ακούγεται: η τεχνητή νοημοσύνη είναι πλέον διαθέσιμη αρκετά φθηνά ώστε οι διαχειριστές προϊόντων που επιλέγουν να χρησιμοποιήσουν το Mechanical Turk έναντι μιας λύσης που δημιουργείται από μηχανή βασίζονται στο ότι οι άνθρωποι είναι καλύτεροι σε κάτι από τα ρομπότ. Η δηλητηρίαση αυτού του πηγαδιού δεδομένων θα μπορούσε να έχει σοβαρές επιπτώσεις.
«Η διάκριση των LLM από το κείμενο που δημιουργείται από τον άνθρωπο είναι δύσκολη τόσο για τα μοντέλα μηχανικής μάθησης όσο και για τους ανθρώπους», είπαν οι ερευνητές. Ως εκ τούτου, οι ερευνητές δημιούργησαν μια μεθοδολογία για να υπολογίσουν εάν το περιεχόμενο που βασίζεται σε κείμενο δημιουργήθηκε από άνθρωπο ή μηχανή.
Το τεστ περιελάμβανε να ζητηθεί από εργαζομένους που συνεργάζονταν με το crowdsource να συμπυκνώσουν ερευνητικές περιλήψεις από το New England Journal of Medicine σε περιλήψεις 100 λέξεων. Αξίζει να σημειωθεί ότι αυτό είναι
ακριβώς
το είδος της εργασίας στην οποία είναι καλές οι παραγωγικές τεχνολογίες AI, όπως το ChatGPT.


