Το OpenAI θέλει να συνεργαστεί με οργανισμούς για τη δημιουργία νέων συνόλων δεδομένων εκπαίδευσης AI
λανσάρει ένα νέο πρόγραμμα συνεργασίας για τη συλλογή συνόλων δεδομένων από τρίτα μέρη που σκοπεύει να χρησιμοποιήσει για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης της. Η πρωτοβουλία, OpenAI Data Partnerships, θα αναζητήσει μεγάλης κλίμακας ιδιωτικές και δημόσιες πληροφορίες που λέει ότι «δεν είναι ήδη εύκολα προσβάσιμες στο διαδίκτυο στο κοινό». Η εταιρεία λέει ότι τα δεδομένα που θα συλλέξει δεν χρειάζεται απαραίτητα να είναι ποσοτικά ή σε μορφή κειμένου – το πρόγραμμα θα δέχεται επίσης εικόνες, ήχο ή βίντεο.
Συγκεκριμένα, η εταιρεία λέει ότι είναι σε επιφυλακή για δεδομένα για «οποιοδήποτε θέμα» και σε «οποιαδήποτε γλώσσα», εφόσον «εκφράζει την ανθρώπινη πρόθεση», την οποία παρομοιάζει με εκθέσεις μεγάλης διάρκειας ή μεταγραφές συνομιλιών. Τα ανθρωποκεντρικά δεδομένα που συλλέγονται από το OpenAI αναμένεται να βοηθήσουν την εταιρεία να βελτιώσει εργαλεία όπως το αυτόματο
που χρησιμοποιείται για τη μεταγραφή προφορικών λέξεων. Αυτή η πρωτοβουλία ευθυγραμμίζεται επίσης με την πρόσφατη επέκταση του ChatGPT για υποστήριξη
να αλληλεπιδρούν με τους χρήστες με συνομιλητικό τρόπο. Εκθέτοντας τα μοντέλα τεχνητής νοημοσύνης του σε περισσότερες πληροφορίες που του διδάσκουν πώς να αντέχει
θα βελτιώσει περαιτέρω αυτή τη δυνατότητα και άλλα εργαλεία που θα ακολουθήσουν σε λειτουργία.
Ανακοίνωση OpenAI Data Partnerships — βοηθήστε να κατευθύνετε το μέλλον της τεχνητής νοημοσύνης συνεργαζόμενοι σε δημόσια και ιδιωτικά σύνολα δεδομένων μαζί μας.
https://t.co/4tbi5SZ6sS
— OpenAI (@OpenAI)
9 Νοεμβρίου 2023
Οι δοκιμές μοντέλων που διεξάγονται σε όλο το πρόγραμμα συνεργασίας δεδομένων θα επεκτείνουν επίσης φυσικά τις δυνατότητες του OpenAI που αντιμετωπίζουν οι καταναλωτές , το οποίο έχει ενημερωθεί για να παρέχει στους χρήστες πιο περίπλοκες και ουσιαστικές απαντήσεις. Η OpenAI λέει ότι έχει ήδη αρχίσει να συνεργάζεται με ενδιαφερόμενους οργανισμούς, συμπεριλαμβανομένων έγκυρων φορέων όπως η ισλανδική κυβέρνηση. Μέσω επιμελημένων συνόλων δεδομένων, το OpenAI λέει ότι εργάζεται για τη βελτίωση της ικανότητας του GPT-4 να κατανοεί ερωτήματα που γίνονται στην ισλανδική γλώσσα.
Εάν κάποιος ιδιωτικός ή δημόσιος οργανισμός θέλει να συμμετάσχει στο πρόγραμμα, μπορεί να υποβάλει εκπρόσωπος
στον ιστότοπο της εταιρείας και κοινοποιήστε πληροφορίες σχετικά με τον τύπο και το μέγεθος δεδομένων που σκοπεύουν να μοιραστούν. Υπάρχουν δύο μονοπάτια για σύνολα δεδομένων. Το πρώτο είναι το αρχείο Ανοιχτού Κώδικα, το οποίο είναι ιδανικό για σύνολα δεδομένων που σχετίζονται με μοντέλα εκπαίδευσης γλωσσών. Ωστόσο, οι υποβολές που υποβάλλονται σε αυτό θα είναι δημόσιες για χρήση από οποιονδήποτε. Εναλλακτικά, η OpenAI λέει ότι μια εταιρεία μπορεί να υποβάλλει πληροφορίες μέσω της ιδιωτικής διαδρομής δεδομένων της, η οποία θα διοχετεύεται για την εκπαίδευση ιδιόκτητων μοντέλων AI, τα οποία η εταιρεία λέει ότι περιλαμβάνει τα “βασικά μοντέλα” και τα “λεπτομετρημένα και προσαρμοσμένα μοντέλα”. Αυτό συνιστάται για εταιρείες ή ιδρύματα που θέλουν να διατηρήσουν τα δεδομένα τους εμπιστευτικά. Αλλά από την ίδια άποψη, η OpenAI λέει ότι δεν αναζητά σύνολα δεδομένων που περιέχουν ευαίσθητες ή προσωπικές πληροφορίες.
Το ChatGPT έχει ήδη σημειώσει ρεκόρ για την αυξανόμενη βάση χρηστών του. Έχει περίπου σε όλο τον κόσμο, που σημαίνει ότι θα συνεχίσει να είναι μόνο ένα σημείο εστίασης για το εργαλείο. Προηγουμένως, οι υπάλληλοι της Samsung είχαν τοποθετηθεί στη θέση για το μοντέλο AI. Ενώ
δεν χρησιμοποιεί δεδομένα που δημιουργούνται από το API της για την εκπαίδευση των μοντέλων της, εκτός εάν ένας χρήστης υποβάλλει ρητά πληροφορίες μέσω μιας φόρμας συμμετοχής, όλα τα μάτια θα είναι στραμμένα στον τρόπο με τον οποίο η εταιρεία χειρίζεται τα δεδομένα που συλλέγονται μέσω αυτής της πρωτοβουλίας, ειδικά τα ιδιωτικά σύνολα δεδομένων.
Αυτό το άρθρο εμφανίστηκε αρχικά στο Engadget στη διεύθυνση https://www.engadget.com/openai-wants-to-work-with-organizations-to-build-new-ai-training-datasets-214548902.html?src=rss
VIA:
engadget.com

