Τώρα μπορείτε να αποκλείσετε τον ανιχνευτή ιστού του OpenAI

On

Αυγ 7, 2023

Το

OpenAI

σάς επιτρέπει τώρα να αποκλείσετε τον ανιχνευτή ιστού του από το να αποκόψει τον ιστότοπό σας για να βοηθήσει στην εκπαίδευση μοντέλων GPT.

Σε ένα

ανάρτηση

, η OpenAI είπε ότι οι χειριστές ιστοτόπων μπορούν συγκεκριμένα να απαγορεύσουν το πρόγραμμα ανίχνευσης GPTBot στο αρχείο Robots.txt του ιστότοπού τους ή να αποκλείσουν τη διεύθυνση IP του. «Οι ιστοσελίδες που ανιχνεύονται με τον παράγοντα χρήστη GPTBot ενδέχεται να χρησιμοποιηθούν για τη βελτίωση μελλοντικών μοντέλων και φιλτράρονται για την κατάργηση πηγών που απαιτούν πρόσβαση στο paywall, είναι γνωστό ότι συλλέγουν πληροφορίες προσωπικής ταυτοποίησης (PII) ή έχουν κείμενο που παραβιάζει τις πολιτικές μας», δήλωσε η OpenAI στην ανάρτηση του ιστολογίου. Για πηγές που δεν ανταποκρίνονται στα εξαιρούμενα κριτήρια, «η δυνατότητα πρόσβασης στο GPTBot στον ιστότοπό σας μπορεί να βοηθήσει τα μοντέλα τεχνητής νοημοσύνης να γίνουν πιο ακριβή και να βελτιώσουν τις γενικές τους δυνατότητες και την ασφάλειά τους».

Ο αποκλεισμός του GPTBot μπορεί να είναι το πρώτο βήμα στο OpenAI που επιτρέπει στους χρήστες του Διαδικτύου να εξαιρεθούν από τη χρήση των δεδομένων τους για την εκπαίδευση των μεγάλων γλωσσικών μοντέλων του. Ακολουθεί κάποιες πρώτες προσπάθειες δημιουργίας μιας σημαίας που θα απέκλειε περιεχόμενο από την εκπαίδευση, όπως μια ετικέτα “NoAI” που σχεδιάστηκε από την DeviantArt πέρυσι. Δεν καταργεί αναδρομικά περιεχόμενο που είχε προηγουμένως αφαιρεθεί από έναν ιστότοπο από τα δεδομένα εκπαίδευσης του

ChatGPT

.

Το Διαδίκτυο παρείχε πολλά από τα δεδομένα εκπαίδευσης για μεγάλα γλωσσικά μοντέλα όπως τα μοντέλα GPT του OpenAI και το

Bard

της

Google

. Ωστόσο, το OpenAI δεν θα επιβεβαιώσει εάν έλαβε τα δεδομένα του μέσω αναρτήσεων στα μέσα κοινωνικής δικτύωσης, έργων που προστατεύονται από πνευματικά δικαιώματα ή ποια μέρη του διαδικτύου μάζεψε για πληροφορίες. Και η προμήθεια δεδομένων για εκπαίδευση τεχνητής νοημοσύνης γίνεται όλο και πιο αμφιλεγόμενη. Ιστότοποι, συμπεριλαμβανομένων των Reddit και

Twitter

, πίεσαν να καταστείλουν την ελεύθερη χρήση των αναρτήσεων των χρηστών τους από εταιρείες τεχνητής νοημοσύνης, ενώ συγγραφείς και άλλα δημιουργικά έχουν μηνύσει για φερόμενη μη εξουσιοδοτημένη χρήση των έργων τους. Οι νομοθέτες προσέκρουσαν επίσης σε ερωτήσεις απορρήτου δεδομένων και συναίνεσης σε αρκετές ακροάσεις της Γερουσίας σχετικά με τη ρύθμιση της τεχνητής νοημοσύνης τον περασμένο μήνα.

Οπως και

αναφέρθηκε από

Αξιος

, εταιρείες όπως η Adobe έχουν διατυπώσει την ιδέα της επισήμανσης των δεδομένων ως μη εκπαίδευσης μέσω ενός νόμου κατά της πλαστοπροσωπίας. Εταιρείες τεχνητής νοημοσύνης, συμπεριλαμβανομένου του OpenAI, υπέγραψαν συμφωνία με τον Λευκό Οίκο για την ανάπτυξη ενός συστήματος υδατογράφησης που θα ενημερώνει τους ανθρώπους εάν κάτι δημιουργήθηκε από την τεχνητή νοημοσύνη, αλλά δεν υποσχέθηκαν να σταματήσουν να χρησιμοποιούν δεδομένα Διαδικτύου για εκπαίδευση.

theverge.com

bard

chatgpt

google

openai

Twitter