Το Anthropic πηδάει το OpenAI με ένα chatbot που μπορεί να διαβάσει ένα μυθιστόρημα σε λιγότερο από ένα λεπτό

Ένας περιορισμός που συχνά παραβλέπεται για τα chatbots είναι

μνήμη

. Αν και είναι αλήθεια ότι τα μοντέλα γλώσσας τεχνητής νοημοσύνης που τροφοδοτούν αυτά τα συστήματα εκπαιδεύονται σε terabyte κειμένου, η ποσότητα που μπορούν να επεξεργαστούν αυτά τα συστήματα όταν χρησιμοποιούνται — δηλαδή ο συνδυασμός κειμένου εισόδου και εξόδου, γνωστό και ως «παράθυρο περιβάλλοντος» — είναι περιορισμένος. Για το ChatGPT είναι περίπου 3.000 λέξεις. Υπάρχουν τρόποι να το αντιμετωπίσετε αυτό, αλλά και πάλι δεν είναι τεράστιος όγκος πληροφοριών για να παίξετε.

Τώρα, η startup τεχνητής νοημοσύνης Anthropic (που ιδρύθηκε από πρώην μηχανικούς του OpenAI) έχει επεκτείνει σημαντικά το παράθυρο περιβάλλοντος του δικού της chatbot Claude, ωθώντας το σε περίπου 75.000 λέξεις. Όπως επισημαίνει η εταιρεία στο α

ανάρτηση

αυτό είναι αρκετό για να επεξεργαστεί το σύνολο του

Ο Μεγάλος Γκάτσμπι

με μία κίνηση. Στην πραγματικότητα, η εταιρεία δοκίμασε το σύστημα κάνοντας αυτό ακριβώς — επεξεργάζονταν μία μόνο πρόταση στο μυθιστόρημα και ζητώντας από τον Claude να εντοπίσει την αλλαγή. Το έκανε σε 22 δευτερόλεπτα.

Ίσως έχετε παρατηρήσει την ανακρίβειά μου στην περιγραφή του μήκους αυτών των παραθύρων περιβάλλοντος. Αυτό συμβαίνει επειδή τα μοντέλα γλώσσας AI μετρούν τις πληροφορίες όχι με αριθμό χαρακτήρων ή λέξεων, αλλά σε διακριτικά. μια σημασιολογική ενότητα που δεν χαρτογραφείται ακριβώς σε αυτές τις γνωστές ποσότητες. Είναι λογικό όταν το σκέφτεσαι. Άλλωστε, οι λέξεις μπορεί να είναι μεγάλες ή σύντομες και το μήκος τους δεν αντιστοιχεί απαραίτητα στην πολυπλοκότητα του νοήματός τους. (Οι μεγαλύτεροι ορισμοί στο λεξικό είναι συχνά για

τις πιο σύντομες λέξεις

.) Η χρήση των “tokens” αντανακλά αυτήν την αλήθεια, και έτσι, για να είμαστε πιο ακριβείς: το παράθυρο περιβάλλοντος του Claude μπορεί τώρα να επεξεργαστεί 100.000 διακριτικά, από 9.000 πριν. Συγκριτικά, το GPT-4 του OpenAI επεξεργάζεται περίπου 8.000 μάρκες (αυτό δεν είναι το τυπικό μοντέλο που είναι διαθέσιμο στο ChatGPT — πρέπει να πληρώσετε για πρόσβαση) ενώ ένα πλήρες μοντέλο GPT-4 περιορισμένης κυκλοφορίας μπορεί

χειριστεί έως και 32.000 μάρκες

.

Αυτήν τη στιγμή, η νέα χωρητικότητα του Claude είναι διαθέσιμη μόνο στους επιχειρηματικούς συνεργάτες της Anthropic, οι οποίοι χρησιμοποιούν το chatbot μέσω του API της εταιρείας. Η τιμολόγηση είναι επίσης άγνωστη, αλλά είναι βέβαιο ότι θα είναι σημαντική. Η επεξεργασία περισσότερου κειμένου σημαίνει ότι ξοδεύετε περισσότερα για υπολογιστές.

Αλλά τα νέα δείχνουν ότι η ικανότητα των μοντέλων γλώσσας AI να επεξεργάζονται πληροφορίες αυξάνεται και αυτό σίγουρα θα κάνει αυτά τα συστήματα πιο χρήσιμα. Όπως σημειώνει ο Anthropic, χρειάζεται ένας άνθρωπος περίπου πέντε ώρες για να διαβάσει 75.000 λέξεις κειμένου, αλλά με το διευρυμένο παράθυρο περιβάλλοντος του Claude, μπορεί ενδεχομένως να αναλάβει το έργο της ανάγνωσης, της σύνοψης και της ανάλυσης ενός μεγάλου εγγράφου μέσα σε λίγα λεπτά. (Αν και δεν κάνει τίποτα για την επίμονη τάση των chatbots να δημιουργούν πληροφορίες.) Ένα μεγαλύτερο παράθυρο περιβάλλοντος σημαίνει επίσης ότι το σύστημα μπορεί να κρατήσει μεγαλύτερες συνομιλίες. Ένας παράγοντας που κάνει τα chatbots να ξεφεύγουν είναι ότι όταν το παράθυρο περιβάλλοντος τους γεμίζει, ξεχνάνε τι έχει ειπωθεί και γι’ αυτό το chatbot του Bing περιορίζεται σε

20 στροφές συνομιλίας

. Περισσότερο πλαίσιο ισοδυναμεί με περισσότερη συζήτηση.


theverge.com



You might also like


Leave A Reply



Cancel Reply

Your email address will not be published.