Βελτίωση της απόδοσης του ChatGPT με την προσθήκη επιπλέον δυνατοτήτων από το OpenAI

By

Marizas Dimitris

On

Φεβ 14, 2024

ΕΝΑ

ομάδα ερευνητών

συν

εργαζόμενοι

με το MIT έχουν βρει

μι

α λύση σε ένα περίεργο πρόβλημα με το ChatGPT και άλλα μεγάλα μοντέλα γλώσσας. Καθώς αυτά τα μοντέλα μιλούν με τους χρήστες, αρχίζουν σταδιακά να καταρρέουν, οδηγώντας τελικά την απόδοση του bot σε γρήγορη πτώση. Με αυτή τη λύση, όμως, αυτό θα μπορούσε να ανήκει στο παρελθόν.

Το ζήτημα, σημειώνουν οι ερευνητές, προέρχεται από την κρυφή μνήμη κλειδιού-τιμής, η οποία είναι ουσιαστικά η μνήμη συνομιλίας του bot. Όταν αυτή η κρυφή μνήμη γεμίσει και χρειάζεται να διατηρηθεί περισσότερο, συχνά αφήνει τα πρώτα

κομμάτια

δεδομένων να βγουν έξω για να δημιουργηθεί χώρος.

Αυτή η κίνηση μπορεί πραγματικά να προκαλέσει πτώση της απόδοσης του ChatGPT και άλλων LLM. Ως εκ τούτου, η διασφάλιση ότι τα πρώτα λίγα σημεία δεδομένων παραμένουν στη μνήμη είναι σημαντική για τη διατήρηση του LLM προς τα

εμπ

ρός χωρίς προβλήματα, ακόμα κι αν η συνομιλία συνεχιστεί για μεγάλο χρονικό διάστημα.

Καθώς η χρήση του ChatGPT εξακολουθεί να εκτοξεύεται στα ύψη, η προσθήκη μιας δυνατότητας όπως το StreamingLLM θα μπορούσε να το κάνει ακόμα καλύτερα. Πηγή εικόνας:

YouTube

Οι ερευνητές ονομάζουν τη νέα μέθοδο StreamingLLM, η οποία επιτρέπει στο AI να παραμένει αποτελεσματικό ακόμα και όταν μια συνομιλία εκτείνεται σε περισσότερες από τέσσερα εκατομμύρια λέξεις. Οι ερευνητές το δοκίμασαν σε σχέση με μια άλλη μέθοδο, η οποία βοηθά στην αποφυγή σφαλμάτων και προβλημάτων απόδοσης, επανυπολογίζοντας συνεχώς μέρος των προηγούμενων συνομιλιών.

Το StreamingLLM είχε στην πραγματικότητα περισσότερες από 22 φορές ταχύτερη απόδοση, γεγονός που θα επέτρεπε στην απόδοση στο ChatGPT και σε άλλα LLM να παραμείνει συνεπής ακόμη και κατά τη διάρκεια μεγαλύτερων συνομιλιών, επιτρέποντάς σας να έχετε καλύτερα αποτελέσματα από το ChatGPT και πολλά άλλα. Οι συντάκτες της μελέτης λένε ότι το StreamingLLM θα επέτρεπε στο chatbot να έχει συνεχείς συνομιλίες όλη την ημέρα χωρίς να απαιτείται επανεκκίνηση.

Η κατανόηση της σχέσης που παίζει η κρυφή μνήμη με τον τρόπο με τον οποίο το chatbot ανταποκρίνεται στις ανθρώπινες εισαγωγές είναι σημαντική. Βοήθησε να τονιστεί το ζήτημα για το οποίο οι ερευνητές έπρεπε να δώσουν λύση. Δημοσίευσαν τα ευρήματά τους σε α

νέο χαρτί

που εμφανίζεται στο

arXiv

διακομιστή προεκτύπωσης.

Επί του παρόντος, το StreamingLLM έχει ενσωματωθεί στο TensorRT-LLM της Nvidia, αλλά θα μπορούσε να εμφανιστεί σε άλλα

chatbots

, όπως το ChatGPT, το Claude και άλλα, εάν αυτές οι εταιρείες βλέπουν την ίδια αξία που είχε η Nvidia.

VIA:

bgr.com

chatgpt

Όλα συμπεριλαμβάνονται