Το LlamaIndex προσθέτει προσωπικά δεδομένα σε μεγάλα μοντέλα γλώσσας
Related Posts
Το περασμένο φθινόπωρο, αφού έπαιξε με το μοντέλο τεχνητής νοημοσύνης που δημιουργεί κείμενο GPT-3 του
OpenAI
— τον προκάτοχο του
GPT-4
— ο πρώην ερευνητής της Uber Jerry Liu ανακάλυψε αυτό που περιγράφει ως «περιορισμούς» γύρω από την ικανότητα του μοντέλου να εργάζεται με ιδιωτικά δεδομένα (π. προσωπικά αρχεία). Για να το λύσει αυτό, ξεκίνησε ένα έργο ανοιχτού κώδικα,
LlamaIndex
σχεδιασμένο για να ξεκλειδώνει τις δυνατότητες και να χρησιμοποιεί περιπτώσεις μεγάλων γλωσσικών μοντέλων (LLM) όπως τα GPT-3 και GPT-4.
«Τα LLM προσφέρουν απίστευτες δυνατότητες για εξαγωγή γνώσης και συλλογισμό – μπορούν να εκτελέσουν απαντήσεις σε ερωτήσεις, σύνοψη και εξαγωγή πληροφοριών, ακόμη και διαδοχική λήψη αποφάσεων με ένα εξωτερικό περιβάλλον», είπε ο Liu στο TechCrunch σε μια συνέντευξη μέσω email. «Αλλά τα LLM έχουν όρια».
Καθώς το έργο αυξανόταν σε δημοτικότητα (σε ύψος 200.000 μηνιαίων λήψεων), ο Liu ένωσε τις δυνάμεις του με τον Simon Suo, έναν από τους παλιούς συναδέλφους του στην Uber, για να μετατρέψει την LlamaIndex σε μια πλήρως ανεπτυγμένη εταιρεία. Σήμερα, η LlamaIndex (η εταιρεία) προσφέρει ένα πλαίσιο για να βοηθήσει τους προγραμματιστές να αξιοποιήσουν τις δυνατότητες των LLM πάνω από τα προσωπικά ή οργανωσιακά τους δεδομένα.
«LlamaIndex [helps] οι προγραμματιστές διαχειρίζονται τα δεδομένα τους για εφαρμογές LLM», είπε ο Liu. “Η εργαλειοθήκη μας περιέχει το μεγαλύτερο βάθος σε αυτήν την πτυχή και διευκολύνουμε την ενσωμάτωση με άλλα εργαλεία που χρησιμοποιεί ο προγραμματιστής.”
Συντελεστές εικόνας:
LlamaIndex
Το πλαίσιο LlamaIndex επιτρέπει στους προγραμματιστές να συνδέουν δεδομένα από αρχεία όπως PDF, PowerPoints, εφαρμογές όπως το Notion και Slack και βάσεις δεδομένων όπως το Postgres και το MongoDB σε LLM. Το πλαίσιο περιλαμβάνει συνδέσεις για την απορρόφηση πηγών δεδομένων και μορφών δεδομένων, καθώς και τρόπους δομής δεδομένων έτσι ώστε να μπορούν να χρησιμοποιηθούν εύκολα με LLM.
Επιπλέον, το LlamaIndex διαθέτει μια διεπαφή ανάκτησης δεδομένων και ερωτημάτων που επιτρέπει στους προγραμματιστές να τροφοδοτούν οποιαδήποτε προτροπή εισόδου LLM για να λάβουν πίσω —όπως το περιγράφει ο Liu— έξοδο «πλαισίου και επαυξημένης γνώσης».
«Υπάρχουν άλλα πλαίσια εφαρμογών LLM εκεί έξω που προσφέρουν βασικά δομικά στοιχεία για εφαρμογές και πράκτορες LLM», είπε ο Liu. “Αυτό που είναι ειδικό για το LlamaIndex είναι ότι εστιάζουμε στη σύνδεση των πηγών δεδομένων σας με LLM και έχουμε εκτεταμένα εργαλεία σχετικά με την απορρόφηση δεδομένων, τη διαχείριση δεδομένων και την ευρετηρίαση και την ανάκτηση δεδομένων σε σχέση με τις εφαρμογές LLM.”
Η προοπτική αύξησης των LLMs με αυτόν τον τρόπο ενθουσίασε τους επενδυτές, οι οποίοι υποσχέθηκαν 8,5 εκατομμύρια δολάρια προς την LlamaIndex σε έναν πρόσφατα κλειστό γύρο χρηματοδότησης εκκίνησης. Ο Γκρέιλοκ ηγήθηκε με τη συμμετοχή αγγέλων επενδυτών, συμπεριλαμβανομένων των Τζακ Άλτμαν, Λένι Ρατσίτσκι και Τσαρλς Σί.
Σε τι θα ξοδέψει λοιπόν τα χρήματα η LlamaIndex; Ο Liu λέει ότι θα χρησιμοποιηθεί για τη δημιουργία μιας «επιχειρηματικής λύσης» πάνω από το έργο ανοιχτού κώδικα LlamaIndex, το οποίο θα κυκλοφορήσει αργότερα φέτος. Μια δυνατότητα θα επιτρέπει στους πελάτες να χρησιμοποιούν συνδέσμους δεδομένων «βαθμού προστασίας» για την ανάλυση και τη μεταφορά μεγάλου όγκου δεδομένων, ενώ μια άλλη, σχετική δυνατότητα θα τους επιτρέψει να ευρετηριάσουν δεδομένα «συγκεκριμένου τομέα».
«Το LlamaIndex δεν συνδέεται με ένα συγκεκριμένο κομμάτι τεχνολογίας, έτσι ώστε να μπορούμε να συνεχίσουμε να χρησιμοποιούνται με LLM καθώς η τεχνολογία εξελίσσεται», είπε ο Liu. «Ο κλάδος της τεχνητής νοημοσύνης κινείται τόσο γρήγορα που τυχόν αρχικές στοίβες που εμφανίζονται πιθανότατα θα αλλάξουν κατά τη διάρκεια των επόμενων μηνών».


