Το Contextual AI ξεκινά από το stealth για τη δημιουργία μοντέλων γλώσσας που εστιάζουν στην επιχείρηση

Τα μεγάλα γλωσσικά μοντέλα (LLM) όπως το GPT-4 του

είναι ισχυρά εργαλεία που αλλάζουν το παράδειγμα που υπόσχονται να ανατρέψουν τις βιομηχανίες. Ωστόσο, υποφέρουν από περιορισμούς που τα καθιστούν λιγότερο ελκυστικά για τους επιχειρηματικούς οργανισμούς με αυστηρές απαιτήσεις συμμόρφωσης και διακυβέρνησης. Για παράδειγμα, τα LLM έχουν την τάση να συνθέτουν πληροφορίες με υψηλή εμπιστοσύνη και έχουν σχεδιαστεί με τρόπο που καθιστά δύσκολη την αφαίρεση —ή ακόμη και την αναθεώρηση— της βάσης γνώσεών τους.

Για να λύσει αυτά και άλλα εμπόδια, ο Douwe Kiela συνίδρυσε

Συμφραζόμενη τεχνητή νοημοσύνη

, η οποία ξεκίνησε σήμερα από μυστικότητα με χρηματοδότηση 20 εκατομμυρίων δολαρίων. Υποστηριζόμενη από επενδυτές, όπως η Bain Capital Ventures (η οποία ηγήθηκε του σπόρου), η Lightspeed, η Greycroft και η SV Angel, η Contextual AI στοχεύει φιλόδοξα να δημιουργήσει την «επόμενη γενιά» LLM για την επιχείρηση.

«Δημιουργήσαμε την εταιρεία για να αντιμετωπίσουμε τις ανάγκες των επιχειρήσεων στην αναπτυσσόμενη περιοχή της γενετικής τεχνητής νοημοσύνης, η οποία μέχρι στιγμής έχει επικεντρωθεί σε μεγάλο βαθμό στους καταναλωτές», δήλωσε η Kiela στο TechCrunch μέσω email. «Η τεχνητή νοημοσύνη με βάση τα συμφραζόμενα επιλύει πολλά εμπόδια που υπάρχουν σήμερα για να κάνει τις επιχειρήσεις να υιοθετήσουν γενετική τεχνητή νοημοσύνη».

Η Kiela και ο άλλος συνιδρυτής της Contextual AI, ο Amanpreet Singh, δούλεψαν μαζί στη startup τεχνητής νοημοσύνης Hugging Face and

πριν αποφασίσουν να το κάνουν δικό τους στις αρχές Φεβρουαρίου. Ενώ βρισκόταν στο Meta, ο Kiela ηγήθηκε της έρευνας σε μια τεχνική που ονομάζεται επαυξημένη γενιά ανάκτησης (RAG), η οποία αποτελεί τη βάση της τεχνολογίας AI της Contextual AI που δημιουργεί κείμενο.


εξερευνηθεί

— αυξάνει τα LLM με εξωτερικές πηγές, όπως αρχεία και ιστοσελίδες, για να βελτιώσει την απόδοσή τους. Λαμβάνοντας μια προτροπή (π.χ. “Ποιος είναι ο πρόεδρος των ΗΠΑ;”), το RAG αναζητά δεδομένα εντός των πηγών που μπορεί να είναι σχετικά. Στη συνέχεια, συσκευάζει τα αποτελέσματα με την αρχική προτροπή και τα τροφοδοτεί σε ένα LLM, δημιουργώντας μια απάντηση «με επίγνωση του πλαισίου» (π.χ. «Ο τρέχων πρόεδρος είναι ο Τζο Μπάιντεν, σύμφωνα με την επίσημη ιστοσελίδα του Λευκού Οίκου»).

Αντίθετα, σε απάντηση σε μια ερώτηση όπως «Ποιο είναι το ΑΕΠ του Νεπάλ ανά έτος;», ένα τυπικό LLM (π.χ.

) μπορεί να επιστρέψει το ΑΕΠ μέχρι μια συγκεκριμένη ημερομηνία και να μην αναφέρει την πηγή των πληροφοριών.

Ο Kiela ισχυρίζεται ότι το RAG μπορεί να λύσει τα άλλα εκκρεμή ζητήματα με τα σημερινά LLM, όπως αυτά που αφορούν την απόδοση και την προσαρμογή. Με τα συμβατικά LLM, μπορεί να είναι δύσκολο να γνωρίζουμε γιατί τα μοντέλα ανταποκρίνονται με τον τρόπο που ανταποκρίνονται και η προσθήκη πηγών δεδομένων σε LLM απαιτεί συχνά επανεκπαίδευση ή λεπτομέρεια — βήματα (συνήθως) αποφεύγονται με το RAG.

«Τα μοντέλα γλωσσών RAG μπορεί να είναι μικρότερα από τα ισοδύναμα γλωσσικά μοντέλα και εξακολουθούν να επιτυγχάνουν την ίδια απόδοση. Αυτό τους κάνει πολύ πιο γρήγορους, που σημαίνει χαμηλότερη καθυστέρηση και χαμηλότερο κόστος», είπε ο Kiela. «Η λύση μας αντιμετωπίζει τις ελλείψεις και τα κληρονομικά ζητήματα των υπαρχουσών προσεγγίσεων. Πιστεύουμε ότι η ενσωμάτωση και η από κοινού βελτιστοποίηση διαφορετικών λειτουργικών μονάδων για ενοποίηση δεδομένων, συλλογιστική, ομιλία, ακόμη και θέαση και ακρόαση θα ξεκλειδώσει τις πραγματικές δυνατότητες των μοντέλων γλώσσας για περιπτώσεις εταιρικής χρήσης».

Ο συνάδελφός μου Ron Miller έχει σκεφτεί πώς το μέλλον της παραγωγικής τεχνητής νοημοσύνης στην επιχείρηση θα μπορούσε να είναι μικρότερα, πιο εστιασμένα γλωσσικά μοντέλα. Δεν το αμφισβητώ. Ίσως, όμως, αντί για αποκλειστικά βελτιστοποιημένα, εστιασμένα στην επιχείρηση LLM, θα είναι ένας συνδυασμός «μικρότερων» μοντέλων και υπαρχόντων LLM επαυξημένων με πλήθος εγγράφων για συγκεκριμένες εταιρείες.

Η Contextual AI δεν είναι η πρώτη που εξερευνά αυτήν την ιδέα. Το OpenAI και ο στενός του συνεργάτης, η

, κυκλοφόρησαν πρόσφατα ένα πλαίσιο προσθηκών που επιτρέπει σε τρίτους να προσθέτουν πηγές πληροφοριών σε LLM όπως το GPT-4. Άλλες νεοφυείς επιχειρήσεις, όπως η LlamaIndex, πειραματίζονται με τρόπους εισαγωγής προσωπικών ή ιδιωτικών δεδομένων, συμπεριλαμβανομένων των εταιρικών δεδομένων, σε LLMs.

Αλλά η Contextual AI ισχυρίζεται ότι έχει εισβολές στην επιχείρηση. Ενώ η εταιρεία είναι προ-εσόδων προς το παρόν, η Kiela ισχυρίζεται ότι η Contextual AI βρίσκεται σε συνομιλίες με εταιρείες του Fortune 500 για να πιλοτάρει την τεχνολογία της.

«Οι επιχειρήσεις πρέπει να είναι σίγουρες ότι οι απαντήσεις που λαμβάνουν από τη γενετική τεχνητή νοημοσύνη είναι ακριβείς, αξιόπιστες και ανιχνεύσιμες», είπε ο Kiela. «Η τεχνητή νοημοσύνη με βάση τα συμφραζόμενα θα διευκολύνει τους εργοδότες και τους εργαζομένους με τις πολύτιμες γνώσεις τους να αποκτήσουν τα οφέλη αποδοτικότητας που μπορεί να προσφέρει η γενετική τεχνητή νοημοσύνη, ενώ το κάνουν με ασφάλεια και ακρίβεια… Αρκετές εταιρείες παραγωγής τεχνητής νοημοσύνης έχουν δηλώσει ότι θα επιδιώξουν την επιχειρηματική αγορά, αλλά η Contextual AI θα λάβει μια διαφορετική προσέγγιση με την κατασκευή μιας πολύ πιο ολοκληρωμένης λύσης ειδικά προσαρμοσμένης σε περιπτώσεις εταιρικής χρήσης».

Η Contextual AI, η οποία έχει περίπου οκτώ υπαλλήλους, σχεδιάζει να δαπανήσει το μεγαλύτερο μέρος της αρχικής της χρηματοδότησης για την ανάπτυξη προϊόντων, η οποία θα περιλαμβάνει επένδυση σε ένα σύμπλεγμα υπολογιστών για την εκπαίδευση LLM. Η εταιρεία σχεδιάζει να αυξήσει το εργατικό δυναμικό της σε σχεδόν 20 άτομα μέχρι το τέλος του 2023.


techcrunch.com



You might also like


Leave A Reply



Cancel Reply

Your email address will not be published.