Η Deepset εξασφαλίζει 30 εκατομμύρια $ για να επεκτείνει τις προσφορές MLO που επικεντρώνονται στο LLM
Βαθιά
μια πλατφόρμα για τη δημιουργία εταιρικών εφαρμογών που υποστηρίζονται από μεγάλα γλωσσικά μοντέλα παρόμοια με το
ChatGPT
, ανακοίνωσε σήμερα ότι συγκέντρωσε 30 εκατομμύρια δολάρια σε έναν γύρο χρηματοδότησης υπό την ηγεσία της Balderton Capital με τη συμμετοχή της GV και της Harpoon Ventures.
Τα έσοδα θα διατεθούν για την επέκταση των προϊόντων και των υπηρεσιών της Deepset και την αύξηση της ομάδας της από περίπου 50 άτομα σε 70 σε 75 μέχρι το τέλος του έτους, λέει ο συνιδρυτής και διευθύνων σύμβουλος Milos Rusic.
«Σε πολλούς οργανισμούς, οι ομάδες επιστήμης δεδομένων εξακολουθούν να είναι η προεπιλεγμένη επιλογή για «όλα τα πράγματα AI». Στην πραγματικότητα, πολλές ομάδες επιστήμης δεδομένων αναδιαρθρώνονται, μαθαίνουν εκ νέου και αναδιαμορφώνουν τις συνήθειές τους για να ανταποκρίνονται στις αυξανόμενες απαιτήσεις των ομάδων προϊόντων και των τελικών χρηστών στην επιχείρηση», δήλωσε ο Rusic στο TechCrunch σε μια συνέντευξη μέσω email. «Ο κλάδος μετατοπίζεται από τα εργαστήρια τεχνητής νοημοσύνης σε εργοστάσια τεχνητής νοημοσύνης – δεν είναι πια να ασχολούμαστε, αλλά να στείλουμε επιτυχημένα προϊόντα και αξία».
Δεν έχει άδικο ο Rusic που υπονοεί ότι οι ομάδες επιστήμης δεδομένων είναι υπερφορτωμένες και υπερφορτωμένες.
Σύμφωνα με μια πρόσφατη δημοσκόπηση
η συντριπτική πλειονότητα των μηχανικών δεδομένων – οι επιστήμονες δεδομένων που προετοιμάζουν δεδομένα για εργαλεία ανάλυσης – βιώνουν εξάντληση, πιθανόν να εγκαταλείψουν την τρέχουσα εταιρεία τους για άλλη μια φορά μέσα σε 12 μήνες και σκέφτονται να εγκαταλείψουν εντελώς τη βιομηχανία.
Η ατυχής κατάσταση των πραγμάτων πιθανότατα συμβάλλει στις προκλήσεις σχετικά με την ανάπτυξη της τεχνητής νοημοσύνης εντός της επιχείρησης. Μια Gartner του 2022
ψηφοφορία
διαπίστωσε ότι μόνο τα μισά περίπου έργα τεχνητής νοημοσύνης κάνουν το άλμα από το πιλοτικό στην παραγωγή και ότι το 53% των μοντέλων μηχανικής μάθησης δεν αναπτύσσονται ποτέ.
Η Rusic κυκλοφόρησε από κοινού το Deepset με τους Malte Pietsch και Timo Möller το 2018, ενισχύοντας την επιχείρηση εκπαιδεύοντας προσαρμοσμένα μοντέλα επεξεργασίας φυσικής γλώσσας για επιχειρήσεις. Οι τρεις συνιδρυτές ακολούθησαν στενά την αρχιτεκτονική του μοντέλου Transformer AI που αναπτύχθηκε από την
Google
το 2017, η οποία θα συνεχίσει να αποτελεί τη βάση για εξελιγμένα LLMs όπως το ChatGPT και το GPT-4.
Το 2019, οι Rusic, Pietsch και Möller κυκλοφόρησαν το Haystack, ένα πλαίσιο ανοιχτού κώδικα για τη δημιουργία υπηρεσιών back-end NLP με
Transformers
και άλλες αρχιτεκτονικές LLM. Ο στόχος ήταν να παράσχει μια συλλογή εργαλείων για μηχανικούς λογισμικού για τη γρήγορη δημιουργία εφαρμογών που βασίζονται στο LLM, λέει ο Rusic — ιδιαίτερα εφαρμογές που καλύπτουν μια συγκεκριμένη περίπτωση χρήσης, όπως η βοήθεια των νομικών ομάδων στην αναζήτηση σε αρχεία υποθέσεων.
Αλλά οι φιλοδοξίες του Deepset τελικά ξεπέρασαν το Haystack.
Πέρυσι, η startup έκανε το ντεμπούτο της στο Deepset
Cloud
, το οποίο ο Rusic περιγράφει ως «επιχειρησιακή πλατφόρμα LLM για ομάδες AI». Το Deepset Cloud επεκτείνει το Haystack παρέχοντας μια πλατφόρμα όπου οι πελάτες μπορούν να δοκιμάσουν διαφορετικά LLM, να ενσωματώσουν αυτά τα LLM σε εφαρμογές, να αναπτύξουν τις εφαρμογές και τα LLM στους τελικούς χρήστες και να πραγματοποιήσουν αναλύσεις της ακρίβειας των LLM ενώ παρακολουθούν συνεχώς την απόδοσή τους.
Το Deepset Cloud περιλαμβάνει επίσης στοιχεία για τη μέτρηση και τον μετριασμό κοινών προβλημάτων με LLMs, όπως παραισθήσεις. Η ψευδαίσθηση, η οποία μαστίζει ακόμη και τους καλύτερους LLM σήμερα, κάνει τα μοντέλα να δημιουργούν ψευδείς πληροφορίες ή γεγονότα που δεν βασίζονται σε πραγματικά γεγονότα ή δεδομένα.
Ένα στιγμιότυπο οθόνης του Deepset Cloud, της νέας πλατφόρμας MLOps της Deepset.
Συντελεστές εικόνας:
Deepset Cloud
«Το Deepset Cloud αξιοποιεί σε μεγάλο βαθμό την τεχνολογία ανοιχτού κώδικα Haystack — την αρχιτεκτονική του αγωγού, τα βασικά στοιχεία, τις αποθήκες δεδομένων, τις ενσωματώσεις και ούτω καθεξής», εξήγησε ο Rusic. «Η πλατφόρμα μας παρέχει όλα τα δομικά στοιχεία για να αποφευχθεί οποιαδήποτε «αδιαφοροποίητη άρση βαρέων βαρών» και επιτρέπει στους προγραμματιστές να επικεντρωθούν στην αποστολή υπηρεσιών back-end NLP — βασισμένες σε API, εύκολα συνθέσιμες, εύκολα ενσωματώσιμες και εύκολα παρακολουθούμενες».
Η Deepset, η οποία έχει συγκεντρώσει συνολικά 46 εκατομμύρια δολάρια σε χρηματοδότηση μέχρι σήμερα, βλέπει τους προμηθευτές που ανταγωνίζονται στον χώρο των MLOps ως τους κύριους ανταγωνιστές της. Το MLOps προσπαθεί να απλοποιήσει τη διαδικασία δημιουργίας και διαχείρισης μοντέλων μηχανικής μάθησης παρέχοντας εργαλεία για την αντιμετώπιση κάθε μεμονωμένου σταδίου του κύκλου ζωής ενός μοντέλου.
Εκτός από κατεστημένους φορείς όπως το AWS, το Azure και το Google Cloud, μια αυξανόμενη σειρά startups παρέχει προϊόντα, πλατφόρμες και υπηρεσίες MLOps σε εταιρικούς πελάτες. Υπάρχει ο Seldon, ο οποίος συγκέντρωσε πρόσφατα 20 εκατομμύρια δολάρια. Γαλιλαίος; Iguazio που ανήκει στην McKinsey. Diveplane; Arize; και Tecton, για να αναφέρουμε μερικά.
Η Allied Market Research προβλέπει ότι ο τομέας των MLOps θα φτάσει τα 23,1 δισεκατομμύρια δολάρια έως το 2031, από περίπου 1 δισεκατομμύριο δολάρια το 2021. Χωρίς αμφιβολία, το τεράστιο μέγεθος της αγοράς με δυνατότητα διεύθυνσης θα συνεχίσει να προσελκύει νέους εισερχόμενους.
Αλλά ο Rusic επισημαίνει την επέκταση του Deepset ως απόδειξη ότι ξεχωρίζει από το πλήθος. Η startup διαθέτει «εκατοντάδες» αγωγούς πελατών που λειτουργούν στην πλατφόρμα της, συμπεριλαμβανομένων φόρτου εργασίας για τη Siemens και την Airbus. Ο νομικός εκδοτικός οίκος Manz χρησιμοποίησε το Deepset για να λανσάρει ένα εσωτερικό εργαλείο με τεχνητή νοημοσύνη που βοηθά στην προβολή δικαστικών εγγράφων, σχετικών προηγούμενων και άλλων. Η Airbus, εν τω μεταξύ, χρησιμοποιεί το Haystack για να δημιουργήσει εφαρμογές που προτείνουν οδηγίες λειτουργίας αεροσκαφών στους πιλότους στο πιλοτήριο.
«Συχνά είναι 10 φορές πιο γρήγορο να δημιουργείς επανειλημμένα έτοιμες για παραγωγή υπηρεσίες NLP και LLM με το Deepset Cloud σε αντίθεση με την πρόσληψη, την εκπαίδευση και τη διαχείριση μιας ειδικής ομάδας για ισχυρή ανάπτυξη εφαρμογών back-end», είπε ο Rusic. «Το Deepset Cloud επιτρέπει στους πελάτες να χρησιμοποιούν διάφορα LLM ταυτόχρονα, συνδυάζοντάς τα στην αρχιτεκτονική της εφαρμογής για να αποφύγουν το κλείδωμα του προμηθευτή και να μετριάσουν τα ζητήματα απορρήτου δεδομένων και κυριαρχίας του μοντέλου».


