Το Gradient της Google υποστηρίζει το Send AI για να βοηθήσει τις επιχειρήσεις να εξάγουν δεδομένα από πολύπλοκα έγγραφα

By

Marizas Dimitris

On

Ιαν 24, 2024

Μια νεοσύστατη ολλανδική

startup

θέλει να βοηθήσει τις εταιρείες επιπλέον δεδομένα από μεγάλους όγκους πολύπλοκων εγγράφων όπου η ακρίβεια και η ασφάλεια είναι πρωταρχικής σημασίας — και μόλις εξασφάλισε την υποστήριξη της Gradient Ventures της Google για να το κάνει.

Αποστολή AI

όπως ονομάζεται η εκκίνηση, αναλαμβάνει καθιερωμένους φορείς στον χώρο επεξεργασίας εγγράφων όπως UiPath, Abbyy,

Rossum

και

Kofax

με μια προσαρμόσιμη πλατφόρμα που επιτρέπει στις εταιρείες να προσαρμόζουν τα μοντέλα AI για τις δικές τους ατομικές ανάγκες εξαγωγής δεδομένων.

Για παράδειγμα, μια εταιρεία που δραστηριοποιείται σε έναν άκρως ρυθμιζόμενο κλάδο, όπως οι ασφάλειες, πιθανότατα θα πρέπει να επεξεργαστεί μυριάδες μορφές, από αρχεία PDF και έντυπα έως φωτογραφίες smartphone που τραβήχτηκαν με όλους τους προσανατολισμούς και τον «θόρυβο» του φόντου. Τέτοιοι μη τυπικοί «μη δομημένοι» τύποι δεδομένων μπορεί να είναι αρκετά δύσκολοι για να αναλύσουν οι άνθρωποι, αλλά μια εντελώς μηχανική προσέγγιση μπορεί να οδηγήσει σε λανθασμένες απορρίψεις αξιώσεων ή επιστροφές χρημάτων και διοικητικούς πονοκεφάλους.

Πράγματι, το τυπικό λογισμικό επεξεργασίας εγγράφων εκτός ραφιού σχεδιάζεται συχνά για πιο συνηθισμένους τύπους εγγράφων που διασταυρώνονται με πολλούς κλάδους, καθιστώντας τα ακατάλληλα για ορισμένες περιπτώσεις χρήσης.

Με το Send AI, από την άλλη πλευρά, οι εταιρείες μπορούν να εκπαιδεύσουν ένα μοντέλο υπολογιστικής όρασης για την αναγνώριση συγκεκριμένων εγγράφων και ένα ξεχωριστό μοντέλο γλώσσας για την εξαγωγή και την επικύρωση των σχετικών δεδομένων — με ανθρώπους που βρίσκονται σε βρόχο, εάν υπάρχει αμφιβολία, για τον έλεγχο και την αναθεώρηση κάθε βήμα μέσω μιας δι

επα

φής ιστού.

«Αυτή η επικύρωση μπορεί να είναι τόσο απλή όσο ο έλεγχος εάν ένας αναμενόμενος αριθμός είναι πραγματικά ένας αριθμός ή μια πιο περίπλοκη αναζήτηση ενός αριθμού εγγραφής σε μια βάση δεδομένων για να δούμε αν υπάρχει αντιστοιχία», ιδρυτής και διευθύνων σύμβουλος Send AI

Τομ Τρέντελμαν

είπε στο TechCrunch. «Οποιεσδήποτε ανασφάλειες θα αναφέρονται για ανθρώπινο έλεγχο».

Ιδρύθηκε από το Άμστερνταμ το 2021 αρχικά ως Autopilot, το Send AI συγκέντρωσε προηγουμένως μια μικρή επένδυση 100.000 δολαρίων από ένα ταμείο αποφοίτων πανεπιστημίου, αλλά καθώς αρχίζει να αυξάνει τα πράγματα, τώρα έχει συγκεντρώσει άλλα 2,2 εκατομμύρια ευρώ (2,4 εκατομμύρια δολάρια) σε προ -πρώτος γύρος χρηματοδότησης με συνοδηγό την Gradient Ventures και την Keen Venture Partners της Google, με τη συμμετοχή πολλών αγγέλων που προέρχονται από εταιρείες όπως η DeepMind.

Πως δουλεύει

Οι εταιρείες μπορούν να έχουν πρόσβαση στο λογισμικό Send AI που βασίζεται σε σύννεφο μέσω API που διοχετεύει δεδομένα από έγγραφα που αποστέλλονται μέσω email. Μετά την παραλαβή, το Send AI βελτιώνει οπτικά τα έγγραφα πριν τα στείλει στα μοντέλα γλώσσας του για ταξινόμηση και εξαγωγή.

Όσον αφορά την αγορά-στόχο, η Trentelman λέει ότι η εταιρεία στοχεύει ουσιαστικά σε μεγαλύτερες επιχειρήσεις, καθώς αυτές «δυσκολεύονται περισσότερο με έγγραφα», αν και στην πραγματικότητα κάθε επιχείρηση που επεξεργάζεται μεγάλους όγκους εγγράφων θα μπορούσε να βρει χρήση της τεχνολογίας

Πιστώσεις εικόνας

Αποστολή AI: Εξαγωγή δεδομένων

Ίσως είναι αυτονόητο ότι εκτός από το πλήθος των υφιστάμενων εργαλείων επεξεργασίας εγγράφων που υπάρχουν ήδη στην αγορά, το Send AI αντιμετωπίζει μια νέα σειρά νεοφυών επιχειρήσεων που πωλούν υπηρεσίες που βασίζονται σε ισχυρά νέα μεγάλα μοντέλα γλώσσας (LLM) όπως το OpenAI με GPT-X (το οποίο τροφοδοτεί το ChatGPT). Όμως, ενώ η Trentelman παραδέχεται ότι τέτοια προϊόντα λειτουργούν εξαιρετικά για καταστάσεις που απαιτούν «υποκειμενικά καλή» βαθμολογία, όπως η περίληψη ή η απάντηση σε ερωτήσεις, όπου απαιτείται υψηλός βαθμός ακρίβειας σε μεγάλους όγκους εγγράφων, είναι μια διαφορετική ιστορία.

“Θα χτυπήσετε τους τοίχους με αυτές τις τεχνολογίες νωρίτερα παρά αργότερα – τα μεγάλα, γενικά LLM εξακολουθούν να είναι απρόβλεπτα, αργά και ακριβά”, είπε ο Trentelman. «Στο Send AI, αφήνουμε τον πελάτη να δημιουργήσει τη δική του λύση».

Κάτω από την κουκούλα, το Send AI βασίζεται σε μικρότερα μοντέλα ανοιχτού κώδικα, τα οποία ο πελάτης εκπαιδεύει πρώτα επεξεργάζοντας ένα μικρό σύνολο εγγράφων με το χέρι, μετά το οποίο ξεπλένεται και επαναλαμβάνεται σε νέα έγγραφα με ανθρώπους στη διάθεσή τους για να παρέχει διορθώσεις.

Όσον αφορά την τιμολόγηση, Αποστολή χρεώσεων τεχνητής νοημοσύνης με βάση την πίστωση, σύμφωνα με την οποία οι πελάτες πληρώνουν ανά βήμα επεξεργασίας. «Με αυτόν τον τρόπο, μπορούμε να κάνουμε διαφοροποίηση μεταξύ της επεξεργασίας ενός PDF 50 σελίδων ή ενός αποσπάσματος ενός κειμένου», είπε ο Trentelman. «Τα μοντέλα μας είναι φθηνά, γρήγορα και αξιόπιστα, επομένως μπορούμε να τα αναπτύξουμε σε βάση ανά πελάτη. Με αυτόν τον τρόπο, οι πελάτες έχουν τον έλεγχο των δεδομένων και της απόδοσής τους, γι’ αυτό τα πάμε καλά σε ρυθμιζόμενους κλάδους όπως η ασφάλιση υγείας και η κυβέρνηση».

Ελεγχος

Send AI ισχυρίζεται ότι η τεχνολογία του θα προσελκύσει βιομηχανίες με υψηλή ρύθμιση λόγω του ελέγχου που δίνει στους πελάτες στα δεδομένα τους, κάτι που μπορεί να φαίνεται αδιανόητο δεδομένου ότι βασίζεται στο σύννεφο. Ωστόσο, ο Trentelman επισημαίνει πώς λειτουργεί ένα τυπικό LLM όπως το OpenAI,

vis à vis

τον τρόπο με τον οποίο μπορεί να συνδυάσει δεδομένα

εκπαίδευση

ς από πολλούς διαφορετικούς πελάτες σε ένα ενιαίο μοντέλο, γεγονός που αυξάνει την πιθανότητα διαρροής ευαίσθητων δεδομένων. Αυτός είναι ακριβώς ο λόγος που έχουμε δει μια σειρά από νεοσύστατες επιχειρήσεις να εμφανίζονται με την υπόσχεση προστασίας των ιδιωτικών δεδομένων μέσα από λογισμικό που υποστηρίζεται από LLM.

Αποστολή προσπαθειών τεχνητής νοημοσύνης για την αντιμετώπιση τέτοιων ανησυχιών με την ανάπτυξη μικρών, απομονωμένων μοντέλων μετασχηματιστών ανοιχτού κώδικα για κάθε πελάτη.

«Χρησιμοποιούμε μια ποικιλία από αυτά για να ολοκληρώσουμε τη δουλειά μας – εκτός του κουτιού δεν εντυπωσιάζουν πολύ, αλλά μόλις εκπαιδευτούν σε δεδομένα υψηλής ποιότητας, γίνονται ισχυρά και ακριβή», είπε ο Trentelman.

Έτσι, ενώ τα μοντέλα και τα σχετικά δεδομένα εκπαίδευσης εξακολουθούν να ζουν στο σύννεφο του Send AI, η χρήση μεμονωμένων μοντέλων σημαίνει ότι μπορεί να εντοπίσει ακριβώς πού ζουν τα δεδομένα και επομένως να τα διαγράψει κατόπιν αιτήματος. Αυτό, σύμφωνα με τον Trentelman, είναι αρκετό για να το κάνει «προτιμώμενο υποψήφιο» έναντι άλλων παρόχων και συμβάλλει κατά κάποιο τρόπο στο να πείσει τις εταιρείες που εστιάζουν στο απόρρητο των δεδομένων ότι οι επιτόπιες αναπτύξεις

δεν είναι

η μόνη τους επιλογή.

«Σήμερα, πιο ρυθμισμένες εταιρείες επιτρέπουν στους προμηθευτές να χρησιμοποιούν δημόσιο

cloud

, εφόσον συμμορφώνονται με μια εκτενή λίστα κανονισμών», είπε ο Trentelman. “Εκ των προτέρων, είχαμε πάντα το ερώτημα εάν θα μπορούσαμε να αναπτύξουμε on-premise, αλλά τελικά όλες οι εταιρείες εκτός από μία έκαναν τη δημόσια προσφορά μας στο cloud.”

Προς το παρόν, το Send AI λειτουργεί σε ιδιωτική λειτουργία beta, αν και ήδη διεκδικεί ορισμένους εντυπωσιακούς πελάτες, συμπεριλαμβανομένου του ασφαλιστικού γίγαντα Axa. Με μια ομάδα επτά ατόμων σήμερα, η εταιρεία σχεδιάζει να χρησιμοποιήσει τη νέα εισφορά μετρητών της για να διπλασιάσει τον αριθμό των εργαζομένων της καθ’ όλη τη διάρκεια του έτους πριν από την πλήρη εμπορική κυκλοφορία.

VIA:

techcrunch.com

AI

chatgpt

cloud

Enterprise

google

Gradient Ventures

openai

Send AI