Η Elicit δημιουργεί ένα εργαλείο για την αυτοματοποίηση της ανασκόπησης της επιστημονικής βιβλιογραφίας
Για τους ερευνητές, η ανάγνωση επιστημονικών εργασιών μπορεί να είναι εξαιρε
τι
κά χρονοβόρα. Σύμφωνα με μια έρευνα, οι
επιστήμονες
αφιερώνουν επτά ώρες κάθε εβδομάδα αναζητώντας πληροφορίες. Μια άλλη έρευνα προτείνει ότι οι συστηματικές ανασκοπήσεις της βιβλιογραφίας – επιστημονικές συνθέσεις των στοιχείων για ένα συγκεκριμένο θέμα – χρειάζονται κατά μέσο όρο 41 εβδομάδες για μια ερευνητική ομάδα πέντε ατόμων.
Αλλά δεν χρειάζεται να είναι έτσι.
Τουλάχιστον, αυτό είναι το
μήνυμα
από τον Andreas Stuhlmüller, τον συνιδρυτή μιας
startup
τεχνητής νοημοσύνης,
Εκμαιεύω
“Εκμαιεύω
είναι ένας βοηθός ερευνητής που αυτοματοποιεί την επιστημονική έρευνα με γλωσσικά μοντέλα», είπε ο Stuhlmüller στο TechCrunch σε μια συνέντευξη μέσω email. «Συγκεκριμένα, αυτοματοποιεί την ανασκόπηση της βιβλιογραφίας βρίσκοντας σχετικές εργασίες, εξάγοντας βασικές πληροφορίες σχετικά με τις μελέτες και οργανώνοντας τις πληροφορίες σε έννοιες».
Το Elicit είναι ένα κερδοσκοπικό εγχείρημα που προέρχεται από το Ought, ένα μη κερδοσκοπικό ερευνητικό ίδρυμα που ξεκίνησε το 2017 από τον Stuhlmüller, πρώην ερευνητή στο εργαστήριο υπολογιστών και γνωστικών υπολογισμών του Στάνφορντ. Ο άλλος συνιδρυτής της Elicit, ο Jungwon Byun, εντάχθηκε στη startup το 2019 μετά την κορυφαία ανάπτυξη στην εταιρεία διαδικτυακών δανείων Upstart.
Χρησιμοποιώντας μια ποικιλία μοντέλων τόσο πρώτου όσο και τρίτου κατασκευαστή, το Elicit αναζητά και ανακαλύπτει έννοιες σε διάφορα χαρτιά, επιτρέποντας στους χρήστες να κάνουν ερωτήσεις όπως “Ποιες είναι όλες οι επιπτώσεις της κρεατίνης;” ή «Ποια είναι όλα τα σύνολα δεδομένων που έχουν χρησιμοποιηθεί για τη μελέτη της λογικής συλλογιστικής;» και λάβετε μια λίστα με απαντήσεις από την ακαδημαϊκή βιβλιογραφία.
«Αυτοματοποιώντας τη διαδικασία συστηματικής αναθεώρησης, μπορούμε να προσφέρουμε άμεσα εξοικονόμηση κόστους και χρόνου στους ακαδημαϊκούς και βιομηχανικούς ερευνητικούς οργανισμούς που παράγουν αυτές τις αξιολογήσεις», δήλωσε ο Stuhlmüller. «Μειώνοντας αρκετά το κόστος, ξεκλειδώνουμε νέες περιπτώσεις χρήσης που προηγουμένως ήταν απαγορευτικές από πλευράς κόστους, όπως οι έγκαιρες ενημερώσεις όταν αλλάζει η κατάσταση της γνώσης σε έναν τομέα».
Αλλά περιμένετε, θα πείτε — τα γλωσσικά μοντέλα δεν έχουν την τάση να φτιάχνουν τα πράγματα; Πράγματι το κάνουν. Η προσπάθεια του Meta για ένα γλωσσικό μοντέλο για τον εξορθολογισμό της επιστημονικής έρευνας,
Galactica
καταργήθηκε μόνο τρεις ημέρες μετά την κυκλοφορία, αφού ανακαλύφθηκε ότι το μοντέλο συχνά αναφερόταν σε πλαστές ερευνητικές εργασίες που ακούγονταν σωστά αλλά δεν ήταν στην πραγματικότητα πραγματικές.
Ωστόσο, ο Stuhlmüller ισχυρίζεται ότι η Elicit έχει λάβει μέτρα για να διασφαλίσει ότι η
τεχνητή νοημοσύνη
της είναι πιο αξιόπιστη από πολλές από τις στοχευμένες πλατφόρμες εκεί έξω.
Πρώτον, η Elicit αναλύει τις πολύπλοκες εργασίες που εκτελούν τα μοντέλα της σε κομμάτια «κατανοητά από τον άνθρωπο». Αυτό επιτρέπει στο Elicit να γνωρίζει, για παράδειγμα, πόσο συχνά τα διαφορετικά μοντέλα συνθέτουν πράγματα όταν δημιουργούν περιλήψεις και στη συνέχεια βοηθά τους χρήστες να προσδιορίσουν ποιες απαντήσεις πρέπει να ελέγξουν — και πότε.
Το Elicit επιχειρεί επίσης να υπολογίσει τη συνολική «αξιοπιστία» μιας επιστημονικής εργασίας, λαμβάνοντας υπόψη παράγοντες όπως το εάν οι δοκιμές που πραγματοποιήθηκαν στην έρευνα ήταν ελεγχόμενες ή τυχαιοποιημένες, την πηγή της χρηματοδότησης και πιθανές συγκρούσεις και το μέγεθος των δοκιμών.
Το εργαλείο αναζήτησης του Elicit για λογοτεχνία τεχνητής νοημοσύνης.
«Δεν κάνουμε διασυνδέσεις συνομιλίας», είπε ο Stuhlmüller. «Προωθήστε τους χρήστες να εφαρμόσουν γλωσσικά μοντέλα ως ομαδικές εργασίες… Ποτέ δεν δημιουργούμε απλώς απαντήσεις χρησιμοποιώντας μοντέλα, συνδέουμε πάντα τις απαντήσεις με την επιστημονική βιβλιογραφία για να μειώσουμε τις παραισθήσεις και να κάνουμε εύκολο τον έλεγχο της δουλειάς των μοντέλων».
Δεν είμαι απαραιτήτως πεπεισμένος ότι το Elicit έχει λύσει μερικά από τα κύρια ζητήματα που μαστίζουν τα γλωσσικά μοντέλα σήμερα, δεδομένης της δυσεπίλυσής τους. Αλλά οι προσπάθειές της φαίνεται σίγουρα να έχουν συγκεντρώσει ενδιαφέρον – και ίσως ακόμη και εμπιστοσύνη – από την ερευνητική κοινότητα.
Ο Stuhlmüller ισχυρίζεται ότι πάνω από 200.000 άτομα χρησιμοποιούν το Elicit κάθε μήνα, που αντιπροσωπεύει αύξηση 3 φορές από έτος σε έτος, από οργανισμούς όπως η Παγκόσμια Τράπεζα, η Genentech και το Stanford. «Οι χρήστες μας ζητούν να πληρώσουν για πιο ισχυρά χαρακτηριστικά και να τρέξουν το Elicit σε μεγαλύτερη κλίμακα», πρόσθεσε.
Προφανώς, αυτή η δυναμική είναι που οδήγησε στον πρώτο γύρο χρηματοδότησης του Elicit – μια δόση 9 εκατομμυρίων δολαρίων με επικεφαλής την Fifty Years. Το σχέδιο είναι να διατεθεί το μεγαλύτερο μέρος των νέων μετρητών στην περαιτέρω ανάπτυξη του προϊόντος της Elicit καθώς και στην επέκταση της ομάδας διευθυντών προϊόντων και μηχανικών λογισμικού της Elicit.
Ποιο είναι όμως το σχέδιο της Elicit να βγάλει χρήματα; Καλή ερώτηση — και μια που έθεσα στον Stuhlmüller κενή. Επεσήμανε το επί πληρωμή teir του Elicit, που κυκλοφόρησε αυτή την εβδομάδα, το οποίο επιτρέπει στους χρήστες να αναζητούν έγγραφα, να εξάγουν δεδομένα και να συνοψίζουν έννοιες σε μεγαλύτερη κλίμακα από ό,τι υποστηρίζει το δωρεάν επίπεδο. Η πιο μακροπρόθεσμη στρατηγική είναι να μετατραπεί το Elicit σε ένα γενικό εργαλείο για έρευνα και συλλογισμό — ένα εργαλείο για το οποίο θα πλήρωναν ολόκληρες επιχειρήσεις.
Ένα πιθανό εμπόδιο στην εμπορική επιτυχία του Elicit είναι προσπάθειες ανοιχτού κώδικα όπως το μοντέλο ανοιχτής γλώσσας του Ινστιτούτου Allen για την Τεχνητή Νοημοσύνη, που στοχεύουν στην ανάπτυξη ενός μοντέλου μεγάλης γλώσσας ελεύθερης χρήσης, βελτιστοποιημένο για την επιστήμη. Αλλά ο Stuhlmüller λέει ότι βλέπει τον ανοιχτό κώδικα περισσότερο ως συμπληρωματικό παρά ως απειλητικό.
«Ο πρωταρχικός ανταγωνισμός αυτή τη στιγμή είναι η ανθρώπινη εργασία – βοηθοί ερευνητές που προσλαμβάνονται για να εξάγουν με κόπο δεδομένα από έγγραφα», είπε ο Stuhlmüller. «Η επιστημονική έρευνα είναι μια τεράστια αγορά και η ροή εργασιών της έρευνας δεν έχει σημαντικούς φορείς. Εδώ θα δούμε να εμφανίζονται εξ ολοκλήρου νέες ροές εργασιών για την τεχνητή νοημοσύνη».
