Modern technology gives us many things.

Το AssemblyAI διαθέτει 50 εκατομμύρια δολάρια για να κατασκευάσει και να εξυπηρετήσει μοντέλα ομιλίας AI


Οι εταιρείες στοιχηίζουν πολλά στη γενετική τεχνητή νοημοσύνη για να αποκτήσουν ανταγωνιστικό πλεονέκτημα. Αλλά οι προκλήσεις για την υιοθεσία παραμένουν. Σύμφωνα με α πρόσφατος έρευνα από την EY, α σημαντική μερίδα επιχειρήσεων που επιθυμούν να υιοθετήσουν τη γενετική τεχνητή νοημοσύνη λένε ότι η ταχεία πρόοδος του τομέα — και η αύξηση των πωλητών που ισχυρίζονται ότι διαθέτουν τεχνογνωσία στην τεχνητή νοημοσύνη — περιπλέκει τις προοπτικές ανάπτυξης τους.

Δεν θα το καταλάβατε από τις δαπάνες τους, όμως. Σύμφωνα με ένα IDC πρόβλεψη, οι παγκόσμιες επενδύσεις σε συστήματα «κεντρικά στην τεχνητή νοημοσύνη» θα μπορούσαν να φτάσουν τα 154 δισεκατομμύρια δολάρια μέχρι το τέλος του έτους. Και μια τεχνικής MIT ψηφοφορία διαπίστωσε ότι το 50% των επιχειρήσεων σχεδιάζει να ενισχύσει τους προϋπολογισμούς για την υποδομή δεδομένων και την τεχνητή νοημοσύνη κατά πάνω από 25% το επόμενο έτος.

Η έκρηξη ωφελεί τις νεοφυείς επιχειρήσεις όπως ΣυνέλευσηAI (το οποίο το TechCrunch έχει καλύψει τρεις φορές στο παρελθόν), μια αυτοαποκαλούμενη επιχείρηση «εφαρμοσμένης τεχνητής νοημοσύνης» που ερευνά, εκπαιδεύει και αναπτύσσει μοντέλα τεχνητής νοημοσύνης για προγραμματιστές και ομάδες προϊόντων προκειμένου να ενσωματωθούν στις εφαρμογές και τις υπηρεσίες τους.

Η AssemblyAI ισχυρίζεται ότι η πελατειακή της βάση πληρωμών αυξήθηκε κατά 200% από πέρυσι σε 4.000 μάρκες και ότι η πλατφόρμα AI της διαχειρίζεται τώρα περίπου 25 εκατομμύρια κλήσεις API την ημέρα. Επιπλέον, πάνω από 200.000 προγραμματιστές αναπτύσσουν την πλατφόρμα, λέει η AssemblyAI — τη χρησιμοποιούν για να επεξεργάζονται περισσότερα από 10 terabyte δεδομένων την ημέρα.

«Τα μοντέλα τεχνητής νοημοσύνης βελτιώνονται και εξελίσσονται γρήγορα», δήλωσε ο συνιδρυτής και διευθύνων σύμβουλος της AssemblyAI, Dylan Fox, στο TechCrunch σε μια συνέντευξη μέσω email. «Οι επιχειρήσεις που αξιοποιούν την πλατφόρμα API του AssemblyAI είναι σε θέση να επικεντρωθούν στη δημιουργία νέων προϊόντων, εφαρμογών και ροών εργασιών τεχνητής νοημοσύνης χωρίς να χρειάζεται να επικεντρωθούν στην ανάπτυξη μοντέλων, στην εκπαίδευση και στο να συμβαδίζουν με τον γρήγορο ρυθμό της καινοτομίας μοντέλων. Ούτε χρειάζεται να ανησυχούν για την ανάπτυξη μοντέλων AI σε κλίμακα, κάτι που είναι εξαιρετικά δύσκολο να γίνει με χαμηλό κόστος και με υψηλή διαθεσιμότητα».

Η πλατφόρμα προγραμματισμού AssemblyAI.

Η επιτυχία του AssemblyAI έχει τραβήξει την προσοχή μεγάλων επενδυτών, ορισμένοι από τους οποίους συνεισέφεραν πρόσφατα σε μια νέα δόση χρηματοδότησης για την startup. Η Accel ηγήθηκε ενός κύκλου 50 εκατομμυρίων δολαρίων στο AssemblyAI, που ανακοινώθηκε σήμερα, με τη συμμετοχή του πρώην συν-CEO της Salesforce, Keith Block, του πρώην CEO της GitHub, Nat Friedman και Daniel Gross, της Insight Partners και της Y Combinator. Το συνολικό κεφάλαιο της AssemblyAI που συγκεντρώθηκε ανέρχεται πλέον σε 115 εκατομμύρια δολάρια.

Ο Fox, μηχανικός μηχανικής μάθησης στο επάγγελμα, ίδρυσε το AssemblyAI στα τέλη του 2017. Λέει ότι εμπνεύστηκε από το Amazon Echo, για το οποίο η Fox υποστηρίζει ότι είναι ένα από τα πρώτα σπουδαία παραδείγματα προϊόντων που έγιναν δυνατά από καλύτερα συστήματα AI για φωνή.

«Καθώς άρχισα να εξερευνώ τη δημιουργία των δικών μου προϊόντων με διάφορα μοντέλα τεχνητής νοημοσύνης ομιλίας που ήταν διαθέσιμα εκείνη την εποχή, απογοητεύτηκα που οι περισσότερες εταιρείες εξακολουθούσαν να προσφέρουν παλαιού τύπου, ανακριβή μοντέλα τεχνητής νοημοσύνης ομιλίας μέσω δύσχρηστων προϊόντων προγραμματιστών», είπε η Fox. «Αυτό με παρακίνησε να ξεκινήσω το AssemblyAI — με το όραμα να δημιουργήσω υπεράνθρωπα… μοντέλα τεχνητής νοημοσύνης, διαθέσιμα μέσω μιας εύχρηστης πλατφόρμας προγραμματιστών, που θα ξεκλειδώνουν εντελώς νέες κατηγορίες εφαρμογών τεχνητής νοημοσύνης που θα κατασκευαστούν».

Σήμερα, το AssemblyAI προσφέρει μοντέλα τεχνητής νοημοσύνης — ειδικά μοντέλα με επίκεντρο την ομιλία — σχεδιασμένα να εκτελούν εργασίες όπως ομιλία σε κείμενο, αναγνώριση ομιλητών, εποπτεία περιεχομένου και περίληψη ομιλίας μέσω ενός API. Πελάτες όπως το Fireflies, μια εφαρμογή ς συσκέψεων, εκτελούν περιεχόμενο που ποικίλλει από τηλεφωνικές κλήσεις και συσκέψεις Zoom έως podcast και βίντεο μέσω των μοντέλων, λέει η Fox.

Τώρα, δεν υπάρχει έλλειψη τόσο ανοιχτών όσο και αποκλειστικών μοντέλων ομιλίας εκεί έξω, από αντίπαλες νεοσύστατες εταιρείες όπως οι Deepgram, Rev και Speechmatics καθώς και τεχνολογικοί γίγαντες όπως το Google Cloud, το Azure και το AWS. Όμως, η Fox υποστηρίζει – σωστά ή λάθος – ότι τα μοντέλα της AssemblyAI είναι πιο «προηγμένα», «ακριβή», «ικανά» και «πλούσια σε χαρακτηριστικά» από τον ανταγωνισμό.

«Οι μεγάλες εταιρείες cloud έχουν παρόμοιες προσφορές προϊόντων… αλλά ενημερώνονται σπάνια, λιγότερο ακριβείς, διαθέτουν πολύ λιγότερες δυνατότητες και είναι πολύ πιο δύσκολο να ενσωματωθούν», συνέχισε.

Το AssemblyAI δεν επαναπαύεται στις δάφνες του, είπε. Ένα μέρος της νέας χρηματοδότησης θα διατεθεί σε ένα «καθολικό» μοντέλο ομιλίας που η εκπαίδευση της εταιρείας σε πάνω από ένα petabyte φωνητικών δεδομένων, θα κυκλοφορήσει αργότερα φέτος», λέει η Fox. Η AssemblyAI επεκτείνει επίσης τον αριθμό των εργαζομένων της, με στόχο να αυξήσει το εργατικό δυναμικό της με 115 άτομα κατά 50% σε 75% το επόμενο έτος.

«Εργαζόμαστε για τη δημιουργία του «Stripe για μοντέλα τεχνητής νοημοσύνης» — όπου οι προγραμματιστές και οι ομάδες προϊόντων θα μπορούν να έχουν εύκολη πρόσβαση στην τελευταίας τεχνολογίας τεχνητή νοημοσύνη μέσω ενός απλού API», δήλωσε ο Fox. «Παρέχοντας αυτά τα πράγματα στους πελάτες, μπορούν να επικεντρωθούν στη δημιουργία περισσότερων κάθετων εφαρμογών και εσωτερικών ροών ς που αξιοποιούν τα ιδιόκτητα δεδομένα μας και τα διαρκώς βελτιωμένα μοντέλα τεχνητής νοημοσύνης ομιλίας της AssemblyAI… Έχουμε χρόνια πασαρέλας χάρη στο νέο γύρο χρηματοδότησης και βλέπουμε απίστευτο ποσότητα ζήτησης και υιοθέτησης προϊόντων δεδομένης της κυρίαρχης ώθησης γύρω από την τεχνητή νοημοσύνη».



VIA: techcrunch.com

Follow TechWar.gr on Google News

Απάντηση