Εφαρμογή παραγωγικότητας που υποστηρίζεται από το YC Υπερισχύει περιστρέφεται για να γίνει μια πλατφόρμα φωνής API για bots



Οι εφαρμογές ημερολογίου είναι απαραίτητες για την παραγωγικότητα, αλλά είναι δύσκολο να διαφοροποιηθούν αρκετά ώστε να υπάρξει σταθερή ανάπτυξη από την βασική χρήση. Y με υποστήριξη συνδυασμού

Υπερδύναμη

που είναι ένα σημειωματάριο με τεχνητή νοημοσύνη για

ς συναντήσεις σας που δεν περιλαμβάνει ηχογράφηση bots, χτύπησε αυτό το εμπόδιο και τώρα περιστρέφεται για να γίνει

Vapi

ένας πάροχος API, ώστε ο καθένας να μπορεί εύκολα να δημιουργήσει έναν βοηθό τεχνητής νοημοσύνης με φυσική ήχο φωνής.

Η Superpowered ιδρύθηκε το 2020 από τους Jordan Dearsley και Nikhil Gupta. Αλλά μετά από τρία χρόνια εργασίας σε αυτό, ο Dearsley είπε ότι η ομάδα ήθελε να εργαστεί για το πιο απαιτητικό προϊόν. Η εταιρεία δεν κλείνει το αρχικό προϊόν, καθώς η

είπε ότι η Superpowered είναι κερδοφόρα — βρίσκεται στη διαδικασία να φέρει κάποιον για να τη διευθύνει. Η Y Combinator είπε τον Ιούνιο ότι περισσότερα από 10.000 άτομα χρησιμοποιούσαν το προϊόν εβδομαδιαίως, αλλά η εταιρεία δεν παρείχε κανέναν ενημερωμένο αριθμό.


Συντελεστές εικόνας:

Vapi

Μέχρι σήμερα, η Superpowered/Vapi έχει συγκεντρώσει 2,1 $ σε αρχικό κεφάλαιο από επενδυτές, συμπεριλαμβανομένων των Kleiner Perkins και Abstract Ventures.

Pivot to Vapi

Η εταιρεία προσφέρει το Vapi ως API για να επιτρέψει στους προγραμματιστές να δημιουργήσουν ένα bot χρησιμοποιώντας απλώς προτροπές — στη συνέχεια να το τοποθετήσουν πίσω από έναν αριθμό τηλεφώνου. Επιπλέον, προσφέρει μια ενοποίηση SDK, ώστε οι προγραμματιστές να μπορούν να ενσωματώσουν το bot σε ιστότοπους και εφαρμογές για κινητά.

Ο Dearsley είπε στο TechCrunch μέσω email ότι η ιδέα να δημιουργηθεί το Vapi προήλθε από ένα προσωπικό πρόβλημα. Είχε μετακομίσει στο Σαν Φρανσίσκο και άρχισε να του λείπουν οι φίλοι και η οικογένειά του, που βρίσκονταν σε διαφορετική ζώνη ώρας. Κατασκεύασε ένα bot τεχνητής νοημοσύνης συνδεδεμένο με έναν αριθμό τηλεφώνου στην άλλη άκρη για να μιλήσει σε κάποιον προκειμένου να ταξινομήσει τις σκέψεις του.


«Μου άρεσε, αλλά ήμουν συνεχώς απογοητευμένος με το πόσο αφύσικο ήταν. Δεν ήταν σαν να μιλάς σε έναν άνθρωπο. Η φωνή έσβησε, θα υπήρχαν μεγάλες καθυστερήσεις προτού ανταποκριθεί και θα με διέκοπτε ενώ μιλούσα». αυτός είπε.

«Έτσι συνέχισα να το δουλεύω και να πηγαίνω τις βόλτες μου με αυτό. Τελικά, γοητευτήκαμε με αυτό το πρόβλημα συνομιλίας. Είναι πραγματικά δύσκολο να κάνεις κάτι να νιώθει ανθρώπινο. Βοηθοί φωνής

σήμερα

είμαστε αδέξιοι και βασισμένοι στη σειρά, θέλουμε να χτίσουμε κάτι που να αισθάνεται ανθρώπινο».

Τεχνικά, η Vapi χρησιμοποιεί επί του παρόντος μια σειρά από API τρίτων για τη δημιουργία μιας ισχυρής πλατφόρμας φωνητικών συνομιλιών. Για παράδειγμα, χρησιμοποιεί λύσεις από το Twilio για τηλεφωνία, Deepgram για μεταγραφή, Καθημερινή για ροή ήχου, OpenAI για απαντήσεις και

PlayHT

για μετατροπή κειμένου σε ομιλία.

Η ScaleConvo, μια startup στη χειμερινή παρτίδα YC για το 2024, χρησιμοποιεί ήδη το Vapi για να λανσάρει

συνομιλίας για ομάδες πωλήσεων και εταιρείες διαχείρισης ακινήτων. Ωστόσο, η Vapi δεν αποκάλυψε τους άλλους πελάτες της. Η εταιρεία ανοίγει το API της με

Vapi

και προϊόντα Web Vapi σήμερα.

Προκλήσεις για τον Βάπι

Μία από τις μεγαλύτερες προκλήσεις που έχει η startup είναι να μειώσει τον λανθάνοντα χρόνο, σύμφωνα με τον Magnus Revan, πρώην αναλυτή της Gartner και επικεφαλής προϊόντων στην εκκίνηση πολυτροπικών συνομιλιών Openstream.ai.

«Τα μοντέλα OpenAI χρειάζονται 2-10 δευτερόλεπτα για να δώσουν μια απάντηση – ενώ στο τηλέφωνο το χρυσό πρότυπο είναι να υπάρχουν 700 ms μεταξύ του χρήστη που τελειώνει την ομιλία του και μετά το «bot» αρχίζει να μιλάει. Και το να φτάσεις σε καθυστέρηση κάτω του 1 δευτερολέπτου με ικανά μοντέλα (υψηλού αριθμού παραμέτρων μοντέλα ανοιχτού κώδικα όπως το LLaMA2 70B) είναι πραγματικά δύσκολο», είπε ο Revan.

Επί του παρόντος, το Vapi έχει καθυστέρηση 1,2-2 δευτερόλεπτα ανάλογα με διάφορους παράγοντες. Ο Dearsley αναμένει να μειώσει την καθυστέρηση σε λιγότερο από ένα δευτερόλεπτο τον επόμενο μήνα χάρη στη δουλειά του ίδιου του Vapi και τις βελτιώσεις του OpenAI.

Ο Mohamed Musbah, ένας άγγελος επενδυτής στο Vapi είπε επίσης ότι η λύση της startup θα βελτιωθεί με τη συνολική πρόοδο στο API.

«Καθώς το OpenAI και άλλοι βελτιώνουν τα μοντέλα τους, η πλατφόρμα του Vapi θα γίνει πιο ισχυρή, εξοπλισμένη με καλύτερες βάσεις γνώσεων, δυνατότητες εκτέλεσης κώδικα και μεγαλύτερα παράθυρα περιβάλλοντος. Η εστίαση της Vapi στην επίλυση των μεγαλύτερων περιοχών τριβής στη φωνητική

θα είναι το προβάδισμά της καθώς αυξάνεται η ζήτηση των χρηστών για βοηθούς φωνής», είπε.

Ωστόσο, αυτό επιβαρύνει τη βελτίωση άλλων λύσεων και όχι το ίδιο το Vapi. Ο Dearsley είπε ότι η εξάρτηση από άλλα API μειώνει την υπερασπιστικότητα του Vapi εάν οι μεγάλες εταιρείες αρχίσουν να κινούνται σε αυτόν τον τομέα. Ωστόσο, η ομάδα είπε ότι έχει ένα πλεονέκτημα όσον αφορά την κατασκευή υποδομής για να χειρίζεται χιλιάδες κλήσεις ταυτόχρονα. Ο Dearsley τόνισε ότι με την κυκλοφορία του API web και τηλεφώνου της Vapi για το κοινό, η ομάδα θα προσπαθήσει επίσης να δημιουργήσει τα δικά της μοντέλα για λύσεις ήχου σε ήχο.


VIA:

techcrunch.com


Leave A Reply



Cancel Reply

Your email address will not be published.