Η Dumme που υποστηρίζεται από το YC συγκεντρώνει 3,4 εκατομμύρια δολάρια για το πρόγραμμα επεξεργασίας βίντεο AI που μετατρέπει τα βίντεο μεγάλης μορφής YouTube σε Short
Related Posts
Dumme
, μια startup που χρησιμοποιεί την τεχνητή νοημοσύνη σε πρακτική επεξεργασία στην επεξεργασία βίντεο, δημιουργεί ήδη ζήτηση πριν ανοίξει στο κοινό. Η εταιρεία που υποστηρίζεται από το Y Combinator έχει εκατοντάδες δημιουργούς βίντεο που δοκιμάζουν το προϊόν της, το οποίο αξιοποιεί την τεχνητή νοημοσύνη για τη δημιουργία βίντεο σύντομης μορφής από περιεχόμενο YouTube και
λίστα αναμονής
πάνω από 20.000 πριν από την κυκλοφορία, λέει. Χρησιμοποιώντας έναν συνδυασμό ιδιόκτητων και υφιστάμενων μοντέλων τεχνητής νοημοσύνης, η υπόσχεση του Dumme είναι ότι όχι μόνο μπορεί να εξοικονομήσει χρόνο επεξεργασίας αλλά και —και εδώ είναι ο μεγάλος ισχυρισμός του— να κάνει καλύτερη δουλειά από το συμβασιούχο (ανθρώπινο) εργατικό δυναμικό που συχνά επιφορτίζεται με πιο ταπεινούς εργασίες επεξεργασίας βίντεο, όπως η περικοπή περιεχομένου μεγάλης μορφής για δημοσίευση σε πλατφόρμες σύντομης μορφής όπως το YouTube Shorts, το TikTok ή το Instagram Reels.
Ιδρύθηκε τον Ιανουάριο του 2022 και συμμετέχει στο πρόγραμμα Startup Accelerator Y Combinator’s Winter 2022, συνιδρυτής και Διευθύνων Σύμβουλος της Dumme
Merwane Drai
είπε ότι αρχικά επικεντρώθηκε στην κατασκευή μιας μηχανής αναζήτησης για βίντεο. Ωστόσο, πριν από περίπου έξι μήνες, η ομάδα συνειδητοποίησε ότι ένα καλύτερο προϊόν θα μπορούσε να ήταν η επαναχρησιμοποίηση των ίδιων μοντέλων τεχνητής νοημοσύνης που ανέπτυσσαν για την επεξεργασία βίντεο κλιπ.
Συμμετέχουν οι συνιδρυτές
Ο Γουίλ Νταλστρομ
(CPO) και
Τζόρνταν Μπράναν
(CTO), όλα με υπόβαθρο τεχνητής νοημοσύνης, ο Drai συνειδητοποίησε ότι ο Dumme μπορεί να προσγειώθηκε στη σωστή προσαρμογή στην αγορά προϊόντος αφού η εφαρμογή τους έγινε viral, καταρρέοντας τους διακομιστές τους.
«Δεν περιμέναμε πραγματικά ότι θα είχε πολλή έλξη ή οτιδήποτε άλλο, οπότε απλά βάλαμε κάτι εκεί έξω», εξηγεί ο Drai. «Στη συνέχεια, αυτό που συνέβη είναι ότι κατά τη διάρκεια της νύχτας, ξυπνήσαμε με υπερφορτωμένους διακομιστές – όπως, τίποτα δεν λειτούργησε στην πραγματικότητα. Οπότε καταργήσαμε τα πάντα και στην πραγματικότητα φτιάξαμε κάποιο είδος λίστας αναμονής», συνεχίζει. «Το επόμενο πρωί, πιθανότατα ξυπνήσαμε 5.000 άτομα εκεί, κάτι που ήταν ενδιαφέρον».
Η ομάδα ανακάλυψε αργότερα ότι ένας δημιουργός του TikTok είχε δημοσιεύσει ένα σύντομο βίντεο για το προϊόν, το οποίο έστειλε μια πλημμύρα επισκεψιμότητας στον ιστότοπό τους.
«Στην πραγματικότητα δεν ηρέμησε ποτέ από αυτό», σημειώνει ο Drai.
Το προϊόν, που προφέρεται “εικονικό”, απήχησε τους δημιουργούς επειδή είχε ως στόχο να απλοποιήσει και να επιταχύνει την εργασία που συνεπάγεται η επεξεργασία βίντεο.
Συντελεστές εικόνας:
Dumme
Η χρήση του Dumme είναι τόσο απλή όσο υποδηλώνει το όνομα. Για να ξεκινήσετε, ο χρήστης επικολλά τον σύνδεσμο ενός βίντεο YouTube και, στη συνέχεια, κάνει κλικ στο “δημιουργία” και η τεχνητή νοημοσύνη θα παράγει έναν αριθμό σύντομων βίντεο που παρουσιάζουν τα σημαντικότερα σημεία από αυτό το περιεχόμενο που έχει απορροφηθεί. Η εταιρεία λέει ότι χρησιμοποιεί το YouTube ως πηγή, αντί να υποστηρίζει ακατέργαστο υλικό βίντεο, προκειμένου να αναθέτει σε τρίτους την εποπτεία περιεχομένου — δηλαδή, εάν επιτρέπεται στο YouTube, επιτρέπεται στο Dumme.
Ο χρόνος επεξεργασίας και ο αριθμός των κλιπ που θα προκύψουν θα εξαρτηθούν από τη διάρκεια του αρχικού βίντεο.
Ωστόσο, για παράδειγμα, η επεξεργασία ενός podcast βίντεο διάρκειας μιας ώρας μπορεί να διαρκέσει περίπου 20 λεπτά και θα αρχίσετε να λαμβάνετε κλιπ μετά από περίπου πέντε λεπτά, λέει ο Drai. Όταν ολοκληρωθούν, οι δημιουργοί μπορούν να κατεβάσουν τα βίντεο κλιπ, τα οποία είναι λιγότερο από 60 δευτερόλεπτα από προεπιλογή, και να τα ανεβάσουν σε οποιαδήποτε πλατφόρμα υποστηρίζει περιεχόμενο σύντομης μορφής, όπως το YouTube Shorts, αλλά και άλλες πλατφόρμες, όπως το Reels ή το TikTok.
Συντελεστές εικόνας:
Dumme
Το πώς λειτουργεί όλο αυτό στο backend, φυσικά, είναι πολύ πιο περίπλοκο. Η εταιρεία λέει ότι, αρχικά, ο Dumme θα μάθει όσα περισσότερα μπορεί από το βίντεο πηγής μέσω των μεταδεδομένων. Στη συνέχεια, μεταγράφει το βίντεο και προσπαθεί να κατανοήσει τη σημασιολογία όσων λέγονται, ενώ εξετάζει επίσης τα καρέ για να προσπαθήσει να αποκωδικοποιήσει τα συναισθήματα του ατόμου που μιλάει. Αυτά τα ευρήματα συσχετίζονται και περνούν σε ένα γλωσσικό μοντέλο που προσπαθεί να προσδιορίσει ποια μέρη του βίντεο αξίζει να αποκοπούν. Στη συνέχεια, παραδίδεται σε ένα άλλο μοντέλο που παρακολουθεί τα ενεργά ηχεία και χειρίζεται την περικοπή.
Η Dumme λέει ότι συνεργάζεται με υπάρχοντα μοντέλα τεχνητής νοημοσύνης όπως το GPT-4, μια τελειοποιημένη έκδοση του Whisper και άλλα που κατασκεύασε εσωτερικά — όπως το μοντέλο που παρακολουθεί τα ενεργά ηχεία σε ένα καρέ βίντεο. Ένα από τα μοντέλα της έχει επίσης εκπαιδευτεί σε ένα σωρό YouTube Shorts για να μάθει τι είναι ένα καλό άνοιγμα που προσελκύει τους θεατές. Και, αν και δεν είναι ακόμα ζωντανό, η ομάδα πειραματίζεται επίσης με ένα μοντέλο ανοιχτού κώδικα.
LaViLa
από το Facebook Research, για να κατανοήσετε καλύτερα το πλαίσιο του βίντεο.
Η εργασία AI γίνεται στον πάροχο GPU Cloud
CoreWeave
όχι AWS, καθώς είναι πιο προσιτό, μας λέει η εταιρεία.
Επειδή ο Dumme βασίζεται στην τεχνητή νοημοσύνη που επεξεργάζεται τις προφορικές λέξεις, η τεχνολογία δεν είναι κατάλληλη για πράγματα όπως μεγάλα βίντεο παιχνιδιού ή άλλα όπου οι άνθρωποι δεν μιλούν. Ο Drai λέει ότι η εκκίνηση στοχεύει αρχικά σε δημιουργούς, podcasters και πρακτορεία YouTube — το τελευταίο, πιστεύουν, θα ήταν το καλύτερο στοίχημα για τη δημιουργία εσόδων από το προϊόν.
Συντελεστές εικόνας:
Dumme
Τα πρακτορεία, εξηγεί ο Drai, σήμερα συχνά αναθέτουν σε εξωτερικούς συνεργάτες αυτού του είδους τις εργασίες με αποτελέσματα που δεν θα πετύχουν.
«Απλώς πληρώνουν εργολάβους σε φτηνές δικαιοδοσίες για να επεξεργαστούν το δικό τους περιεχόμενο. Και το πρόβλημα είναι ότι είναι στην πραγματικότητα αρκετά ακριβό και απαιτεί πολύ χρόνο — διαρκεί εβδομάδες, όχι λεπτά», λέει.
Ερωτηθείς πώς αισθάνεται για τη δημιουργία μιας τεχνολογίας που θα έθετε τους ανθρώπους χωρίς δουλειά, ο Drai δεν ανησυχούσε.
«Ο τρόπος που το σκέφτομαι είναι ότι, τελικά…νομίζω ότι είναι σαν να μου λένε ότι οι καθηγητές μαθηματικών θα [be put] εκτός δουλειάς γιατί υπάρχει κάτι που λέγεται αριθμομηχανή…», εξηγεί. «Οι άνθρωποι θα προσαρμοστούν. Και τότε θα υπάρχει κάποιος που θα σας μάθει για την αριθμομηχανή, σωστά; Οπότε νομίζω ότι είναι απλώς θέμα προσαρμογής σε αυτό», λέει ο Drai.
Επί του παρόντος, η τιμολόγηση που εξετάζεται περιλαμβάνει επίπεδα όπου μια επιχείρηση θα πληρώνει 0,40 $ ανά λεπτό επεξεργασίας βίντεο, ενώ οι μικρότεροι δημιουργοί μπορούν να επιλέξουν μια μηνιαία συνδρομή που περιορίζεται στις 10 ώρες περιεχομένου ανά μήνα. (Αυτοί οι αριθμοί ενδέχεται να αλλάξουν.) Κατά τη διάρκεια της δοκιμής, το προϊόν ήταν δωρεάν για χρήση.
Οι πρώτοι χρήστες έχουν χρησιμοποιήσει το Dumme για μια ποικιλία επεξεργασιών, συμπεριλαμβανομένης της δημιουργίας κλιπ από τα podcast βίντεο τους για δημοσίευση στα Shorts, καθώς και για την περικοπή άλλων νέων βίντεο και την περιήγηση στους πίσω καταλόγους τους.
Το προϊόν φαίνεται να είναι ανταγωνιστικό με άλλες τεχνολογίες τεχνητής νοημοσύνης στην αγορά, συμπεριλαμβανομένης αυτής της εταιρείας δημιουργού Jellysmack, η οποία έχει
μόχλευση
Η τεχνητή νοημοσύνη θα μετατρέψει μεγαλύτερα βίντεο YouTube σε μικρότερα βίντεο, κόβοντάς τα, αλλάζοντάς τα μεγέθη και βελτιστοποιώντας τα για συγκεκριμένες πλατφόρμες — αποτέλεσμα του Kamua του 2021
απόκτηση
. Άλλα εργαλεία που κάνουν παρόμοια εργασία περιλαμβάνουν πράγματα όπως
Opus Clip
,
Vidyo.ai
,
Λεπτομέρεια
,
TubeBuddy
,
Wisecut
, και άλλοι. Ο βαθμός επιτυχίας ή αποτυχίας του Dumme εξαρτάται από την καλύτερη απόδοση έναντι των ανταγωνιστών όσον αφορά την ποιότητα της εργασίας και το κόστος – μετρήσεις που δεν έχουν ακόμη καθοριστεί.
Αλλά ορισμένοι επενδυτές βάζουν τα στοιχήματά τους στο Dumme. Πριν από την κυκλοφορία, η startup συγκέντρωσε έναν κύκλο εκκίνησης 3,4 εκατομμυρίων δολαρίων από τους Y Combinator, Caffeinated Capital, Max and Nellie Levchin (μέσω SciFi VC), Suhail Doshi, Nico Chinot, Protocol Labs, Chris Puscasiu και άλλους αγγέλους.
Δεδομένου του ενδιαφέροντος και της μεγάλης λίστας αναμονής, ο Dumme λέει ότι στοχεύει να επιβιβάζεται περίπου 500 άτομα κάθε εβδομάδα.
Οι αναγνώστες του TechCrunch μπορούν να περάσουν τη γραμμή χρησιμοποιώντας τον κωδικό πρόσκλησης
TECHCRUNCH
μέχρι να τελειώσουν οι υποδοχές.

