Το φαινόμενο Sora: Τα συγκλονιστικά βίντεο που δεν πρέπει να χάσεις

By

Marizas Dimitris

On

Μαρ 4, 2024

Το OpenAI συνεχίζει να πειράζει τις δυνατότητες του μοντέλου παραγωγής βίντεο Sora και τα πιο πρόσφατα κλιπ πλησιάζουν περισσότερο σε μια παραγωγή του Χόλιγουντ από ό,τι έχουμε δει από την τεχνητή νοημοσύνη μέχρι σήμερα — και όλα από ένα μόνο μήνυμα.

Το Sora δεν είναι διαθέσιμο για κανέναν εκτός του OpenAI (και μια επιλεγμένη ομάδα ελεγκτών), αλλά έχουμε μια εικόνα για το τι είναι δυνατό καθώς μοιράζονται το αποτέλεσμα στα μέσα κοινωνικής δικτύωσης.

Στον πρώτο κύκλο κυκλοφοριών βίντεο είδαμε σκηνές σκύλων που έπαιζαν στο χιόνι, ένα ζευγάρι στο Τόκιο και μια αερογέφυρα σε μια πόλη εξόρυξης χρυσού στην Καλιφόρνια του 19ου αιώνα.

Τώρα βλέπουμε κλιπ από ένα μόνο μήνυμα που μοιάζουν με ολοκληρωμένες παραγωγές με πολλές λήψεις, εφέ και σταθερή κίνηση σε βίντεο διάρκειας έως και ενός λεπτού.

Ποια είναι μερικά από τα νέα κλιπ;

(Πίστωση εικόνας: OpenAI Sora)

“Πετάξτε σε ένα μουσείο με πολλούς πίνακες και γλυπτά και όμορφα έργα τέχνης σε όλα τα στυλ”Βίντεο που δημιουργήθηκε από την #Sora pic.twitter.com/SNr9dQZe5V

2 Μαρτίου 2024

Δείτε περισσότερα

Τα κλιπ που είδαμε υπονοούν το μέλλον της αληθινής παραγωγικής ψυχαγωγίας. Όταν συνδυάζεται με άλλα μοντέλα AI για ήχο, συγχρονισμό χειλιών ή ακόμα και πλατφόρμες επιπέδου παραγωγής, όπως το LTX Studio — η δημιουργικότητα γίνεται πραγματικά προσβάσιμη.

Blaine Brown, α

δημιουργός στο X

μοιράστηκε ένα βίντεο που συνδύαζε τον εξωγήινο Sora από

Bill Peebles

με το Pika Labs Lip Sync και ένα τραγούδι που δημιουργήθηκε χρησιμοποιώντας το Suno AI για τη δημιουργία ενός μουσικού βίντεο.

Η διέλευση του μουσείου από

Τιμ Μπρουκς

είναι εντυπωσιακό για την ποικιλία των λήψεων και της ροής κίνησης που επιτυγχάνει — εμφανίζεται σαν βίντεο drone αλλά σε εσωτερικούς χώρους.

Άλλοι, όπως ένα ζευγάρι που τρώει σε μια δοξασμένη δεξαμενή ψαριών, δείχνει τις δυνατότητές του με πολύπλοκη κίνηση, διατηρώντας σταθερή ροή σε όλο το κλιπ.

Πώς συγκρίνει ο Σόρα;

Αυτό το κλιπ Sora είναι 🔥 όταν ο εξωγήινος τύπος ξεσπάει σε ένα ραπ που συγχρονίζεται με τα χείλη για το πόσο δύσκολο είναι να είναι διαφορετικό από όλους τους άλλους. Ροή εργασιών στο νήμα.@suno_ai_ @pika_labs (lip sync)Alienate Yourself 🆙🔊🔊 pic.twitter.com/kc5FI83q5R

3 Μαρτίου 2024

Δείτε περισσότερα

Η Sora είναι μια σημαντική στιγμή στο βίντεο AI. Χρησιμοποιεί έναν συνδυασμό της τεχνολογίας μετασχηματιστή σε chatbots όπως το ChatGPT και τα μοντέλα διάχυσης δημιουργίας εικόνας που βρίσκονται στα MidJourney, Stable Diffusion και DALL-E.

Αυτή τη στιγμή μπορεί να κάνει πράγματα που δεν είναι δυνατά με κανένα από τα άλλα μεγάλα μοντέλα βίντεο τεχνητής νοημοσύνης όπως το Runway’s Gen-2, το Pika Labs Pika 1.0 ή το StabilityAI’s Stable Video Diffusion 1.1.

Προς το παρόν, τα διαθέσιμα εργαλεία βίντεο AI δημιουργούν κλιπ διάρκειας μεταξύ 1 και 4 δευτερολέπτων, μερικές φορές δυσκολεύονται με πολύπλοκη κίνηση, αλλά ο ρεαλισμός είναι σχεδόν τόσο καλός όσο ο Sora.

Ωστόσο, άλλες εταιρείες τεχνητής νοημοσύνης λαμβάνουν υπόψη τι μπορεί να κάνει η Sora και πώς έχει παραχθεί. Η StabilityAI επιβεβαίωσε ότι το Stable Diffusion 3 θα ακολουθήσει παρόμοια αρχιτεκτονική και είναι πιθανό να δούμε ένα μοντέλο βίντεο τελικά.

Το Runway έχει ήδη κάνει αλλαγές στο μοντέλο Gen-2 και βλέπουμε πολύ πιο συνεπή ανάπτυξη κίνησης και χαρακτήρων, και η Pika αποκάλυψε το Lip Sync ως ένα χαρακτηριστικό που ξεχωρίζει για να φέρει περισσότερο ρεαλισμό στους χαρακτήρες.