Το φαινόμενο Sora: Τα συγκλονιστικά βίντεο που δεν πρέπει να χάσεις



Το OpenAI συνεχίζει να πειράζει τις δυνατότητες του μοντέλου παραγωγής βίντεο Sora και τα πιο πρόσφατα κλιπ πλησιάζουν περισσότερο σε μια παραγωγή του Χόλιγουντ από ό,τι έχουμε δει από την τεχνητή νοημοσύνη μέχρι σήμερα — και όλα από ένα μόνο μήνυμα.

Το Sora δεν είναι διαθέσιμο για κανέναν εκτός του OpenAI (και μια επιλεγμένη ομάδα ελεγκτών), αλλά έχουμε μια εικόνα για το τι είναι δυνατό καθώς μοιράζονται το αποτέλεσμα στα μέσα κοινωνικής δικτύωσης.

Στον πρώτο κύκλο κυκλοφοριών βίντεο είδαμε σκηνές σκύλων που έπαιζαν στο χιόνι, ένα ζευγάρι στο Τόκιο και μια αερογέφυρα σε μια πόλη εξόρυξης χρυσού στην Καλιφόρνια του 19ου αιώνα.

Τώρα βλέπουμε κλιπ από ένα μόνο μήνυμα που μοιάζουν με ολοκληρωμένες παραγωγές με πολλές λήψεις, εφέ και σταθερή κίνηση σε βίντεο διάρκειας έως και ενός λεπτού.

Ποια είναι μερικά από τα νέα κλιπ;


(Πίστωση εικόνας: OpenAI Sora)


Δείτε περισσότερα

Τα κλιπ που είδαμε υπονοούν το μέλλον της αληθινής παραγωγικής ψυχαγωγίας. Όταν συνδυάζεται με άλλα μοντέλα AI για ήχο, συγχρονισμό χειλιών ή ακόμα και πλατφόρμες επιπέδου παραγωγής, όπως το LTX Studio — η δημιουργικότητα γίνεται πραγματικά προσβάσιμη.

Blaine Brown, α

δημιουργός στο X

μοιράστηκε ένα βίντεο που συνδύαζε τον εξωγήινο Sora από

Bill Peebles

με το Pika Labs Lip Sync και ένα τραγούδι που δημιουργήθηκε χρησιμοποιώντας το Suno AI για τη δημιουργία ενός μουσικού βίντεο.

Η διέλευση του μουσείου από

Τιμ Μπρουκς

είναι εντυπωσιακό για την ποικιλία των λήψεων και της ροής κίνησης που επιτυγχάνει — εμφανίζεται σαν βίντεο drone αλλά σε εσωτερικούς χώρους.

Άλλοι, όπως ένα ζευγάρι που τρώει σε μια δοξασμένη δεξαμενή ψαριών, δείχνει τις δυνατότητές του με πολύπλοκη κίνηση, διατηρώντας σταθερή ροή σε όλο το κλιπ.

Πώς συγκρίνει ο Σόρα;

OpenAI Sora


(Πίστωση εικόνας: OpenAI Sora)


Δείτε περισσότερα

Η Sora είναι μια σημαντική στιγμή στο βίντεο AI. Χρησιμοποιεί έναν συνδυασμό της τεχνολογίας μετασχηματιστή σε chatbots όπως το ChatGPT και τα μοντέλα διάχυσης δημιουργίας εικόνας που βρίσκονται στα MidJourney, Stable Diffusion και DALL-E.

Αυτή τη στιγμή μπορεί να κάνει πράγματα που δεν είναι δυνατά με κανένα από τα άλλα μεγάλα μοντέλα βίντεο τεχνητής νοημοσύνης όπως το Runway’s Gen-2, το Pika Labs Pika 1.0 ή το StabilityAI’s Stable Video Diffusion 1.1.

Προς το παρόν, τα διαθέσιμα εργαλεία βίντεο AI δημιουργούν κλιπ διάρκειας μεταξύ 1 και 4 δευτερολέπτων, μερικές φορές δυσκολεύονται με πολύπλοκη κίνηση, αλλά ο ρεαλισμός είναι σχεδόν τόσο καλός όσο ο Sora.

OpenAI Sora


(Πίστωση εικόνας: OpenAI Sora)

Ωστόσο, άλλες εταιρείες τεχνητής νοημοσύνης λαμβάνουν υπόψη τι μπορεί να κάνει η Sora και πώς έχει παραχθεί. Η StabilityAI επιβεβαίωσε ότι το Stable Diffusion 3 θα ακολουθήσει παρόμοια αρχιτεκτονική και είναι πιθανό να δούμε ένα μοντέλο βίντεο τελικά.

Το Runway έχει ήδη κάνει αλλαγές στο μοντέλο Gen-2 και βλέπουμε πολύ πιο συνεπή ανάπτυξη κίνησης και χαρακτήρων, και η Pika αποκάλυψε το Lip Sync ως ένα χαρακτηριστικό που ξεχωρίζει για να φέρει περισσότερο ρεαλισμό στους χαρακτήρες.


Περισσότερα από το Tom’s Guide


VIA:

TomsGuide.com


Follow TechWar.gr on Google News