Το νέο μοντέλο κειμένου σε βίντεο Sora του OpenAI μπορεί να δημιουργήσει συγκλονιστικά ρεαλιστικό περιεχόμενο


Το OpenAI ανοίγει νέους δρόμους καθώς ο γίγαντας της τεχνητής νοημοσύνης αποκάλυψε το πρώτο του μοντέλο κειμένου σε βίντεο που ονομάζεται Sora, ικανό να δημιουργεί συγκλονιστικά ρεαλιστικό περιεχόμενο.

Αναρωτιόμασταν πότε τελικά η εταιρεία επρόκειτο να κυκλοφορήσει τη δική της μηχανή βίντεο καθώς τόσοι πολλοί από τους ανταγωνιστές της, από το Stability AI έως την Google, τους έχουν νικήσει μέχρι το τέλος. Ίσως το OpenAI ήθελε να κάνει τα πράγματα ακριβώς πριν από μια σωστή κυκλοφορία. Με αυτόν τον ρυθμό, η ποιότητα των αποτελεσμάτων της θα μπορούσε να επισκιάσει τους σύγχρονούς της.

Σύμφωνα με την επίσημη σελίδα

, ο Sora μπορεί να δημιουργήσει «ρεαλιστικές και ευφάνταστες σκηνές» από ένα μόνο μήνυμα κειμένου. όπως και άλλα μοντέλα τεχνητής νοημοσύνης από κείμενο σε βίντεο. Η διαφορά με αυτόν τον κινητήρα είναι η τεχνολογία πίσω από αυτόν.

Ζωντανό περιεχόμενο

Η Open AI ισχυρίζεται ότι η τεχνητή νοημοσύνη της μπορεί να καταλάβει πώς οι άνθρωποι και τα αντικείμενα «υπάρχουν στον φυσικό κόσμο». Αυτό δίνει στον Sora τη δυνατότητα να δημιουργεί σκηνές με πολλά άτομα, διαφορετικούς τύπους κίνησης, εκφράσεις προσώπου, υφές και αντικείμενα με μεγάλη ποσότητα λεπτομέρειας. Τα βίντεο που δημιουργούνται δεν έχουν την πλαστική εμφάνιση ή τις εφιαλτικές μορφές που εμφανίζονται σε άλλο περιεχόμενο τεχνητής νοημοσύνης – ως επί το πλείστον, αλλά περισσότερα για αυτό αργότερα.

Το Sora είναι επίσης πολυμορφικό. Σύμφωνα με πληροφορίες, οι χρήστες θα μπορούν να ανεβάζουν μια ακίνητη εικόνα για να χρησιμεύσει ως βάση ενός βίντεο. Το περιεχόμενο μέσα στην εικόνα θα γίνει κινούμενο με μεγάλη προσοχή στις μικρές λεπτομέρειες. Μπορεί ακόμη και να τραβήξει ένα προϋπάρχον βίντεο «και να το επεκτείνει ή να συμπληρώσει τα καρέ που λείπουν».


Δείτε περισσότερα

Μπορείτε να βρείτε δείγματα κλιπ στον ιστότοπο του OpenAI και στο X (η πλατφόρμα παλαιότερα γνωστή ως Twitter). Ένα από τα αγαπημένα μας περιλαμβάνει μια ομάδα κουταβιών που παίζουν στο χιόνι. Αν κοιτάξετε προσεκτικά, μπορείτε να δείτε τη γούνα τους και το χιόνι στο ρύγχος τους έχει μια εντυπωσιακά ζωντανή ποιότητα γι ‘αυτούς.

Άλλο ένα υπέροχο κλιπ

δείχνει ένα περιστέρι με στέμμα Βικτώριας να τριγυρίζει σαν πραγματικό πουλί.

Ένα έργο σε εξέλιξη

Όσο εντυπωσιακά κι αν είναι αυτά τα δύο βίντεο, η Σόρα δεν είναι τέλεια. Το OpenAI παραδέχεται ότι «το μοντέλο του έχει αδυναμίες». Μπορεί να δυσκολευτεί να προσομοιώσει τη φυσική ενός αντικειμένου, να μπερδέψει τα αριστερά από τα δεξιά, καθώς και να παρεξηγήσει «περιπτώσεις αιτίας και αποτελέσματος». Μπορείτε να δαγκώσετε έναν χαρακτήρα τεχνητής νοημοσύνης σε ένα cookie, αλλά το cookie δεν έχει σημάδι δαγκώματος.

Κάνει επίσης πολλά περίεργα λάθη.

Μια από τις πιο αστείες ατυχίες

περιλαμβάνει μια ομάδα αρχαιολόγων που ανακαλύπτουν ένα μεγάλο κομμάτι χαρτί το οποίο στη συνέχεια μεταμορφώνεται σε μια καρέκλα πριν καταλήξει σε ένα τσαλακωμένο κομμάτι πλαστικό. Το AI φαίνεται επίσης να έχει πρόβλημα με τις λέξεις. Το “Otter” γράφεται λάθος ως “Oter” και το “Land Rover” είναι πλέον “Danover”.


Δείτε περισσότερα

Προχωρώντας προς τα εμπρός, η εταιρεία θα συνεργαστεί με τους «κόκκινους συνεργάτες» της, οι οποίοι είναι μια ομάδα ειδικών του κλάδου «για να αξιολογήσουν κρίσιμους τομείς για βλάβες ή κινδύνους». Θέλουν να βεβαιωθούν ότι η Sora δεν δημιουργεί ψευδείς πληροφορίες, περιεχόμενο μίσους ή έχει κάποια προκατάληψη. Επιπλέον, το OpenAI πρόκειται να εφαρμόσει έναν ταξινομητή κειμένου για την απόρριψη προτροπών που παραβιάζουν την πολιτική τους. Αυτά περιλαμβάνουν στοιχεία που ζητούν σεξουαλικό περιεχόμενο, βίαια βίντεο και παρομοιώσεις διασημοτήτων μεταξύ άλλων.

Δεν υπάρχουν πληροφορίες για το πότε θα κυκλοφορήσει επίσημα ο Sora. Επικοινωνήσαμε για πληροφορίες σχετικά με την κυκλοφορία. Αυτή η ιστορία θα ενημερωθεί αργότερα. Στο μεταξύ, ρίξτε μια ματιά στη λίστα του TechRadar με τους καλύτερους επεξεργαστές βίντεο AI για το 2024.


VIA:

TechRadar.com/


Follow TechWar.gr on Google News