Το νέο μοντέλο τεχνητής νοημοσύνης του OpenAI μετατρέπει το κείμενο σε βίντεο 60 δευτερολέπτων

By

Marizas Dimitris

On

Φεβ 15, 2024

TL;DR

Η OpenAI μόλις ανακοίνωσε ένα νέο μοντέλο AI που ονομάζεται Sora.
Το εργαλείο τεχνητής νοημοσύνης που δημιουργεί κείμενο σε βίντεο μπορεί να δημιουργήσει έως και 60 δευτερόλεπτα περιεχομένου βίντεο.
Η εταιρεία λέει ότι αυτή τη στιγμή συνεργάζεται με Red teamers για να δοκιμάσει το μοντέλο.

Νωρίτερα σήμερα, η Google ανακοίνωσε ότι κυκλοφορεί την έκδοση 1.5 του Gemini σε προγραμματιστές και εταιρικούς χρήστες. Για να μην μείνουμε πίσω, ένας από τους μεγαλύτερους ανταγωνιστές της Google – το OpenAI – έκανε επίσης μια μεγάλη ανακοίνωση AI σήμερα. Ωστόσο, αυτή η ανακοίνωση περιλαμβάνει ένα νέο μοντέλο τεχνητής νοημοσύνης κειμένου σε βίντεο.

Σε ένα

ανάρτηση

, και στη συνέχεια στα μέσα κοινωνικής δικτύωσης, το OpenAI αποκάλυψε ένα νέο μοντέλο τεχνητής νοημοσύνης που δημιουργεί κείμενο σε βίντεο που ονομάζεται Sora. Η ανακοίνωση συνοδεύεται από κλιπ που δημιουργήθηκαν από το λογισμικό, τα οποία κυμαίνονται από μια κινεζική σεληνιακή πρωτοχρονιά μέχρι ένα κινούμενο τέρας που λιακώνει πάνω από ένα κόκκινο κερί.

Παρουσιάζουμε τη Sora, το μοντέλο μας για μετατροπή κειμένου σε βίντεο.

Το Sora μπορεί να δημιουργήσει βίντεο διάρκειας έως και 60 δευτερολέπτων με εξαιρετικά λεπτομερείς σκηνές, πολύπλοκες κινήσεις της κάμερας και πολλούς χαρακτήρες με ζωηρά συναισθήματα.

https://t.co/7j2JN27M3W

Το OpenAI δηλώνει ότι το Sora τίθεται επί του παρόντος στη διάθεση των κόκκινων ομάδων για να «αξιολογήσουν κρίσιμες περιοχές για βλάβες ή κινδύνους». Αυτοί οι κόκκινοι συνεργάτες περιλαμβάνουν ειδικούς σε τομείς όπως η παραπληροφόρηση, το περιεχόμενο μίσους και η προκατάληψη. Εκτός από αυτή τη δοκιμή, η Sora φέρεται επίσης να τηρεί τα μέτρα ασφαλείας που υπάρχουν για το DALL·E 3. Η εταιρεία προσθέτει ότι εργάζεται σε εργαλεία που θα βοηθήσουν στην ανίχνευση εάν ένα βίντεο δημιουργήθηκε από τον Sora.

Παρόλο που άλλοι, όπως το Pika και το Stability AI, έχουν νικήσει το OpenAI στο τέρμα όσον αφορά τη δημιουργία βίντεο με τεχνητή νοημοσύνη, υπάρχουν μερικά πράγματα που κάνουν το Sora να ξεχωρίζει. Για ένα, ο Sora μπορεί να δημιουργήσει έως και 60 δευτερόλεπτα βίντεο, ενώ οι ανταγωνιστές διαχειρίζονται μόνο περίπου τέσσερα δευτερόλεπτα. Έπειτα, υπάρχει η ευκρίνεια, η ανάλυση και η ακρίβεια του περιβάλλοντος κόσμου.

Υπάρχουν πάνω από 35 παραδείγματα που μπορείτε να δείτε στον ιστότοπο του OpenAI. Αν και τα αποτελέσματα είναι εντυπωσιακά, το μοντέλο απέχει πολύ από το τέλειο. Όπως παραδέχεται η εταιρεία:

Το σημερινό μοντέλο έχει αδυναμίες. Μπορεί να δυσκολεύεται με την ακριβή προσομοίωση της φυσικής μιας περίπλοκης σκηνής και μπορεί να μην κατανοεί συγκεκριμένες περιπτώσεις αιτίας και αποτελέσματος. Για παράδειγμα, ένα άτομο μπορεί να πάρει μια μπουκιά από ένα cookie, αλλά στη συνέχεια, το cookie μπορεί να μην έχει σημάδι δαγκώματος.

Το μοντέλο μπορεί επίσης να μπερδεύει τις χωρικές λεπτομέρειες μιας προτροπής, για παράδειγμα, να αναμιγνύει αριστερά και δεξιά και μπορεί να δυσκολεύεται με ακριβείς περιγραφές γεγονότων που λαμβάνουν χώρα με την πάροδο του χρόνου, όπως η παρακολούθηση μιας συγκεκριμένης τροχιάς κάμερας.

Μπορείτε να δείτε ένα παράδειγμα αυτού στο πρώτο βίντεο που εμφανίζεται στο ιστολόγιο. Το βίντεο δείχνει μια γυναίκα να περπατά στο Τόκιο. Αν παρακολουθήσετε προσεκτικά, θα παρατηρήσετε ότι τα πόδια της γυναίκας περιστασιακά αλλάζουν ή τραυλίζουν, τα πόδια της γλιστρούν στο έδαφος και η στολή και τα μαλλιά της αλλάζουν κοντά στο τέλος.

Παρά το γεγονός ότι το Sora δεν είναι διαθέσιμο στο ευρύ κοινό, ο Διευθύνων Σύμβουλος Sam Altman δέχεται προτροπές από χρήστες X (πρώην Twitter).

Έχετε μια συμβουλή; Μίλησέ μας!

Στείλτε email στο προσωπικό μας στο
. Μπορείτε να παραμείνετε ανώνυμοι ή να λάβετε πίστωση για τις πληροφορίες, είναι δική σας επιλογή.

VIA:

AndroidAuthority.com