Χρησιμοποίησα την τεχνητή νοημοσύνη για να φτιάξω το δικό μου τρέιλερ για το GTA 6 σε 30 λεπτά — ορίστε τα αποτελέσματα

By

Marizas Dimitris

On

Δεκ 7, 2023

Εκατομμύρια άνθρωποι παρακολούθησαν το τελευταίο τρέιλερ για το GTA 6, το οποίο διέρρευσε αυτό το Σαββατοκύριακο. Είναι ένα από τα μεγαλύτερα παιχνίδια τυχερών παιχνιδιών της χρονιάς, με τις εικασίες να είναι αχαλίνωτες για το τι να περιμένουμε όταν κυκλοφορήσει το παιχνίδι.

Οπλισμένος με τίποτα περισσότερο από ένα iPhone και μερικές εφαρμογές παραγωγής τεχνητής νοημοσύνης, αποφάσισα να δω αν θα μπορούσα να δημιουργήσω ένα τρέιλερ Grand Theft Auto 6 σε μόλις 30 λεπτά.

Από τότε που μπήκα στο Tom’s Guide, χρησιμοποίησα την

τεχνητή νοημοσύνη

για να δημιουργήσω ένα γεύμα για την Ημέρα των Ευχαριστιών, μια χριστουγεννιάτικη ταινία τύπου Hallmark και να σχεδιάσω ένα ταξίδι πεζοπορίας στη

Νέα Υόρκη

. Η παραγωγή ενός τρέιλερ για ένα παιχνίδι AAA σε τόσο σύντομο χρονικό διάστημα μπορεί να είναι η μεγαλύτερη πρόκληση μέχρι τώρα — αλλά και ένας διασκεδαστικός τρόπος για να εξερευνήσω τις δυνατότητες του AI.

Από πού να ξεκινήσω;

Υπάρχουν δύο τρόποι για να το προσεγγίσετε αυτό. Το πρώτο είναι να χρησιμοποιήσετε το ChatGPT, τον Claude ή το Google’s Bard για να δημιουργήσετε ένα σενάριο και μια ιστορία και στη συνέχεια να δημιουργήσετε εικόνες γύρω από αυτό. Το δεύτερο, και αυτό που διάλεξα, είναι να ξεκινήσω με τις εικόνες και να δω πού με βγάλει.

Καθώς το DALL-E 3, η γεννήτρια εικόνων AI που είναι ενσωματωμένη στο ChatGPT Plus, μπορεί να είναι λίγο τσιγκούνης στη δημιουργία εικόνων με βάση ένα πραγματικό πρόσωπο, προϊόν ή υπηρεσία που επέλεξα να χρησιμοποιήσω το Stable Diffusion.

Το SDXL 1.0 είναι ένα ισχυρό μοντέλο δημιουργίας εικόνων και το χρησιμοποιώ μέσω του NightCafe, μιας πολυτροπικής πλατφόρμας και κοινότητας τεχνητής νοημοσύνης που δημιουργείται με πολλά προσχεδιασμένα στυλ, συμπεριλαμβανομένης της αισθητικής ενός «επικού παιχνιδιού».

Δημιουργία εικόνων

(Πίστωση εικόνας: Runway)

Η πρώτη μου προτροπή: “Grand Theft Auto 6” δημιούργησε μερικές ενδιαφέρουσες εικόνες, αλλά έμοιαζαν λίγο με το

GTA 5

. Έτσι, προσπάθησα ξανά, βελτιώνοντας την προτροπή για να πω: “Grand Theft Auto 6 gameplay κύριου χαρακτήρων”, που με έφερε πιο κοντά στον στόχο.

Η τελευταία προτροπή ήταν «Η επόμενη γενιά του Grand Theft Auto. Προηγμένη μελλοντική εμφάνιση με το gameplay του κύριου χαρακτήρα», το οποίο, αν και δεν είναι ιδιαίτερα έξυπνο, δημιούργησε εικόνες GTA-esq.

Σε κάθε γενιά το έβαλα να δημιουργεί μεταξύ έξι και εννέα εικόνων και παραδόξως ήταν η καθεμία εντελώς διαφορετική, όχι απλώς εκδόσεις του ίδιου αυτοκινήτου ή προσώπου. Διάλεξα μισή ντουζίνα από τα καλύτερα και μετά σκέφτηκα μια νέα προτροπή για εσωτερικούς χώρους και σκηνές πάρτι.

Κάνοντάς τους να κινούνται

Χρησιμοποίησα την τεχνητή νοημοσύνη για να φτιάξω το δικό μου τρέιλερ για το GTA 6 σε 30 λεπτά — ορίστε τα αποτελέσματα, Χρησιμοποίησα την τεχνητή νοημοσύνη για να φτιάξω το δικό μου τρέιλερ για το GTA 6 σε 30 λεπτά — ορίστε τα αποτελέσματα, TechWar.gr — Δεν βγήκαν όλα τα

βίντεο

όπως αναμενόταν. Εδώ ο χαρακτήρας συγχωνεύεται με το όχημα

(Πίστωση εικόνας: SDXL 1.0 συν εικόνα που δημιουργήθηκε από το Runway)

Ακολουθεί η μετατροπή της ακίνητης εικόνας σε κάτι που μοιάζει με τρέιλερ. Υπάρχουν πολλές πιθανές επιλογές για αυτό, όπως Stable Video Diffusion (SVD), Pika Labs και Runway.

Επέλεξα το Runway καθώς το Pika 1.0 δεν έχει κυκλοφορήσει και το SVD έχει περιορισμένες δυνατότητες. Το Runway σάς επιτρέπει να μετατρέπετε εικόνες, κείμενο ή βίντεο σε άλλα βίντεο και σας δίνει καλό έλεγχο της εμφάνισής του και των στοιχείων που κινούνται μέσα στο βίντεο. Για ευκολία και χρόνο το άφησα στην προεπιλογή.

Το μειονέκτημα αυτής της προσέγγισης είναι ότι μπορεί να δημιουργήσει κάποιο απροσδόκητο αποτέλεσμα. Για παράδειγμα, υπήρχε ένα κλιπ που δεν μπορούσα να χρησιμοποιήσω όπου ο πρωταγωνιστής φαινόταν να συγχωνεύεται με το όχημα στο οποίο καθόταν. Σε ένα άλλο το μηχανάκι πηγαίνει προς τα πίσω πριν διπλώσει στη μέση.

Συνολικά έκανα περίπου 20 κλιπ, με τα εννέα να είναι πλήρως χρησιμοποιήσιμα για το βίντεο. Αυτά έγιναν από εικόνες που δημιουργήθηκαν προηγουμένως και μου επέτρεψαν να δημιουργήσω το τρέιλερ των 45 δευτερολέπτων.

Πρόσθεσα ένα επιπλέον αρχικό γραφικό με το λογότυπο GTA για να ολοκληρώσω τα πράγματα. Ενώ το Stable Diffusion δημιουργεί εντυπωσιακές εικόνες, εξακολουθεί να δυσκολεύεται με το κείμενο και έτσι για την αρχική εικόνα στράφηκα στο ChatGPT Plus. Αυτό περιλαμβάνει το μοντέλο DALL-E 3 το οποίο, ως επί το πλείστον, μπορεί να δημιουργήσει καλά κατασκευασμένο, σωστά γραμμένο κείμενο.

Το έβαλα στο Runway για να δημιουργήσω ένα εναρκτήριο τσίμπημα που ξεκινούσε με το λογότυπο που δημιούργησε το DALL-E, έκανε ζουμ και τελείωσε σε μια σκηνή του δρόμου, που δημιούργησε την τέλεια μετάβαση στο πρώτο κλιπ.

Έβαλα τα κλιπ στο Adobe Premier Rush στο iPhone μου, καθώς αυτό είναι ένα πλήρες, εύκολο στη χρήση πρόγραμμα επεξεργασίας βίντεο με δωρεάν έκδοση. Πρόσθεσα ένα soundtrack hip-hop και συνειδητοποίησα ότι κάτι έλειπε ακόμα, ειδικά σε σύγκριση με το πραγματικό τρέιλερ του GTA 6.

Τελειώνοντας το

Για να ολοκληρώσω το βίντεο πρόσθεσα έναν τίτλο «Ryanstar Games presents» σε περίπου 10 δευτερόλεπτα και επέστρεψα στο ChatGPT για να γράψει έναν σύντομο μονόλογο με τη φωνή του κύριου πρωταγωνιστή.

Στη συνέχεια άνοιξα το ElevenLabs, ένα εργαλείο τεχνητής νοημοσύνης κειμένου ή ομιλίας με φωνή που δημιουργεί απίστευτα ρεαλιστικές συνθετικές φωνές. Εισήγαγα το σενάριο από το ChatGPT και έκανα κλικ στο Δημιουργία, χρησιμοποιώντας μια βαθιά, τραχιά φωνή και πρόσθεσα το αρχείο ήχου που προέκυψε στο Adobe Premier Rush.

Το βίντεο που προκύπτει, αν και δεν είναι τέλειο, εξακολουθεί να είναι μια συναρπαστική ματιά στις δυνατότητες που παρουσιάζει η τεχνητή νοημοσύνη. Δημιουργήθηκε σε μόλις 30 λεπτά, δίνει μια εικόνα του παιχνιδιού, μια φωνή και ακόμη και ένα αρχικό γραφικό για να τα συνδυάσετε όλα μαζί.

Δόθηκε αρκετός χρόνος για να τελειοποιήσετε κάθε γενιά βίντεο, δημιουργώντας πιο δομημένα μηνύματα προτροπής εικόνας και ακόμη και τη χρήση του ChatGPT για τη βελτίωση της ποιότητας των προτροπών για το SDXL 1.0, νομίζω ότι θα μπορούσα να είχα δημιουργήσει ένα πιο φυσικό συναίσθημα, συναρπαστικό τρέιλερ. Θα είχα επίσης εξερευνήσει μοντέλα παραγωγής μουσικής για να δημιουργήσω μια παραγωγή πλήρως δημιουργημένη από AI.

Αυτό που δείχνει το αποτέλεσμα είναι ότι, παρά το γεγονός ότι είναι λιγότερο από ένα χρόνο, η παραγωγή βίντεο AI βελτιώνεται συνεχώς και τελικά θα κάνει τη ζωή των εφέ καλλιτεχνών, σκηνοθετών και δημιουργικών επαγγελματιών ευκολότερη, ταχύτερη και πιο δημιουργική, καθώς η τεχνητή νοημοσύνη θα φέρει εις πέρας τα βαριά άρση.