Σε τι εκπαιδεύτηκε η Σόρα; Οι δημιουργικοί απαιτούν απαντήσεις.

By

Marizas Dimitris

On

Φεβ 17, 2024

Την Πέμπτη, το OpenAI ταρακούνησε για άλλη μια φορά τον κόσμο της τεχνητής νοημοσύνης με ένα μοντέλο παραγωγής βίντεο που ονομάζεται Sora.

Οι επιδείξεις έδειχναν φωτορεαλιστικά βίντεο με καθαρές λεπτομέρειες και πολυπλοκότητα, βασισμένα σε απλά μηνύματα κειμένου. ΕΝΑ

βίντεο

με βάση την προτροπή “Αντανακλάσεις στο παράθυρο ενός τρένου που ταξιδεύει μέσα από τα προάστια του Τόκιο” έμοιαζε σαν να έχει βιντεοσκοπηθεί σε τηλέφωνο, συμπεριλαμβανομένης της ασταμάτητης λειτουργίας της κάμερας και των αντανακλάσεων των επιβατών του τρένου. Δεν φαίνονται παράξενα παραμορφωμένα χέρια.

Το

tweet

μπορεί να έχει διαγραφεί

Ένα βίντεο από την προτροπή, “Ένα

τρέιλερ

ταινίας με τις περιπέτειες του 30χρονου διαστημικού άνδρα με κόκκινο μάλλινο πλεκτό κράνος μοτοσικλέτας, γαλάζιος ουρανός, αλμυρή έρημος, κινηματογραφικό στιλ, γυρίστηκε σε φιλμ 35 χιλιοστών, ζωηρά χρώματα” έμοιαζε με Christopher Nolan -Υβρίδιο Wes Anderson.

Το tweet μπορεί να έχει διαγραφεί

Ένα άλλο κουτάβι Γκόλντεν Ριτρίβερ που έπαιζε στο χιόνι έκανε απαλή γούνα και χνουδωτό χιόνι τόσο ρεαλιστικά που θα μπορούσατε να το απλώσετε και να το αγγίξετε.

Το ερώτημα των 7 τρισεκατομμυρίων δολαρίων είναι πώς το OpenAI το πέτυχε αυτό; Στην πραγματικότητα δεν γνωρίζουμε γιατί το OpenAI μόλις και μετά βίας έχει κοινοποιήσει τίποτα σχετικά με τα εκπαιδευτικά του δεδομένα. Αλλά για να δημιουργήσει ένα μοντέλο τόσο προηγμένο, ο Sora χρειαζόταν πολλά δεδομένα βίντεο, επομένως μπορούμε να υποθέσουμε ότι εκπαιδεύτηκε σε δεδομένα βίντεο που είχαν αφαιρεθεί από όλες τις γωνιές του Διαδικτύου. Και ορισμένοι εικάζουν ότι τα δεδομένα εκπαίδευσης περιελάμβαναν έργα που προστατεύονται από πνευματικά δικαιώματα. Το OpenAI δεν απάντησε αμέσως στο αίτημα για σχόλια σχετικά με τα δεδομένα εκπαίδευσης του Sora.

ΔΕΙΤΕ ΕΠΙΣΗΣ:

8 άγρια βίντεο Sora AI που δημιουργούνται από το νέο εργαλείο OpenAI που πρέπει να δείτε

Σε OpenAI’s

τεχνικό χαρτί

εστιάζει σε μεγάλο βαθμό στη μέθοδο για την επίτευξη αυτών των αποτελεσμάτων: Το Sora είναι ένα μοντέλο διάχυσης που μετατρέπει τα οπτικά δεδομένα σε “μπαλώματα” ή κομμάτια δεδομένων που το μοντέλο μπορεί να κατανοήσει. Αλλά υπάρχει ελάχιστη αναφορά από πού προήλθαν τα οπτικά δεδομένα.

Το OpenAI λέει ότι «πάρτε[s] έμπνευση από μεγάλα γλωσσικά μοντέλα που αποκτούν γενικές ικανότητες με την εκπαίδευση σε δεδομένα κλίμακας Διαδικτύου». Το απίστευτα ασαφές μέρος της «λήψης έμπνευσης» είναι η μόνη υπεκφυγή αναφορά στην πηγή των δεδομένων εκπαίδευσης του Sora. Πιο κάτω στο έγγραφο, το OpenAI λέει, «η εκπαίδευση συστημάτων δημιουργίας κειμένου σε βίντεο απαιτεί μεγάλο αριθμό βίντεο με αντίστοιχους λεζάντες κειμένου». Η μόνη πηγή ενός τεράστιου όγκου οπτικών δεδομένων μπορεί να βρεθεί στο Διαδίκτυο, μια άλλη ένδειξη για το από πού προέρχεται ο Sora.

Το νομικό και ηθικό ζήτημα του τρόπου με τον οποίο αποκτώνται δεδομένα εκπαίδευσης για μοντέλα τεχνητής νοημοσύνης υπάρχει από τότε που το OpenAI κυκλοφόρησε το ChatGPT. Και τα δυο

OpenAI

και

Google

έχουν κατηγορηθεί για «κλοπή» δεδομένων για την εκπαίδευση των γλωσσικών τους μοντέλων, με άλλα λόγια για χρήση δεδομένων από τα μέσα κοινωνικής δικτύωσης, διαδικτυακά φόρουμ όπως το Reddit και το Quora, τη Wikipedia, βάσεις δεδομένων ιδιωτικών βιβλίων και ειδησεογραφικούς ιστότοπους.

Μέχρι τώρα, η λογική για την απόξεση ολόκληρου του Διαδικτύου για δεδομένα εκπαίδευσης είναι ότι είναι δημόσια διαθέσιμα. Αλλά δημόσια-διαθέσιμο

δεν μεταφράζεται πάντα

σε δημόσιο τομέα. Στην περίπτωση αυτή, το

Νιου Γιορκ Ταιμς

είναι

μήνυση

OpenAI και

Microsoft

για παραβίαση πνευματικών δικαιωμάτων, υποστηρίζοντας ότι τα μοντέλα του OpenAI χρησιμοποιούσαν το

Φορές

‘ δουλεύει λέξη προς λέξη ή ανέφερε λανθασμένα τις ιστορίες.

Τώρα

φαίνεται ότι το OpenAI κάνει το ίδιο πράγμα, αλλά με βίντεο. Εάν συμβαίνει αυτό, μπορείτε να περιμένετε από τους βαρείς επιτυχόντες στη βιομηχανία του θεάματος να έχουν κάτι να πουν γι ‘αυτό.

Αλλά το πρόβλημα παραμένει: Δεν γνωρίζουμε ακόμα την πηγή των δεδομένων εκπαίδευσης του Sora. «Η εταιρεία (παρά το όνομά της) είναι χαρακτηριστικά από κοντά για το τι έχουν εκπαιδεύσει τα μοντέλα».

έγραψε

Ο Γκάρι Μάρκους, ένας εμπειρογνώμονας τεχνητής νοημοσύνης που κατέθεσε στην ακρόαση της Επιτροπής Εποπτείας της Τεχνητής Νοημοσύνης της Γερουσίας των ΗΠΑ. «Πολλοί άνθρωποι έχουν [speculated] ότι πιθανώς υπάρχουν πολλά πράγματα εκεί μέσα που δημιουργούνται από μηχανές παιχνιδιών όπως το Unreal. Δεν θα με εξέπληξε καθόλου αν είχε πραγματοποιηθεί επίσης πολλή εκπαίδευση στο

YouTube

και διάφορα υλικά που προστατεύονται από πνευματικά δικαιώματα», είπε ο Marcus, προτού προσθέσει: «Οι καλλιτέχνες προφανώς μπερδεύονται πολύ εδώ».

Παρά την άρνηση του OpenAI να αποκαλύψει τα μυστικά του, καλλιτέχνες και δημιουργικοί υποθέτουν τα χειρότερα. Η Justine Bateman, σκηνοθέτης και σύμβουλος τεχνητής νοημοσύνης στο SAG-AFTRA, δεν μάσησε τα λόγια. «Κάθε νανοδευτερόλεπτο από αυτό

#ΟΛΑ ΣΥΜΠΕΡΙΛΑΜΒΑΝΟΝΤΑΙ

τα σκουπίδια εκπαιδεύονται σε κλεμμένα έργα από πραγματικούς καλλιτέχνες».

αναρτήθηκε

Bateman στο X. “Repulsive”, πρόσθεσε.

Το tweet μπορεί να έχει διαγραφεί

Άλλοι σε δημιουργικές βιομηχανίες ανησυχούν για το πώς η άνοδος των μοντέλων Sora και δημιουργίας βίντεο θα επηρεάσει τις δουλειές τους. «Δουλεύω στην ταινία vfx, σχεδόν όλοι όσοι γνωρίζω είναι καταστροφικοί και πανικοβλημένοι για το τι να κάνω τώρα».

αναρτήθηκε

@jimmylanceworth.

Το OpenAI δεν αγνόησε εντελώς τον εκρηκτικό αντίκτυπο που μπορεί να έχει ο Sora. Αλλά αυτό επικεντρώνεται σε μεγάλο βαθμό σε πιθανές βλάβες που περιλαμβάνουν ψεύτικα και παραπληροφόρηση. Αυτήν τη στιγμή βρίσκεται σε φάση red-teaming, πράγμα που σημαίνει ότι υποβάλλεται σε στρες για ακατάλληλο και επιβλαβές περιεχόμενο. Προς το τέλος της ανακοίνωσής του, το OpenAI είπε ότι θα «προσελκύσει τους υπεύθυνους χάραξης πολιτικής, τους εκπαιδευτικούς και τους καλλιτέχνες σε όλο τον κόσμο για να κατανοήσουν τις ανησυχίες τους και να εντοπίσουν θετικές περιπτώσεις χρήσης αυτής της νέας τεχνολογίας».

Αλλά αυτό δεν αντιμετωπίζει τις βλάβες που μπορεί να έχουν ήδη προκύψει φτιάχνοντας τον Sora εξαρχής.

Θέματα

Τεχνητή Νοημοσύνη OpenAI

VIA:

mashable.com