Emu Edit And Emu Video: Τα νέα εργαλεία της Meta εξηγούνται
Η
Meta
εισήγαγε δύο πρωτοποριακές εξελίξεις στον τομέα της γενετικής τεχνητής νοημοσύνης: Emu Video και Emu Edit. Αυτές οι εξελίξεις σηματοδοτούν σημαντική πρόοδο στον τομέα της γενετικής τεχνητής νοημοσύνης, παρέχοντας στα άτομα μετασχηματιστικές ικανότητες να εκφράσουν τη δημιουργικότητά τους με καινοτόμους τρόπους.
Αν και η χρήση εικόνων και βίντεο που δημιουργούνται από AI έχει αποτελέσει αντικείμενο πολλών επικρίσεων, η σωστή χρήση τους αποφέρει πολλά πιθανά οφέλη. Οι χρήστες μπορούν πλέον να σχεδιάζουν σχεδόν οτιδήποτε μπορούν να φανταστούν μέσα σε δευτερόλεπτα, συμπεριλαμβανομένων των κόμικς που δημιουργούνται από AI, ακόμη και χωρίς καμία μορφή εκπαίδευσης. Το μόνο που χρειάζεται να κάνει κάποιος για να δημιουργήσει μια εκπληκτική εικόνα στις μέρες μας είναι να σκεφτεί και να γράψει μια προτροπή.
Σχεδόν όλοι γνωρίζουμε πόσο επικεντρώθηκε η Meta στις τεχνολογίες AI τα τελευταία χρόνια και πριν από λίγες μέρες ανακοίνωσαν δύο ισχυρά εργαλεία δημιουργίας βίντεο και επεξ
εργασία
ς εικόνας σε ένα
ανάρτηση
.
Το Meta ήταν πολύ φιλόδοξο για τις τεχνολογίες τεχνητής νοημοσύνης τον περασμένο χρόνο
(
Πίστωση εικόνας
)
Τι είναι το Emu Video;
Το Emu Video είναι μια επαναστατική πλατφόρμα δημιουργίας κειμένου σε βίντεο που χρησιμοποιεί μοντέλα διάχυσης για τον εξορθολογισμό της διαδικασίας. Η διαδικασία δημιουργίας βίντεο χωρίζεται σε δύο διακριτά στάδια:
- Δημιουργία εικόνων με βάση τα μηνύματα κειμένου
- Στη συνέχεια, δημιουργώντας βίντεο που εξαρτώνται από κείμενο και εικόνες
Αυτή η προσέγγιση επιτρέπει στο Emu Video να επιτύχει μια πιο αποτελεσματική και αποτελεσματική ροή εργασίας σε σύγκριση με προηγούμενες μεθοδολογίες που απαιτούσαν πολλά μοντέλα. Το Emu Video χρησιμοποιεί μόνο δύο μοντέλα διάχυσης για την παραγωγή βίντεο υψηλής ανάλυσης (512×512), τεσσάρων δευτερολέπτων με ρυθμό 16 καρέ ανά δευτερόλεπτο.
Συγκεκριμένα, οι ανθρώπινες αξιολογήσεις έχουν υπογραμμίσει την εξαιρετική απόδοση της γενιάς βίντεο του Emu Video, ξεπερνώντας τα προηγούμενα σημεία αναφοράς με σημαντικό περιθώριο. Στην πραγματικότητα, το 96% των ερωτηθέντων προτίμησε το μοντέλο του Emu Video έναντι του Make-A-Video ως προς την ποιότητα, με 85% προτίμηση όσον αφορά την πιστότητα στο μήνυμα κειμένου.
Η ευελιξία του Emu Video αποδεικνύεται περαιτέρω από την ικανότητά του να “ζωντανεύει” εικόνες που παρέχονται από τον χρήστη με βάση τα μηνύματα κειμένου.
Τα βασικά χαρακτηριστικά περιλαμβάνουν:
- Ενοποιημένη αρχιτεκτονική για εργασίες δημιουργίας βίντεο,
-
Υποστήριξη για:
- Κείμενο μόνο
- Μόνο εικόνα
- Συνδυασμένες είσοδοι
- Μια παραγοντοποιημένη προσέγγιση για αποτελεσματική εκπαίδευση
- Επίδοση αιχμής σε ανθρώπινες αξιολογήσεις
Το Emu Video αντιπροσωπεύει μια αλλαγή παραδείγματος στη δημιουργία κειμένου σε βίντεο, αξιοποιώντας μοντέλα διάχυσης για τον εξορθολογισμό της διαδικασίας. Η προσέγγιση δύο σταδίων της πλατφόρμας στη δημιουργία βίντεο είναι μια σημαντική απόκλιση από τις προηγούμενες μεθοδολογίες που απαιτούσαν πολλαπλά μοντέλα.
Στο πρώτο στάδιο, το Emu Video δημιουργεί εικόνες με βάση τις προτροπές κειμένου, ενώ στο δεύτερο στάδιο, δημιουργεί βίντεο που εξαρτώνται από κείμενο και εικόνες. Αυτή η προσέγγιση επιτρέπει στο Emu Video να επιτύχει μια πιο αποτελεσματική και αποτελεσματική ροή εργασιών, με αποτέλεσμα βίντεο υψηλής ποιότητας που ξεπερνούν κατά πολύ τα προηγούμενα σημεία αναφοράς.
Το Emu Video χρησιμοποιεί μόνο δύο μοντέλα διάχυσης για την παραγωγή βίντεο υψηλής ανάλυσης (512×512), τεσσάρων δευτερολέπτων με ρυθμό 16 καρέ ανά δευτερόλεπτο. Αυτή η βελτιστοποιημένη προσέγγιση για τη δημιουργία βίντεο έτυχε θετικής υποδοχής από τους χρήστες, με το 96% των ερωτηθέντων να προτιμούν το μοντέλο του Emu Video έναντι του Make-A-Video όσον αφορά την ποιότητα. Επιπλέον, το 85% των ερωτηθέντων προτίμησε το μοντέλο του Emu Video όσον αφορά την πιστότητα στο μήνυμα κειμένου.
Η ευελιξία του Emu Video αποδεικνύεται περαιτέρω από την ικανότητά του να “ζωντανεύει” εικόνες που παρέχονται από τον χρήστη με βάση τα μηνύματα κειμένου. Αυτή η δυνατότητα επιτρέπει στους χρήστες να δημιουργούν βίντεο που είναι προσαρμοσμένα στις συγκεκριμένες ανάγκες και προτιμήσεις τους. Το Emu Video μπορεί επίσης να υπερηφανεύεται για μια ενοποιημένη αρχιτεκτονική για εργασίες δημιουργίας βίντεο, υποστήριξη για εισόδους μόνο κειμένου, μόνο εικόνας και συνδυασμένων εισόδων, μια παραγοντική προσέγγιση για αποτελεσματική εκπαίδευση και κορυφαία απόδοση στις αξιολογήσεις ανθρώπων.
Μπορείτε να μάθετε περισσότερα για
Emu Video χρησιμοποιώντας τον σύνδεσμο εδώ
.
Η Meta κυκλοφόρησε επίσης έναν ιστότοπο επίδειξης
για χρήστες που θέλουν να ελέγξουν τις δυνατότητες δημιουργίας βίντεο της Emu.
Στην επίδειξη, υπάρχουν πολλές επιλογές βίντεο που δημιουργούνται, όπου μπορείτε να επιλέξετε το θέμα, τη δραστηριότητα, την τοποθεσία και το στυλ δημιουργίας, ενώ υπάρχει επίσης μια καρτέλα αναζήτησης για βίντεο που δημιουργούνται στο κάτω μέρος του ιστότοπου. Ακόμα κι αν δεν μπορείτε να δημιουργήσετε το δικό σας βίντεο, μπορείτε να χρησιμοποιήσετε αυτόν τον σύνδεσμο για να δείτε τα βίντεο που δημιούργησε η Meta κατά τη διάρκεια της έρευνας.

Η Meta μοιράστηκε έναν ιστότοπο επίδειξης, ώστε οι χρήστες να μπορούν να δουν τις δυνατότητες παραγωγής του νέου μοντέλου τεχνητής νοημοσύνης
(
Πίστωση εικόνας
)
Τι είναι το Emu Edit;
Το Emu Edit είναι μια ισχυρή πλατφόρμα επεξεργασίας εικόνας που προσφέρει ακριβή έλεγχο στις εργασίες επεξεργασίας εικόνας μέσω τεχνικών αναγνώρισης και δημιουργίας. Σε αντίθεση με τις παραδοσιακές μεθόδους χειρισμού εικόνας που συχνά οδηγούν σε υπερβολική τροποποίηση ή χαμηλή απόδοση, το Emu Edit ακολουθεί με ακρίβεια τις οδηγίες, διασφαλίζοντας ότι μόνο τα σχετικά pixel αλλοιώνονται. Αυτό σημαίνει ότι όταν προσθέτετε κείμενο σε ένα καπέλο του μπέιζμπολ, το ίδιο το καπάκι παραμένει αμετάβλητο. Η βασική γνώση της Meta είναι η ενσωμάτωση εργασιών όρασης υπολογιστή ως οδηγίες για μοντέλα παραγωγής εικόνων, προσφέροντας άνευ προηγουμένου έλεγχο στη δημιουργία και την επεξεργασία εικόνων.
Το Emu έχει εκπαιδευτεί σε ένα μεγάλο σύνολο δεδομένων από συνθετικά δείγματα (10 εκατομμύρια) για να εκπαιδεύσει το μοντέλο της Meta, με αποτέλεσμα ανώτερα αποτελέσματα επεξεργασίας όσον αφορά την ακρίβεια των οδηγιών και την ποιότητα της εικόνας. Στις αξιολογήσεις της Meta, η Emu επέδειξε κορυφαίες επιδόσεις για μια σειρά εργασιών επεξεργασίας εικόνας, ξεπερνώντας τις τρέχουσες μεθόδους.
Τα βασικά χαρακτηριστικά του Emu Edit περιλαμβάνουν:
- Ελεύθερη επεξεργασία μέσω οδηγιών
- Ακριβής αλλαγή pixel
- Πρωτοφανής έλεγχος εργασιών όρασης υπολογιστή
Τα εξαιρετικά αποτελέσματα επεξεργασίας και οι κορυφαίες επιδόσεις της πλατφόρμας την καθιστούν εξαιρετική επιλογή για χρήστες που θέλουν να δημιουργήσουν εικόνες υψηλής ποιότητας.
Οι χρήστες μπορούν να διαβάσουν το
Emu Επεξεργασία χαρτιού
για να μάθετε περισσότερα για το μοντέλο τελευταίας γενιάς της Meta. Το έγγραφο παρέχει μια λεπτομερή επισκόπηση της αρχιτεκτονικής, της μεθοδολογίας εκπαίδευσης και των μετρήσεων απόδοσης του Emu Edit. Περιλαμβάνει επίσης παραδείγματα των δυνατοτήτων του Emu Edit, αποδεικνύοντας την ευελιξία και τη δύναμη της πλατφόρμας.

Οι χρήστες θα μπορούν να δημιουργούν παραλλαγές φωτογραφιών εισάγοντας ένα απλό μήνυμα με το Emu Edit
(
Πίστωση εικόνας
)
Η φιλοδοξία AI του Meta
Η Meta (πρώην Facebook) έχει επενδύσει πολλά στην έρευνα και ανάπτυξη της τεχνητής νοημοσύνης (AI) τα τελευταία χρόνια, δημιουργώντας ένα ευρύ φάσμα προϊόντων και πρωτοβουλιών που εστιάζουν στην τεχνητή νοημοσύνη. Αυτά τα
προϊόντα
χρησιμοποιούνται για τη βελτίωση των βασικών προϊόντων της εταιρείας, όπως το Facebook, το Instagram και το WhatsApp, καθώς και για την ανάπτυξη νέων προϊόντων και υπηρεσιών.
Το εργαλείο μετάφρασης SeamlessM4T της Meta με τεχνητή νοημοσύνη γεφυρώνει απρόσκοπτα τα γλωσσικά εμ
πόδια
, επιτρέποντας τη μετάφραση σε περισσότερες από 100 γλώσσες με αξιοσημείωτη ακρίβεια.
Οι δυνατότητες αναγνώρισης εικόνας και βίντεο με τεχνητή νοημοσύνη δίνουν επίσης τη δυνατότητα στο Meta να αναγνωρίζει αντικείμενα, ανθρώπους και σκηνές εντός οπτικού περιεχομένου. Αυτή η τεχνολογία παίζει καθοριστικό ρόλο στη βελτίωση της συνάφειας των διαφημίσεων, στη διευκόλυνση της ανακάλυψης περιεχομένου και στην καταπολέμηση της διάδοσης ακατάλληλου υλικού.
Τα
chatbot
AI της Meta χρησιμεύουν ως ψηφιακοί βοηθοί, παρέχοντας υποστήριξη πελατών, απαντώντας σε ερωτήσεις και εκτελώντας εργασίες με αποτελεσματικότητα και ακρίβεια. Αυτά τα chatbots είναι εύκολα προσβάσιμα στο Facebook Messenger, στο WhatsApp και σε άλλες πλατφόρμες Meta.
Οι φιλοδοξίες AI της Meta επεκτείνονται επίσης στην ανάπτυξη προηγμένων γλωσσικών μοντέλων, όπως το Llama 2. Αξιοποιώντας τη δύναμη της τεχνητής νοημοσύνης, το Llama 2 έχει επιδείξει αξιοσημείωτες ικανότητες στην κατανόηση φυσικής γλώσσας, την απάντηση ερωτήσεων και τη δημιουργία κειμένου.
Δεν ξέρουμε ακόμη τι επιφυλάσσει το μέλλον, αλλά ένα πράγμα είναι σίγουρο: η ανάπτυξη της τεχνολογίας είναι με επιταχυνόμενους ρυθμούς και σύντομα θα είναι πολύ πιο εύκολο να δημιουργήσετε ένα παιχνίδι AAA ή μια ταινία που θα συναγωνιστεί ένα αριστούργημα του Χόλιγουντ.
Πίστωση εικόνας χαρακτηριστικών
:
Ιγκόρ Σούρκοφ
/
Ξεβιδώστε
.
VIA:
DataConomy.com