Τι είναι το DALL-E Mini και πώς να το χρησιμοποιήσετε;
Το
DALL-E
Mini μπήκε στον αγώνα δημιουργίας εικόνων AI ως απροσδόκητος υποψήφιος, με τις δικές του ξεχωριστές δυνατότητες και περιορισμούς. Σε μια συγκριτική ανάλυση, το DALL-E Mini, ιδιαίτερα η έκδοση που αναπτύχθηκε από την Craiyon, παρουσιάζει αξιοσημείωτες δυνατότητες, ειδικά σε σχέση με την ποιότητα της εικόνας και την απλότητα των προτροπών.
Ειδικά τον τελευταίο χρόνο, η
τεχνητή νοημοσύνη
και τα οφέλη αυτής της τεχνολογίας αλλάζουν τη ζωή μας. Υπάρχουν πλέον bot που κάνουν τις επαναλαμβανόμενες εργασίες που απαιτούσαν χρόνο και προσπάθεια αντί για εμάς, και πολλοί τομείς έχουν αρχίσει να επωφελούνται από αυτό.
Αυτή η τεχνολογία, της οποίας η ευρεία χρήση έχει αυξηθεί με την τάση τεχνητής νοημοσύνης που ξεκίνησε από το OpenAI, μας εισήγαγε σε παραγωγικά μοντέλα που εξυπηρετούν πολλούς σκοπούς, όπως κείμενο σε εικόνα και κείμενο σε ήχο. Αν και η τεχνολογία δημιουργίας εικόνων του Midjourney έχει επικριθεί από καλλιτέχνες, τα εργαλεία δημιουργίας εικόνων σάς επιτρέπουν να δημιουργήσετε οποιαδήποτε εικόνα μπορείτε να φανταστείτε, ακόμα κι αν δεν έχετε ταλέντο ή εκπαίδευση.
Τι είναι το DALL-E mini;
Το DALL-E mini είναι ένα μοντέλο τεχνητής νοημοσύνης κειμένου σε εικόνα που δημιουργήθηκε από
Μπόρις Ντέιμα
. Εκπαιδεύεται σε ένα τεράστιο σύνολο δεδομένων κειμένου και εικόνων και μπορεί να δημιουργήσει φωτορεαλιστικές εικόνες από περιγραφές κειμένου. Το μοντέλο είναι ακόμα υπό ανάπτυξη, αλλά έχει ήδη δημιουργήσει μερικά εντυπωσιακά
αποτελέσματα
.
Το DALL·E mini είναι ένα ισχυρό εργαλείο που μπορεί να χρησιμοποιηθεί για διάφορους σκοπούς, όπως:
- Δημιουργία εικονογραφήσεων για βιβλία, άρθρα και ιστότοπους
-
Δημιουργία concept art για
βιντεοπαιχνίδια
και ταινίες - Σχεδιασμός πρωτοτύπων προϊόντων
- Οπτικοποίηση αφηρημένων ιδεών
Το μοντέλο είναι ακόμα υπό ανάπτυξη, αλλά έχει ήδη δημιουργήσει μερικά εντυπωσιακά αποτελέσματα. Για παράδειγμα, μπορεί να δημιουργήσει εικόνες που είναι φωτορεαλιστικές και δημιουργικές. Μπορεί επίσης να δημιουργήσει εικόνες που βασίζονται σε σύνθετες περιγραφές κειμένου, όπως “Μια γάτα που φορά ένα καπέλο και οδηγεί ένα ποδήλατο”.
Δείτε πώς εξηγεί ο Boris Dayma στο DALL-E mini
Βάρη & Προκαταλήψεις
Κανάλι στο
YouTube
παρακάτω.
Πώς συγκρίνεται το DALL-E mini με το DALL-E 2;
Η σύγκριση μεταξύ του DALL-E Mini που φιλοξενείται μόνος του και του αντίστοιχου DALL-E 2, αποκαλύπτει ξεχωριστά πλεονεκτήματα και εκτιμήσεις. Μια σημαντική πτυχή είναι η ικανότητα βελτιστοποίησης των μοντέλων ώστε να ταιριάζουν σε συγκεκριμένες ανάγκες. Η ικανότητα προσαρμοσμένων δεδομένων και λεπτομέρειας στο DALL-E Mini, ειδικά σε διαφορετικές γλώσσες ή εξειδικευμένους τομείς, προσφέρει ένα κρίσιμο πλεονέκτημα. Αυτή η ικανότητα «κατεύθυνσης» μοντέλων για τη δημιουργία συγκεκριμένων αποτελεσμάτων, όπως το «ρομπότ δικηγόρου» ή οι λεπτές εικόνες, ξεχωρίζει ως ένα ισχυρό εργαλείο.
Ωστόσο, αυτή η καινοτομία συνοδεύεται από το δικό της σύνολο εκτιμήσεων, ιδίως τις απαιτήσεις υποδομής. Ενώ το DALL-E 2 λειτουργεί μέσω ενός απλού αιτήματος δικτύου, το DALL-E Mini απαιτεί υψηλότερη υπολογιστική υποδομή, που απαιτεί μια ισχυρή GPU ή έναν ισχυρό διακομιστή πολλαπλών CPU για αποτελεσματική απόδοση.
Στον πυρήνα της λειτουργικότητας του DALL-E Mini βρίσκεται ένα δίκτυο αποκωδικοποιητή αλληλουχίας σε ακολουθία που βασίζεται στο μοντέλο μετασχηματιστή αμφίδρομης και αυτόματης παλινδρόμησης (BART). Αυτός ο περίπλοκος αγωγός περιλαμβάνει τέσσερα στοιχεία:
- Κωδικοποιητής εικόνας σε διακριτικό
- Κωδικοποιητής κειμένου
- Αποκωδικοποιητής BART Seq2seq
- Αποκωδικοποιητής διακριτικών σε εικόνα
Κατά τη διάρκεια της προπόνησης, το DALL-E Mini χρησιμοποιεί περίπου 15 εκατομμύρια ζεύγη λεζάντας-εικόνας για να εκπαιδεύσει τον κρίσιμο αποκωδικοποιητή BART seq2seq. Αυτό περιλαμβάνει τη δημιουργία διακριτικών εικόνων από εικόνες μέσω ενός κωδικοποιητή VQGAN και τη μετατροπή των περιγραφών κειμένου σε διακριτικά ενσωμάτωσης κειμένου μέσω ενός κωδικοποιητή BART. Στη συνέχεια, ο αποκωδικοποιητής seq2seq δημιουργεί μια ακολουθία διακριτικών εικόνων με βάση αυτές τις ενσωματώσεις.
Συμπερασματικά, με μόνο μια προτροπή κειμένου στο χέρι, ο κωδικοποιητής κειμένου BART δημιουργεί ενσωματώσεις για την προτροπή, ξεκινώντας τη διαδικασία πρόβλεψης ακολουθίας για τη δημιουργία εικόνων.
Εντυπωσιακή απόδοση
Οι επιδόσεις του DALL-E Mini είναι ιδιαίτερα συναρπαστικές όταν δοκιμάζονται ενάντια σε ποικίλες άμεσες πολυπλοκότητες. Από σχετικά απλές προτροπές, όπως η οπτικοποίηση ενός “κοριτσιού που παίζει γκολφ” όπου αντιμετωπίζει προκλήσεις στην τοποθέτηση του χεριού σε σχέση με το μπαστούνι του γκολφ, έως πιο εξειδικευμένες προτροπές στην υγειονομική περίθαλψη, όπως “ακτινογραφία θώρακα μιας υγιούς σπονδυλικής στήλης” που αποδίδει εντυπωσιακά και Ανατομικά «σχεδόν» ακριβή αποτελέσματα, το μοντέλο παρουσιάζει τα δυνατά και τα όριά του.
Το εργαλείο δημιουργίας εικόνας μπόρεσε να δημιουργήσει μια ανατομικά σωστή σπονδυλική στήλη με μικρά λάθη
(
Πίστωση εικόνας
)
Πώς να χρησιμοποιήσετε το DALL-E mini δωρεάν;
Υπάρχουν δύο κύριοι τρόποι για να χρησιμοποιήσετε το DALL-E mini δωρεάν:
-
Χρησιμοποιήστε τον ιστότοπο Craiyon
: Ο ευκολότερος τρόπος για να χρησιμοποιήσετε το DALL-E mini είναι να χρησιμοποιήσετε τον ιστότοπο Craiyon. Δεν χρειάζεται να δημιουργήσετε λογαριασμό για να χρησιμοποιήσετε τον ιστότοπο, αλλά θα πρέπει να συμπληρώνετε ένα CAPTCHA κάθε φορά που δημιουργείτε μια εικόνα -
Χρησιμοποιήστε το DALL-E mini API
: Εάν είστε προγραμματιστής, μπορείτε να χρησιμοποιήσετε το DALL-E mini API για να ενσωματώσετε το μοντέλο στις δικές σας εφαρμογές. Το API είναι προς το παρόν σε έκδοση beta, αλλά είναι δωρεάν για χρήση
Ακολουθούν τα βήματα για το πώς να χρησιμοποιήσετε τον ιστότοπο Craiyon για να δημιουργήσετε μια εικόνα με το DALL-E mini:
-
μεταβείτε στο
Ιστοσελίδα Craiyon
ή
HugginFace hub του DALL-E mini
- Εισαγάγετε μια περιγραφή κειμένου της εικόνας που θέλετε να δημιουργήσετε
- Κάντε κλικ στο κουμπί «Δημιουργία».
- Το μοντέλο θα δημιουργήσει τέσσερις εικόνες με βάση την περιγραφή του κειμένου σας
- Μπορείτε να αποθηκεύσετε τις εικόνες στον υπολογιστή σας ή να τις μοιραστείτε με άλλους
Αν λοιπόν χρειάζεστε ένα δωρεάν εργαλείο δημιουργίας εικόνας, το DALL-E mini φαίνεται να είναι εδώ για να καλύψει τις ανάγκες σας. Καθώς μπαίνουμε στους τελευταίους μήνες του 2023, είναι συναρπαστικό για όλους μας να παρατηρούμε πώς αναπτύσσονται οι τεχνολογίες τεχνητής νοημοσύνης. Ας δούμε τι θα μας δείξει περισσότερο ο χρόνος στην τεχνητή νοημοσύνη.
Πίστωση επιλεγμένης εικόνας
:
Joanna Kosinska
/
Ξεβιδώστε
.
VIA:
DataConomy.com
