Το OpenAI μόλις αποκάλυψε το Dall-E 3 και λαμβάνει μερικές τεράστιες αναβαθμίσεις
Η
OpenAI
, η εταιρεία πίσω από το εξαιρετικά επιτυχημένο μοντέλο μεγάλων γλωσσών (LLM) που τροφοδοτεί το ChatGPT, ετοιμάζεται να αναβαθμίσει το παιχνίδι της για άλλη μια φορά με μια νέα έκδοση του Dall-E, του μοντέλου παραγωγής εικόνας. Το Dall-E 2 δεν είναι πλέον η πιο προηγμένη επιλογή της εταιρείας. Γνωρίστε το Dall-E 3.
Σύμφωνα με το OpenAI, το Dall-E 3 παίρνει όλα όσα έμαθε η εταιρεία από το Dall-E 2 και ωθεί τις δυνατότητες δημιουργίας εικόνας στο επόμενο επίπεδο.
“Το Dall-E 3 προσφέρει σημαντικές βελτιώσεις σε σχέση με το DALL·E 2 κατά τη δημιουργία κειμένου μέσα σε μια εικόνα και σε ανθρώπινες λεπτομέρειες όπως τα χέρια.”
Εξήγησε το OpenAI
στο blog της.
Συγκεκριμένα, η νέα έκδοση θα επιτρέψει στους χρήστες να δημιουργήσουν ευανάγνωστο κείμενο που ψήνεται απευθείας στις ίδιες τις εικόνες, κάτι που θα το βοηθήσει να το βάλει σε πιο ανταγωνιστικό έδαφος με υπηρεσίες όπως το Ideogram, μια
startup
που ξεκίνησε από το πρώην προσωπικό της Google τον περασμένο μήνα. Συνολικά, το Dall-E 3 θα επιτρέψει στη δημιουργία εικόνων να συμπεριλάβει κείμενο και τυπογραφία στις εικόνες.
Η αποκάλυψη αυτής της επερχόμενης έκδοσης είναι συναρπαστική, ειδικά αν οι βελτιώσεις από το
GPT-3
.5 στο GPT-4 είναι κάποια ένδειξη για το πόσο μακριά έχει φτάσει το OpenAI. Το OpenAI συνεχίζει να εκπαιδεύει τα συστήματα τεχνητής νοημοσύνης του και να τα βελτιώνει, καθιστώντας τα πιο ανταποκρινόμενα στις πληροφορίες των χρηστών. Φυσικά, η τεχνητή νοημοσύνη απέχει πολύ από το τέλειο και δεν υπάρχει καμία εγγύηση πόσο καλά θα αντιδράσει το Dall-E 3 στα μηνύματα.
Μια άλλη μεγάλη
ενημέρωση
στο Dall-E 3 θα επιτρέψει στους χρήστες να βλέπουν πιο αξιόπιστες αποκρίσεις από τη δημιουργία εικόνων, επιτρέποντάς τους να υπαγορεύουν περαιτέρω πού βρίσκονται τα αντικείμενα και οι φιγούρες στην εικόνα σε σχέση μεταξύ τους, κάτι με το οποίο παλεύουν άλλα συστήματα όπως το Midjourney.
Η εταιρεία παρείχε ένα παράδειγμα στιγμιότυπου οθόνης, το οποίο φαίνεται να δείχνει την αποτελεσματικότητα της παροχής τέτοιων οδηγιών στα μηνύματα προτροπής σας. Ωστόσο, όπως θα σας πει όποιος έχει δουλέψει με προτροπές AI στο παρελθόν, όλα καταλήγουν στο να υπολογίσετε πόσες προσπάθειες χρειάστηκαν για να δημιουργηθεί αυτό το τέλειο δείγμα εικόνας.
Το Dall-E 3 θα είναι σύντομα διαθέσιμο στους συνδρομητές τόσο του
ChatGPT Plus
όσο και του ChatGPT Enterprise.
