Η γρήγορη γεννήτρια εικόνας AI: Δημιουργώντας εικόνες σταχτοπούτας



Τι πρέπει να ξέρετε

  • Κορεάτες επιστήμονες ανέπτυξαν πρόσφατα ένα νέο μοντέλο δημιουργίας εικόνων AI που ονομάζεται KOALA.
  • Σε αντίθεση με άλλα μοντέλα όπως το Image Creator της Microsoft από το Designer, το εργαλείο επιδεικνύει μεγαλύτερες ταχύτητες δημιουργίας εικόνων.
  • Αξιοποιεί μια νέα τεχνική που ονομάζεται απόσταξη γνώσης, η οποία συμπιέζει το μέγεθος ενός εργαλείου δημιουργίας εικόνας ανοιχτού κώδικα που ονομάζεται Stable Diffusion XL.
  • Με αυτόν τον τρόπο, μπορεί να δημιουργήσει εικόνες πιο γρήγορα, ακόμη και σε παλιούς υπολογιστές με ξεπερασμένες GPU.

Μια νέα γεννήτρια εικόνων που τροφοδοτείται από AI είναι στον ορίζοντα και θα μπορούσε ενδεχομένως να αντιμετωπίσει το Image Creator της Microsoft από το Designer (πρώην Bing Image Creator), το Midjourney και το μοντέλο DALL-E 3 του OpenAI.

Το νέο εργαλείο μπορεί να δημιουργήσει εικόνες σε λιγότερο από δύο δευτερόλεπτα, πολύ πιο γρήγορα από το μέσο εργαλείο δημιουργίας εικόνων. Σύμφωνα με σποτ του

Ζωντανή Επιστήμη

οι Νοτιοκορεάτες επιστήμονες πίσω από αυτή τη νέα εφεύρεση χρησιμοποίησαν μια νέα τεχνική που ονομάζεται απόσταξη γνώσης, η οποία συμπιέζει το μέγεθος ενός εργαλείου δημιουργίας εικόνας ανοιχτού κώδικα που ονομάζεται Stable Diffusion XL.


(Πίστωση εικόνας: Windows Central / Bing Image Creator)

Για το περιβάλλον, το Stable Diffusion XL διαθέτει έως και 2,56 δισεκατομμύρια παραμέτρους. Όπως ίσως γνωρίζετε ήδη, η τεχνητή νοημοσύνη βασίζεται σε μεγάλο βαθμό στο υπάρχον περιεχόμενο, συμπεριλαμβανομένων των εικόνων, για εκπαίδευση. Αυτό το μεγάλο σύνολο παραμέτρων εξηγεί γιατί η δημιουργία εικόνων μπορεί να πάρει λίγο χρόνο. Ωστόσο, με αυτή τη νέα τεχνική, οι επιστήμονες μείωσαν τις παραμέτρους για το μικρότερο μοντέλο του, το KOALA, στα 700 εκατομμύρια.

Ως εκ τούτου, το εργαλείο μπορεί να δημιουργήσει εικόνες σε κλάσματα δευτερολέπτου. Το μοντέλο δημιουργίας εικόνας δεν απαιτεί GPU υψηλής τεχνολογίας και εξελιγμένες συσκευές για να λειτουργεί ομαλά. Απαιτούνται μόνο περίπου 8 GB μνήμης RAM για τη δημιουργία εικόνων. Ουσιαστικά, η τεχνική της απόσταξης γνώσης κοσκινίζει πληροφορίες από το μεγάλο μοντέλο στο μικρότερο χωρίς να επηρεάζει την ποιότητα ή την απόδοση. Με αυτόν τον τρόπο, το μικρότερο μοντέλο είναι σε θέση να παράγει ποιοτικές εικόνες πιο γρήγορα.


ΣΧΕΤΙΖΕΤΑΙ ΜΕ:


Η ταχύτητα δημιουργίας εικόνων του Image Creator της Microsoft είναι εξαιρετικά επώδυνη

Σύμφωνα με

σημεία αναφοράς που μοιράζονται οι επιστήμονες

, το KOALA είναι σημαντικά ταχύτερο από τα μοντέλα DALL-E 3 ή DALL-E 2 του OpenAI. Όταν ζητήθηκε να δημιουργήσει «μια εικόνα ενός αστροναύτη που διαβάζει ένα βιβλίο κάτω από το φεγγάρι στον Άρη», ο πρώτος χρειάστηκε 13,7 δευτερόλεπτα και ο δεύτερος 12,3 δευτερόλεπτα. Το KOALA χρειάστηκε μόνο 1,6 δευτερόλεπτα για να δημιουργήσει την εικόνα.

Υπάρχουν πέντε εκδόσεις του KOALA. Τρεις εκδόσεις του μοντέλου δημιουργούν εικόνες με βάση τις προτροπές κειμένου, ενώ οι υπόλοιπες δύο εκδόσεις (Ko-LLaVA) μπορούν να δημιουργήσουν και εικόνες και βίντεο (όπως το μοντέλο Sora του OpenAI).

Οι Κορεάτες επιστήμονες από το Ινστιτούτο Έρευνας Ηλεκτρονικών και Τηλεπικοινωνιών (ETRI) μοιράστηκαν την εργασία και τα ευρήματά τους στο αποθετήριο AI ανοιχτού κώδικα

Αγκαλιασμένο πρόσωπο

και το

βάση δεδομένων arXiv

.

Οι επιστήμονες σκοπεύουν να ενσωματώσουν αυτά τα μοντέλα σε υπάρχουσες υπηρεσίες παραγωγής εικόνας, παραγωγή περιεχομένου και πολλά άλλα.

window.reliableConsentGiven.then(function(){

!function(f,b,e,v,n,t,s){if(f.fbq)return;n=f.fbq=function()

{n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)}

;if(!f._fbq)f._fbq=n;

n.push=n;n.loaded=!0;n.version=’2.0′;n.queue=[];t=b.createElement(e);t.async=!0;

t.src=v;s=b.getElementsByTagName(e)[0];s.parentNode.insertBefore(t,s)}(window,

document,’script’,’https://connect.facebook.net/en_US/fbevents.js’);

fbq(‘init’, ‘1765793593738454’);

fbq(‘track’, ‘PageView’);

})


VIA:

WindowsCentral


Follow TechWar.gr on Google News