Το Stable Diffusion 3 Medium, η τελευταία προσφορά της Stability
AI
, έκανε πρόσφατα το ντεμπούτο του, πυροδοτώντας ενθουσιασμό και διαμάχη στην κοινότητα SD3.
Ως μοντέλο κειμένου σε εικόνα, το Stable Diffusion 3 Medium στοχεύει στη μετατροπή των κειμενικών προτροπών σε οπτικά συναρπαστικές εικόνες, ωστόσο η πρόσληψή του έχει αντιμετωπιστεί με ανάμεικτες αντιδράσεις, ιδίως όσον αφορά την απεικόνιση ανθρώπινων μορφών.
Αν και το Stability AI το περιγράφει ως το «πιο εξελιγμένο μοντέλο παραγωγής εικόνων μέχρι σήμερα» στο α
ανάρτηση
τα αποτελέσματα που είδαμε είναι… Ας μην το ζαχαρώσουμε:
Εφιαλτικά καύσιμα
!
Stable Diffusion 3 Medium’s lineage
Το Stable Diffusion 3 Medium έχει τις ρίζες του σε μια σειρά μοντέλων σύνθεσης εικόνας AI που αναπτύχθηκαν από τη Stability AI. Αυτή η επανάληψη βασίζεται στα θεμέλια που έθεσαν οι προκάτοχοί της, ενσωματώνοντας προόδους τόσο στην τεχνολογία όσο και στις μεθοδολογίες εκπαίδευσης. Το όνομα του μοντέλου, «Medium», υποδηλώνει τη θέση του στην ευρύτερη σειρά Stable Diffusion 3, υποδηλώνοντας
ισορροπία μεταξύ της υπολογιστικής αποτελεσματικότητας και των παραγωγικών δυνατοτήτων
.
Στον πυρήνα του, Stable Diffusion 3 Medium
χρησιμοποιεί μια εξελιγμένη αρχιτεκτονική νευρωνικών δικτύων
να ερμηνεύει και να μεταφράζει κειμενικές προτροπές σε οπτικές αναπαραστάσεις. Τα δεδομένα εκπαίδευσης του μοντέλου, τα οποία περιλαμβάνουν μια τεράστια συλλογή εικόνων και τις αντίστοιχες περιγραφές κειμένου τους, διαδραματίζουν καθοριστικό ρόλο στη διαμόρφωση της ικανότητάς του να δημιουργεί συνεκτικές και σχετικές με τα συμφραζόμενα εικόνες.
Πού αποτυγχάνει το SD3;
Το Stable Diffusion 3 Medium παρουσιάζει αξιοσημείωτες αντοχές σε διάφορους τομείς. Η ικανότητά του να κατανοεί και να ανταποκρίνεται σε πολύπλοκες προτροπές που περιλαμβάνουν χωρικές σχέσεις, στοιχεία σύνθεσης και διαφορετικά
στυλ
είναι αξιέπαινη. Η ικανότητα του μοντέλου στη δημιουργία εικόνων με περίπλοκες λεπτομέρειες και ζωηρά χρώματα είναι επίσης εμφανής.
Ωστόσο
έχει συγκεντρώσει κριτική για τις περιστασιακές του μάχες με την ακριβή απεικόνιση της ανθρώπινης ανατομίας, ιδιαίτερα των χεριών και των προσώπων, όπως μεταφέρεται από
HornyMetalBeing
του και πολλών άλλων αναρτήσεων στα μέσα κοινωνικής δικτύωσης. Αυτές οι ελλείψεις έχουν εγείρει ερωτήματα σχετικά με τα δεδομένα εκπαίδευσης του μοντέλου και τον πιθανό αντίκτυπο των μηχανισμών φιλτραρίσματος που χρησιμοποιούνται κατά την ανάπτυξή του.
Γιατί το SD3 είναι τόσο κακό στο να γεννά κορίτσια που βρίσκονται στο γρασίδι;
με
u/HornyMetalBeing
σε
StableDiffusion
Τα δεδομένα εκπαίδευσης που χρησιμοποιούνται για την εκπαίδευση του Stable Diffusion 3 Medium περιλαμβάνουν ένα ευρύ φάσμα οπτικού περιεχομένου, όπως:
-
Φωτογραφίες
-
Εργα ΤΕ
Χ
ΝΗΣ
-
εικονογραφήσεις
Ωστόσο, οι προγραμματιστές του μοντέλου έχουν εφαρμόσει διαδικασίες φιλτραρίσματος
εξαιρέσει ρητό ή ευαίσθητο υλικό από αυτό το σύνολο δεδομένων
. Ενώ αυτά τα φίλτρα στοχεύουν στη διασφάλιση της υπεύθυνης χρήσης του μοντέλου, οδήγησαν κατά λάθος σε
αφαίρεση εικόνων που απεικονίζουν ορισμένες στάσεις ή ανατομικές λεπτομέρειες
συμβάλλοντας στις δυσκολίες του μοντέλου να αποδώσει με ακρίβεια ανθρώπινες μορφές.
Ας δοκιμάσουμε το Stable Diffusion 3 Medium
Μπορείτε εύκολα να βάλετε το μοντέλο στους ρυθμούς του χρησιμοποιώντας διαδικτυακές πλατφόρμες που προσφέρουν προσβάσιμες διεπαφές για αλληλεπίδραση μαζί του.
Ξέρετε το διαδίκτυο, περιέχει τόσους πολλούς ανθρώπους και τόσες πολλές ιδέες.
Πόσο κακό θα μπορούσε να είναι ένα μοντέλο παραγωγής εικόνας που έχει προετοιμαστεί σύμφωνα με τα πρότυπα του 2024
?
Δοκιμάσαμε το
δωρεάν online demo του SD3 στο Hugging Face
για να πάρουμε την απάντησή μας.
Ακολουθούν οι προτροπές και τα αποτελέσματά μας:
Προτροπή
: «Μια γυναίκα που κρυώνει με τον σκύλο της μια ηλιόλουστη Δευτέρα σε ένα πάρκο».
Πίστωση εικόνας
)
Φαίνεται ότι δεν υπάρχει κανένα πρόβλημα με την ανατομία του σκύλου εκτός από το να λείπει το ένα μάτι, αλλά τα χέρια και τα πόδια της γυναίκας μοιάζουν πραγματικά σαν να είχε ένα τρομερό ατύχημα…
Προτροπή
: «Ένα αγόρι που υπολογίζει το 2+4 χρησιμοποιώντας τα χέρια του».

Πίστωση εικόνας
)
Φαίνεται ότι τα μαθηματικά όχι μόνο μπέρδεψαν το νεαρό αγόρι αλλά και του έκαναν πολύ μακριά τα δάχτυλά του και έλιωσαν το ένα του χέρι στο τραπέζι!
Προτροπή
: «Ένας κτηνίατρος που εμβολιάζει έναν σκύλο σε μια ακατάστατη κλινική».

Πίστωση εικόνας
)
Γνωρίζατε ότι εάν έχετε τρία χέρια και 12 δάχτυλα (ίσως περισσότερα επειδή δεν μπορούμε να δούμε το χέρι του τρίτου βραχίονα), μπορείτε να χορηγήσετε δύο ενδοφλέβιες θεραπείες ταυτόχρονα; Τουλάχιστον αυτή τη φορά δεν υπάρχει κανένα πρόβλημα με το σκυλί εκτός από το να είναι άρρωστο…
Ίσως απλώς αποτυγχάνει να δημιουργήσει ανθρώπινα μέλη. Ας δοκιμάσουμε κάτι διαφορετικό.
Προτροπή
: «Μια χαριτωμένη γάτα καθαρίζει τα πόδια της καλυμμένα με σοκολάτα».

Πίστωση εικόνας
)
Δεν πειράζει, φαίνεται ότι ούτε το
ComfyUI
Stable Diffusion 3 δεν μπορεί να το σώσει…
Πώς να δοκιμάσετε το SD3 online
Ενώ το Stable Diffusion 3 Medium έχει αντιμετωπίσει το μερίδιο κριτικής του, και σύμφωνα με την εμπειρία μας, αυτά δεν είναι πολύ λανθασμένα παράπονα. Αν θέλετε να δοκιμάσετε μόνοι σας το SD3, πρέπει να κάνετε:
-
Μεταβείτε στο demo:
Επισκέψου το
Stable Diffusion 3 Medium demo στο Hugging Face Spaces
-
Εισαγάγετε την προτροπή σας:
Πληκτρολογήστε μια περιγραφή της εικόνας που θέλετε στο πλαίσιο κειμένου που παρέχεται. -
Παράγω:
Κάντε κλικ στο κουμπί «Δημιουργία» και περιμένετε να δημιουργήσει το μοντέλο την εικόνα σας. -
Ελέγξτε και βελτιώστε:
Εξετάστε την εικόνα που δημιουργήθηκε. Εάν δεν είναι αυτό που περιμένατε, προσαρμόστε την προτροπή και δοκιμάστε ξανά.
Ενώ το Stable Diffusion 3 Medium έχει αντιμετωπίσει το μερίδιό του σε κριτική, είναι σημαντικό να αναγνωρίσουμε τις δυνατότητές του ως πολύτιμο περιουσιακό στοιχείο. Η ικανότητα του μοντέλου να κατανοεί πολύπλοκες προτροπές και να δημιουργεί οπτικά ελκυστικές εικόνες σε διάφορα στυλ παραμένει αξιοσημείωτη. Καθώς η τεχνολογία ωριμάζει και υπόκειται σε περαιτέρω
ανάπτυξη
, είναι έτοιμη να συμβάλει σημαντικά στις διαρκώς διευρυνόμενες μεθόδους δημιουργικής έκφρασης μας.
Ωστόσο, προς το παρόν, συνιστούμε τη χρήση του Midjourney, ειδικά μετά την εισαγωγή της εξατομίκευσης μοντέλων Midjourney.
Πίστωση επιλεγμένης εικόνας
:
Σταθερότητα AI
VIA:
DataConomy.com
0