Αρχική






Artificial Intelligence





Εξερευνώντας το Ασταθές Κόσμο του SD3

Εξερευνώντας το Ασταθές Κόσμο του SD3





Το Stable Diffusion 3 Medium, η τελευταία προσφορά της Stability

, έκανε πρόσφατα το ντεμπούτο του, πυροδοτώντας ενθουσιασμό και διαμάχη στην κοινότητα SD3.

Ως μοντέλο κειμένου σε εικόνα, το Stable Diffusion 3 Medium στοχεύει στη μετατροπή των κειμενικών προτροπών σε οπτικά συναρπαστικές εικόνες, ωστόσο η πρόσληψή του έχει αντιμετωπιστεί με ανάμεικτες αντιδράσεις, ιδίως όσον αφορά την απεικόνιση ανθρώπινων μορφών.


Αν και το Stability AI το περιγράφει ως το «πιο εξελιγμένο μοντέλο παραγωγής εικόνων μέχρι σήμερα» στο α

ανάρτηση

τα αποτελέσματα που είδαμε είναι… Ας μην το ζαχαρώσουμε:

Εφιαλτικά καύσιμα

!

Stable Diffusion 3 Medium’s lineage

Το Stable Diffusion 3 Medium έχει τις ρίζες του σε μια σειρά μοντέλων σύνθεσης εικόνας AI που αναπτύχθηκαν από τη Stability AI. Αυτή η επανάληψη βασίζεται στα θεμέλια που έθεσαν οι προκάτοχοί της, ενσωματώνοντας προόδους τόσο στην τεχνολογία όσο και στις μεθοδολογίες εκπαίδευσης. Το όνομα του μοντέλου, «Medium», υποδηλώνει τη θέση του στην ευρύτερη σειρά Stable Diffusion 3, υποδηλώνοντας

ισορροπία μεταξύ της υπολογιστικής αποτελεσματικότητας και των παραγωγικών δυνατοτήτων

.

Στον πυρήνα του, Stable Diffusion 3 Medium

χρησιμοποιεί μια εξελιγμένη αρχιτεκτονική νευρωνικών δικτύων

να ερμηνεύει και να μεταφράζει κειμενικές προτροπές σε οπτικές αναπαραστάσεις. Τα δεδομένα εκπαίδευσης του μοντέλου, τα οποία περιλαμβάνουν μια τεράστια συλλογή εικόνων και τις αντίστοιχες περιγραφές κειμένου τους, διαδραματίζουν καθοριστικό ρόλο στη διαμόρφωση της ικανότητάς του να δημιουργεί συνεκτικές και σχετικές με τα συμφραζόμενα εικόνες.

Πού αποτυγχάνει το SD3;

Το Stable Diffusion 3 Medium παρουσιάζει αξιοσημείωτες αντοχές σε διάφορους τομείς. Η ικανότητά του να κατανοεί και να ανταποκρίνεται σε πολύπλοκες προτροπές που περιλαμβάνουν χωρικές σχέσεις, στοιχεία σύνθεσης και διαφορετικά

είναι αξιέπαινη. Η ικανότητα του μοντέλου στη δημιουργία εικόνων με περίπλοκες λεπτομέρειες και ζωηρά χρώματα είναι επίσης εμφανής.


Ωστόσο

έχει συγκεντρώσει κριτική για τις περιστασιακές του μάχες με την ακριβή απεικόνιση της ανθρώπινης ανατομίας, ιδιαίτερα των χεριών και των προσώπων, όπως μεταφέρεται από

HornyMetalBeing

του και πολλών άλλων αναρτήσεων στα μέσα κοινωνικής δικτύωσης. Αυτές οι ελλείψεις έχουν εγείρει ερωτήματα σχετικά με τα δεδομένα εκπαίδευσης του μοντέλου και τον πιθανό αντίκτυπο των μηχανισμών φιλτραρίσματος που χρησιμοποιούνται κατά την ανάπτυξή του.


Γιατί το SD3 είναι τόσο κακό στο να γεννά κορίτσια που βρίσκονται στο γρασίδι;


με

u/HornyMetalBeing

σε

StableDiffusion

Τα δεδομένα εκπαίδευσης που χρησιμοποιούνται για την εκπαίδευση του Stable Diffusion 3 Medium περιλαμβάνουν ένα ευρύ φάσμα οπτικού περιεχομένου, όπως:


  • Φωτογραφίες

  • Εργα ΤΕ

    ΝΗΣ

  • εικονογραφήσεις

Ωστόσο, οι προγραμματιστές του μοντέλου έχουν εφαρμόσει διαδικασίες φιλτραρίσματος

εξαιρέσει ρητό ή ευαίσθητο υλικό από αυτό το σύνολο δεδομένων

. Ενώ αυτά τα φίλτρα στοχεύουν στη διασφάλιση της υπεύθυνης χρήσης του μοντέλου, οδήγησαν κατά λάθος σε

αφαίρεση εικόνων που απεικονίζουν ορισμένες στάσεις ή ανατομικές λεπτομέρειες

συμβάλλοντας στις δυσκολίες του μοντέλου να αποδώσει με ακρίβεια ανθρώπινες μορφές.

Ας δοκιμάσουμε το Stable Diffusion 3 Medium

Μπορείτε εύκολα να βάλετε το μοντέλο στους ρυθμούς του χρησιμοποιώντας διαδικτυακές πλατφόρμες που προσφέρουν προσβάσιμες διεπαφές για αλληλεπίδραση μαζί του.

Ξέρετε το διαδίκτυο, περιέχει τόσους πολλούς ανθρώπους και τόσες πολλές ιδέες.

Πόσο κακό θα μπορούσε να είναι ένα μοντέλο παραγωγής εικόνας που έχει προετοιμαστεί σύμφωνα με τα πρότυπα του 2024

?

Δοκιμάσαμε το

δωρεάν online demo του SD3 στο Hugging Face

για να πάρουμε την απάντησή μας.

Ακολουθούν οι προτροπές και τα αποτελέσματά μας:


Προτροπή

: «Μια γυναίκα που κρυώνει με τον σκύλο της μια ηλιόλουστη Δευτέρα σε ένα πάρκο».

(

Πίστωση εικόνας

)

Φαίνεται ότι δεν υπάρχει κανένα πρόβλημα με την ανατομία του σκύλου εκτός από το να λείπει το ένα μάτι, αλλά τα χέρια και τα πόδια της γυναίκας μοιάζουν πραγματικά σαν να είχε ένα τρομερό ατύχημα…


Προτροπή

: «Ένα αγόρι που υπολογίζει το 2+4 χρησιμοποιώντας τα χέρια του».

Stable Diffusion 3 Medium
(

Πίστωση εικόνας

)

Φαίνεται ότι τα μαθηματικά όχι μόνο μπέρδεψαν το νεαρό αγόρι αλλά και του έκαναν πολύ μακριά τα δάχτυλά του και έλιωσαν το ένα του χέρι στο τραπέζι!


Προτροπή

: «Ένας κτηνίατρος που εμβολιάζει έναν σκύλο σε μια ακατάστατη κλινική».

Stable Diffusion 3 Medium
(

Πίστωση εικόνας

)

Γνωρίζατε ότι εάν έχετε τρία χέρια και 12 δάχτυλα (ίσως περισσότερα επειδή δεν μπορούμε να δούμε το χέρι του τρίτου βραχίονα), μπορείτε να χορηγήσετε δύο ενδοφλέβιες θεραπείες ταυτόχρονα; Τουλάχιστον αυτή τη φορά δεν υπάρχει κανένα πρόβλημα με το σκυλί εκτός από το να είναι άρρωστο…

Ίσως απλώς αποτυγχάνει να δημιουργήσει ανθρώπινα μέλη. Ας δοκιμάσουμε κάτι διαφορετικό.


Προτροπή

: «Μια χαριτωμένη γάτα καθαρίζει τα πόδια της καλυμμένα με σοκολάτα».

Stable Diffusion 3 Medium SD3
(

Πίστωση εικόνας

)


Δεν πειράζει, φαίνεται ότι ούτε το

Stable Diffusion 3 δεν μπορεί να το σώσει…

Πώς να δοκιμάσετε το SD3 online

Ενώ το Stable Diffusion 3 Medium έχει αντιμετωπίσει το μερίδιο κριτικής του, και σύμφωνα με την εμπειρία μας, αυτά δεν είναι πολύ λανθασμένα παράπονα. Αν θέλετε να δοκιμάσετε μόνοι σας το SD3, πρέπει να κάνετε:


  1. Μεταβείτε στο demo:

    Επισκέψου το

    Stable Diffusion 3 Medium demo στο Hugging Face Spaces

  2. Εισαγάγετε την προτροπή σας:

    Πληκτρολογήστε μια περιγραφή της εικόνας που θέλετε στο πλαίσιο κειμένου που παρέχεται.

  3. Παράγω:

    Κάντε κλικ στο κουμπί «Δημιουργία» και περιμένετε να δημιουργήσει το μοντέλο την εικόνα σας.

  4. Ελέγξτε και βελτιώστε:

    Εξετάστε την εικόνα που δημιουργήθηκε. Εάν δεν είναι αυτό που περιμένατε, προσαρμόστε την προτροπή και δοκιμάστε ξανά.

Ενώ το Stable Diffusion 3 Medium έχει αντιμετωπίσει το μερίδιό του σε κριτική, είναι σημαντικό να αναγνωρίσουμε τις δυνατότητές του ως πολύτιμο περιουσιακό στοιχείο. Η ικανότητα του μοντέλου να κατανοεί πολύπλοκες προτροπές και να δημιουργεί οπτικά ελκυστικές εικόνες σε διάφορα στυλ παραμένει αξιοσημείωτη. Καθώς η τεχνολογία ωριμάζει και υπόκειται σε περαιτέρω

, είναι έτοιμη να συμβάλει σημαντικά στις διαρκώς διευρυνόμενες μεθόδους δημιουργικής έκφρασης μας.

Ωστόσο, προς το παρόν, συνιστούμε τη χρήση του Midjourney, ειδικά μετά την εισαγωγή της εξατομίκευσης μοντέλων Midjourney.



Πίστωση επιλεγμένης εικόνας

:

Σταθερότητα AI

VIA:

DataConomy.com








Marizas Dimitris


Marizas Dimitris

TechWar.GR — Ειδήσεις Τεχνολογίας, Gadgets, Ψυχαγωγία


Αφοσιωμένος λάτρης κινητών Samsung, ο Δημήτρης έχει εξελίξει μια ιδιαίτερη σχέση με τα προϊόντα της εταιρίας, εκτιμώντας τον σχεδιασμό, την απόδοση και την καινοτομία που προσφέρουν. Γράφοντας και διαβάζοντας τεχνολογικά νέα από όλο τον κόσμο.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ


Ακύρωση απάντησης



εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ