Ανάλυση της Google για τα προβλήματα με τη δημιουργία των εικόνων AI του Gemini και οι λύσεις που προτείνει

By

Marizas Dimitris

On

Φεβ 27, 2024

Πριν από λίγες εβδομάδες η Google κυκλοφόρησε ένα νέο εργαλείο δημιουργίας εικόνων για το Gemini (η σουίτα εργαλείων τεχνητής νοημοσύνης που ήταν παλαιότερα γνωστά ως Bard and Duet) που επέτρεπε στους χρήστες να δημιουργούν κάθε είδους εικόνες από απλά μηνύματα κειμένου. Δυστυχώς, το εργαλείο τεχνητής νοημοσύνης της Google επανειλημμένα έχασε το σημάδι και δημιούργησε ανακριβείς, ακόμη και προσβλητικές εικόνες που οδήγησαν πολλούς από εμάς να αναρωτηθούμε – πώς το

ρομπότ

έκανε τα πράγματα τόσο στραβά; Λοιπόν, η εταιρεία κυκλοφόρησε επιτέλους μια δήλωση που εξηγεί τι πήγε στραβά και πώς σχεδιάζει να διορθώσει το Gemini.

ο

επίσημη ανάρτηση ιστολογίου

αντιμετωπίζοντας το ζήτημα δηλώνει ότι όταν σχεδίαζε τη λειτουργία κειμένου σε εικόνα για το Gemini, η ομάδα πίσω από το Gemini ήθελε «να διασφαλίσει ότι δεν θα πέσει σε ορισμένες από τις παγίδες που έχουμε δει στο παρελθόν με την τεχνολογία δημιουργίας εικόνας — όπως η δημιουργία βίαιες ή

σεξ

ουαλικά σαφείς εικόνες ή απεικονίσεις πραγματικών ανθρώπων». Η ανάρτηση εξηγεί περαιτέρω ότι οι χρήστες πιθανότατα δεν θέλουν να συνεχίσουν να βλέπουν άτομα μιας μόνο εθνότητας ή άλλου εξέχοντος χαρακτηριστικού.

Λοιπόν, για να προσφέρουμε μια αρκετά βασική εξήγηση για το τι συμβαίνει: Ο Δίδυμος ανεβάζει εικόνες έγχρωμων ανθρώπων όταν τους ζητείται να δημιουργήσει εικόνες λευκών ιστορικών προσωπικοτήτων, δίνοντας στους χρήστες «

διαφορετικοί ναζί

‘, ή απλώς αγνοώντας το τμήμα του μηνύματός σας όπου έχετε καθορίσει ακριβώς αυτό που αναζητάτε. Ενώ οι δυνατότητες εικόνας του Gemini βρίσκονται επί του παρόντος σε αναμονή, όταν μπορούσατε να αποκτήσετε πρόσβαση στη λειτουργία, θα προσδιορίζατε ακριβώς ποιον προσπαθείτε να δημιουργήσετε – η Google χρησιμοποιεί το παράδειγμα “

ένας

λευκός κτηνίατρος με έναν σκύλο” – και ο Gemini φαινομενικά θα αγνοούσε το πρώτο μισό του που προτρέπουν και δημιουργούν κτηνιάτρους όλων των φυλών

εκτός

αυτή που ζητήσατε.

Η Google συνέχισε εξηγώντας ότι αυτό ήταν το αποτέλεσμα δύο κρίσιμων αποτυχιών – πρώτον, ο Gemini έδειχνε μια σειρά διαφορετικών ανθρώπων χωρίς να λαμβάνει υπόψη ένα εύρος

να μην δείχνει

. Παράλληλα, προσπαθώντας να δημιουργήσει μια πιο συνειδητή, λιγότερο προκατειλημμένη γενετική τεχνητή νοημοσύνη, η Google παραδέχεται ότι «το

μοντέλο

έγινε πολύ πιο προσεκτικό από ό,τι θέλαμε και αρνήθηκε να απαντήσει εξ ολοκλήρου σε ορισμένα μηνύματα – ερμηνεύοντας λανθασμένα ορισμένες πολύ ανώδυνες προτροπές ως ευαίσθητες».

Λοιπόν τι ακολουθεί?

Τη στιγμή της γραφής, η δυνατότητα δημιουργίας εικόνων ανθρώπων στο Gemini έχει τεθεί σε παύση, ενώ η ομάδα Gemini εργάζεται για να διορθώσει τις ανακρίβειες και να πραγματοποιήσει περαιτέρω δοκιμές. Η ανάρτηση ιστολογίου σημειώνει ότι οι «παραισθήσεις» της τεχνητής νοημοσύνης δεν είναι κάτι καινούργιο όταν πρόκειται για πολύπλοκα μοντέλα βαθιάς μάθησης – ακόμη και ο Bard και το ChatGPT είχαν κάποιες αμφισβητούμενες εκρήξεις καθώς οι δημιουργοί αυτών των ρομπότ επεξεργάζονταν τα προβλήματα.

Η ανάρτηση τελειώνει με μια υπόσχεση από την Google να συνεχίσει να εργάζεται για τη γενιά ανθρώπων που τροφοδοτείται από την τεχνητή νοημοσύνη Gemini μέχρι να τακτοποιηθούν όλα, με τη σημείωση ότι ενώ η ομάδα δεν μπορεί να υποσχεθεί ότι δεν θα το κάνει

πάντα

δημιουργούν «ντροπιαστικά, ανακριβή ή προσβλητικά αποτελέσματα», λαμβάνονται μέτρα για να διασφαλιστεί ότι θα συμβεί όσο το δυνατόν λιγότερο.

Συνολικά, όλο αυτό το επεισόδιο θέτει σε προοπτική αυτό

Το AI είναι τόσο έξυπνο όσο το κάνουμε εμείς

. Ο αρχισυντάκτης μας Lance Ulanoff σημείωσε συνοπτικά ότι «Όταν ένα AI δεν γνωρίζει ιστορία, δεν μπορείς να κατηγορήσεις το AI». Με το πόσο γρήγορα έχει εισχωρήσει η τεχνητή νοημοσύνη και έχει στριμωχτεί σε διάφορες πτυχές της καθημερινότητάς μας – είτε το θέλουμε είτε όχι – είναι εύκολο να ξεχάσουμε ότι η δημόσια εξάπλωση της τεχνητής νοημοσύνης ξεκίνησε μόλις πριν από 18 μήνες. Όσο εντυπωσιακά κι αν είναι τα εργαλεία που διαθέτουμε αυτήν τη στιγμή, τελικά βρισκόμαστε ακόμη στις πρώτες μέρες της τεχνητής νοημοσύνης.

Δεν μπορούμε να βρέξουμε στην παρέλαση του Google Gemini μόνο και μόνο επειδή τα λάθη ήταν πιο εντυπωσιακά οπτικά από ό,τι, ας πούμε, η πρόσφατη κατάρρευση του ChatGPT με ασυναρτησίες. Η προσωρινή παύση και η εκ νέου επεξεργασία της Google θα οδηγήσουν τελικά σε ένα καλύτερο προϊόν και αργά ή γρήγορα θα δούμε το εργαλείο όπως έπρεπε να είναι.

VIA:

TechRadar.com/