Η Google παραποιεί βίντεο για να αναδείξει το Gemini AI



Η Google ανακοίνωσε το

αυτή την εβδομάδα.

Οι Δίδυμοι θα ανταγωνιστούν με το ChatGPT

και είναι ένα πολυτροπικό AI, που σημαίνει ότι μπορεί να αλληλεπιδράσει με κείμενο, εικόνες, ήχο, βίντεο και κώδικα. Η διαφημιστική εκστρατεία γύρω από

ς Διδύμους ήταν υψηλή μετά

Google I/O

αλλά τώρα αρχίζουμε να βλέπουμε πίσω από την κουρτίνα του μοντέλου AI, και δεν είναι όμορφο.

Ενώ το Gemini δείχνει υπόσχεση, όλοι πρέπει να μετριάζουμε τις προσδοκίες για το νέο εργαλείο επειδή το βίντεο που μοιράστηκε η Google είναι ψεύτικο. Αυτό μπορεί να φαίνεται σαν μια δυνατή λέξη, αλλά η Parmy Olson στο Bloomberg έδειξε πώς το βίντεο της Google δεν αντιπροσωπεύει πώς θα λειτουργήσει ο Gemini στον πραγ

ικό κόσμο.

Πριν ασχοληθώ με το πώς έφτιαξε το βίντεο η Google, θέλω να διευκρινίσω ότι το κλιπ δεν είναι εξ ολοκλήρου κατασκευασμένο. Η Google χρησιμοποίησε το Gemini για να αναγνωρίσει αντικείμενα και να καταλάβει τι συνέβαινε στις εικόνες. Αυτό που δεν έκανε η Google, ωστόσο, ήταν να δημιουργήσει ένα γνήσιο πρακτικό βίντεο που δείχνει την πραγματική εμπειρία που θα έχετε όταν χρησιμοποιείτε το Gemin.

Όταν βλέπετε ένα πρακτικό βίντεο για ένα προϊόν, περιμένετε περιεχόμενο που αντικατοπτρίζει τη χρήση του πραγματικού κόσμου. Για παράδειγμα, εάν ένας αναθεωρητής του YouTube έκανε πρακτική με ένα νέο ακουστικό VR, θα θέλατε αυτό το βίντεο να δείχνει το πραγματικό παιχνίδι, πώς φαίνεται το οπτικό πεδίο και πόσο καλά λειτουργούν τα χειριστήρια. Ομοίως, ένα hands-on με ένα τηλέφωνο θα πρέπει να δείχνει πώς λειτουργεί πραγματικά το τηλέφωνο, όχι μια επιτάχυνση και κομμένη μεταξύ τους.

Θα μπορούσατε να υποστηρίξετε ότι οι περισσότερες, αν όχι όλες, οι επιδείξεις προϊόντων είναι κομμένες μεταξύ τους και δεν εμφανίζουν ελαττώματα των προϊόντων που επισημαίνουν. Αλλά όπως λένε, δύο λάθη δεν κάνουν το σωστό.

Πώς η Google προσποιήθηκε τους Gemini hands-on της

Στο βίντεο, ένας χρήστης εκτελεί μια ποικιλία εργασιών, όπως να προσπαθεί να κρύψει μια μπάλα στο φλιτζάνι, να σχεδιάσει μια πάπια και να παίξει ένα παιχνίδι με έναν χάρτη. Σε όλο το κλιπ, ο Δίδυμος αφηγείται τι συμβαίνει σε πραγματικό χρόνο, ανακαλύπτοντας τα πάντα εν κινήσει. Αυτό που δεν βλέπετε στο βίντεο, ωστόσο, είναι ότι η Google χρησιμοποίησε μηνύματα κειμένου και παρείχε πλαίσιο για να κάνει την επίδειξη του Gemini.

Η Google έδωσε προτροπές στους Gemini με βάση τα καρέ ακίνητων εικόνων από το περιεχόμενο που καταγράφηκε. Στη συνέχεια, η εταιρεία προέτρεψε το μοντέλο AI με κείμενο. Στη συνέχεια προστέθηκε η αφήγηση.

Στην πραγματικότητα, οι προτροπές που εμφανίζονται στο βίντεο δεν είναι καν αυτές που δίνονται στον Gemin. Το βίντεο κάνει να φαίνεται ότι ο Δίδυμος βλέπει τρία φλιτζάνια τοποθετημένα σε ένα τραπέζι και αμέσως καθορίζει ότι ο χρήστης προσπαθεί να παίξει ένα παιχνίδι. Στην πραγματικότητα, η Google εκπαίδευσε τους Διδύμους πώς να παίζουν το παιχνίδι. Στη συνέχεια δοκίμασε τον Δίδυμο για την ικανότητά του να ακολουθεί πολύ συγκεκριμένες οδηγίες. Ακόμη και σε αυτές τις συνθήκες, ο Δίδυμος δεν είναι τέλειος στο έργο.

” Φυσικά, δεν θα αντιμετωπίζει πάντα σωστά αυτήν την πρόκληση. Μερικές φορές η ψεύτικη κίνηση έξω (όπου αλλάζεις δύο άδεια φλιτζάνια) φαίνεται να το σκοντάφτει, αλλά μερικές φορές το κάνει και αυτό. Αλλά απλές προτροπές όπως αυτή το κάνουν πραγματικά διασκεδαστικό δοκιμάστε γρήγορα το Gemini», εξήγησε η Google.

Είναι μάλλον ταιριαστό που το πρακτικό βίντεο της Google για τους Διδύμους χρησιμοποίησε ένα τέχνασμα επίτηδες.

Η Google υπερασπίζεται το ψεύτικο βίντεο Gemini


Δείτε περισσότερα

Η Αντιπρόεδρος

ς και Deep Learning της Google, Oriol Vinyals, υπερασπίστηκε το βίντεο στο X.

“Όλες οι προτροπές και οι έξοδοι χρήστη στο βίντεο είναι πραγματικές, συντομευμένες για συντομία. Το βίντεο απεικονίζει τις εμπειρίες των πολυτροπικών χρηστών που χτίστηκαν με το Gemini

θα μπορούσε να μοιάζει

. Το φτιάξαμε για να εμπνεύσουμε τους προγραμματιστές», είπε ο Vinyals (η έμφαση είναι δική μας).

Είμαι έκπληκτος που πρέπει να το πω αυτό. Αυτό που “θα μπορούσε να μοιάζει” δεν είναι ένα πρακτικό βίντεο.

Η Google συνδέθηκε με ένα

θέση ιστολογίου

t στο βίντεό του που περιγράφει πώς η εταιρεία δημιούργησε το περιεχόμενο. Αυτή η ανάρτηση ιστολογίου δεν κρύβει το γεγονός ότι η Google χρησιμοποίησε πολλές προτροπές και συνθήματα για να κάνει τον Gemini να αντιδράσει όπως έκανε. Αλλά ένας σύνδεσμος ανάρτησης ιστολογίου κάτω από την ενότητα “…περισσότερα” μιας περιγραφής βίντεο δεν είναι το ίδιο με την εξήγηση του τι συμβαίνει στο βίντεο. Σίγουρα δεν διορθώνει τη λανθασμένη χρήση της φράσης «hands-on».

Χρειαζόμαστε λίγη περισσότερη διαφάνεια


(Πίστωση εικόνας: Google)

Καταλαβαίνω γιατί η Google έκανε αυτό που έκανε. Η Amazon προσπάθησε να επιδείξει το Echo Show 8 νωρίτερα φέτος με ένα αληθινό live demo και δεν πήγε καλά. Η κλήση της συσκευής λέγοντας “hey

” είχε ως αποτέλεσμα αργές απαντήσεις. Η απόδοση δεν ήταν επίσης εξαιρετική, βάζοντας τη συσκευή σε κακό φως.

Αλλά θα υποστήριζα ότι αν μια αληθινή ζωντανή επίδειξη ενός προϊόντος κάνει αυτό το προϊόν να φαίνεται κακό, οι άνθρωποι θα πρέπει να το γνωρίζουν αυτό. Εάν ένα τρέιλερ παιχνιδιού φαίνεται εκπληκτικό και το παιχνίδι είναι τρομερό, οι άνθρωποι θα αναστατωθούν επειδή παραπλανήθηκαν. Δεν καταλαβαίνω πόσο διαφορετικό είναι το πρακτικό βίντεο της Google.


VIA:

WindowsCentral


Follow TechWar.gr on Google News