Η Google ανακοινώνει το Gemini, την «πολυτροπική» απάντησή της στο ChatGPT
Την Τετάρτη,
ανακοίνωσε η Google
την άφιξη του
Δίδυμοι
, το νέο πολυτροπικό μοντέλο της μεγάλης γλώσσας που δημιουργήθηκε από την αρχή από το τμήμα τεχνητής νοημοσύνης της εταιρείας,
DeepMind
. Μεταξύ των πολλών λειτουργιών του, το Gemini θα υποστηρίξει το Google Bard, το οποίο στο παρελθόν αγωνιζόταν να αναδυθεί από τη σκιά του προδρόμου του chatbot, του ChatGPT του OpenAI.
Πίστωση: Google DeepMind
/
YouTube
Σύμφωνα με α
Ανάρτηση ιστολογίου 6 Δεκεμβρίου
από τον CEO της Google, Sundar Pichai και τον συνιδρυτή και διευθύνοντα σύμβουλο της DeepMind, Demis Hassabis, υπάρχουν τεχνικά τρεις εκδόσεις του LLM—Gemini Ultra, Pro και Nano—που προορίζονται για διάφορες εφαρμογές. Ένα “ψιλά συντονισμένο” Gemini Pro υποστηρίζει τώρα τον Bard, ενώ η παραλλαγή Nano θα εμφανίζεται σε προϊόντα όπως
Pixel Pro
smartphones. Οι παραλλαγές Gemini θα φτάσουν επίσης για την Αναζήτηση Google,
τι
ς Διαφημίσεις και το
Chrome
τους επόμενους μήνες, αν και η δημόσια πρόσβαση στο Ultra δεν θα είναι διαθέσιμη μέχρι το
2024
.
Σε αντίθεση με πολλούς από τους ανταγωνιστές του με τεχνητή νοημοσύνη, το Gemini εκπαιδεύτηκε να είναι «πολυτροπικό» από την κυκλοφορία, πράγμα που σημαίνει ότι μπορεί ήδη να χειρίζεται μηνύματα κειμένου, ήχου και εικόνας. Σε ένα συνοδευτικό
επίδειξη βίντεο
, ο Δίδυμος έχει προφορικά καθήκον να προσδιορίσει τι είναι τοποθετημένο μπροστά του (ένα κομμάτι χαρτί) και στη συνέχεια προσδιορίζει σωστά το σκίτσο ενός χρήστη για μια πάπια σε πραγματικό χρόνο. Άλλες ικανότητες φαίνεται να περιλαμβάνουν το συμπέρασμα των ενεργειών που θα ακολουθήσουν στα βίντεο αφού τεθούν σε παύση, τη δημιουργία μουσικής με βάση οπτικές προτροπές και την αξιολόγηση της εργασίας των παιδιών — συχνά με μια ελαφρώς αναιδή, επιρρεπή στο λογοπαίγνιο προσωπικότητα. Αξίζει να σημειωθεί, ωστόσο, ότι η περιγραφή του βίντεο περιλαμβάνει την αποποίηση ευθύνης, “Για τους σκοπούς αυτής της επίδειξης, ο λανθάνοντας χρόνος έχει μειωθεί και οι έξοδοι Gemini έχουν μειωθεί για λόγους συντομίας.”
Ο Δίδυμος συνοδεύει
Τεχνική αναφορά
υποδεικνύει ότι η πιο ισχυρή επανάληψη του LLM, το Ultra, «υπερβαίνει τα τρέχοντα αποτελέσματα αιχμής σε 30 από τα 32 ευρέως χρησιμοποιούμενα ακαδημαϊκά κριτήρια αναφοράς που χρησιμοποιούνται στο [LLM] έρευνα και ανάπτυξη.”
Το
ύτου λεχθέντος, οι βελτιώσεις φαίνονται κάπως μέτριες – το Gemini Ultra απάντησε σωστά σε διεπιστημονικές ερωτήσεις το 90 τοις εκατό του χρόνου, έναντι του 86,4 τοις εκατό του ChatGPT. Ανεξάρτητα από τη στατιστική διάσπαση των μαλλιών, ωστόσο, τα αποτελέσματα δείχνουν ότι το ChatGPT μπορεί να έχει κάποιο πραγματικό ανταγωνισμό με το Gemini.
[Related: The logic behind AI chatbots like ChatGPT is surprisingly basic.]
Όπως ήταν αναμενόμενο, η Google προειδοποίησε στην ανακοίνωση της Τετάρτης ότι το νέο αστέρι της AI απέχει πολύ από το τέλειο και εξακολουθεί να είναι επιρρεπές στις «ψευδαισθήσεις» σε ολόκληρη τη βιομηχανία που μαστίζουν την αναδυόμενη τεχνολογία – δηλαδή το LLM περιστασιακά θα κάνει τυχαία εσφαλμένες ή παράλογες απαντήσεις. Η Google υπέβαλε επίσης το Gemini σε «τις πιο ολοκληρωμένες αξιολογήσεις ασφάλειας από οποιοδήποτε μοντέλο Google AI», σύμφωνα με τον Eli Collins, αντιπρόεδρο του Google DeepMind, μιλώντας στο
Εκδήλωση έναρξης 6 Δεκεμβρίου
. Αυτό περιελάμβανε την ανάθεση στον Δίδυμο
«Πραγματική τοξικότητα προτρέπει
», ένα τεστ που αναπτύχθηκε από το Ινστιτούτο Allen για την τεχνητή νοημοσύνη που περιλαμβάνει πάνω από 100.000 προβληματικές εισροές με σκοπό να αξιολογήσει τις πιθανές πολιτικές και δημογραφικές προκαταλήψεις ενός μεγάλου γλωσσικού μοντέλου.
Το Gemini θα συνεχίσει να ενσωματώνεται στη σουίτα προϊόντων της Google τους επόμενους μήνες παράλληλα με μια σειρά κλειστών φάσεων δοκιμών. Εάν όλα πάνε όπως είχε προγραμματιστεί, ένα Gemini Ultra-powered Bard Advanced θα γίνει διαθέσιμο στο κοινό κάποια στιγμή τον επόμενο χρόνο — αλλά, όπως έχει αποδειχθεί καλά μέχρι τώρα, ο συνεχιζόμενος αγώνας εξοπλισμών AI είναι συχνά δύσκολο να προβλεφθεί.
Όταν ρωτήθηκε αν τροφοδοτείται από Gemini, ο Bard ενημέρωσε
PopSci
“δυστυχώς” δεν έχει πρόσβαση σε πληροφορίες “σχετικά με εσωτερικά έργα της Google”.
“Εάν ενδιαφέρεστε να μάθετε περισσότερα για… “Δίδυμοι”, συνιστώ να αναζητήσετε πληροφορίες μέσω των επίσημων καναλιών της Google ή να επικοινωνήσετε με κάποιον εντός της εταιρείας που έχει πρόσβαση σε τέτοιες πληροφορίες”, έγραψε ο Bard στο
PopSci
. “Ζητώ συγγνώμη για την ταλαιπωρία και ελπίζω ότι αυτές οι πληροφορίες είναι χρήσιμες.”
VIA:
popsci.com
