Το Google Gemini επιδιώκει να τοποθετήσει το ChatGPT στον καθρέφτη


Τι πρέπει να ξέρετε

  • Η κούρσα της τεχνητής νοημοσύνης θερμαίνεται καθώς η Google κυκλοφόρησε ένα νέο μοντέλο τεχνητής νοημοσύνης, (σκεφτείτε το

    έναντι του GPT-3) για να τροφοδοτήσει το οικοσύστημά της με τεχνητή νοημοσύνη.
  • Τα σημεία αναφοράς της Google δείχνουν ότι η Gemini υπερέχει του GPT-4V σε διάφορες μετρήσεις απόδοσης.
  • Το Gemini θα έρθει σε 3 μορφές: Ultra, Pro και Nano.
  • Το

    θα είναι το πρώτο Pixel που θα εφαρμόσει το Gemini μέσω του Gemini Nano.
  • Το Gemini Pro θα είναι διαθέσιμο μέσω του Gemini API στο Google AI Studio στις 13 Δεκεμβρίου.

Με την πρόσφατη αναταραχή στο OpenAI με την απόλυση και, στη συνέχεια, την επαναπρόσληψη του Sam Altman, η Google πρέπει να μύρισε αίμα στο νερό γιατί μόλις λίγες εβδομάδες αργότερα η Google ανακοίνωσε ένα νέο μοντέλο AI που φαίνεται να είναι πιο ισχυρό από το GPT-4V.

Google

ανακοίνωσε το Google Gemini

καθώς το μέλλον της τεχνητής νοημοσύνης για την Google και από σήμερα θα τροφοδοτεί τον Bard και σύντομα θα έρθει σε όλα τα προϊόντα τεχνητής νοημοσύνης της Google. Με 3 διαφορετικά μεγέθη του μοντέλου: Ultra, Pro και Nano, το Gemini 1.0 έχει κατασκευαστεί για να είναι πανταχού παρόν όπως και η υπόλοιπη Google.

Τι είναι το Google Gemini;

Η Google αποκαλεί το Gemini «το πιο ικανό και γενικό μοντέλο που κατασκευάσαμε ποτέ». Είναι το μοντέλο υποστήριξης που θα τροφοδοτήσει τη στοίβα προϊόντων τεχνητής νοημοσύνης της Google, αν και η απόφαση να κυκλοφορήσει το μοντέλο με τρία μεγέθη.


  • Gemini Ultra

    — Το μεγαλύτερο και πιο ικανό μοντέλο της Google για εξαιρετικά πολύπλοκες εργασίες.

  • Gemini Pro

    — Το καλύτερο μοντέλο της Google για την κλιμάκωση σε ένα ευρύ φάσμα εργασιών.

  • Δίδυμοι Νάνο

    — Το πιο αποτελεσματικό μοντέλο της Google για εργασίες στη συσκευή.

Μερικοί από τους αριθμούς απόδοσης που διαφημίζει η Google για τους Gemini είναι αρκετά εντυπωσιακοί, αλλά αν έχω μάθει ένα πράγμα στην τεχνολογία, μην εμπιστεύεστε τα σημεία αναφοράς κατασκευαστών. Τούτου λεχθέντος, είναι δύσκολο να αμφισβητήσει κανείς την αποτελεσματικότητα του Gemini όταν τον βλέπει να λειτουργεί ζωντανά. @rowancheung στο X (Twitter)

δημοσίευσε ένα βίντεο

δείχνοντας τους Διδύμους σε δράση και τα αποτελέσματα δεν είναι τίποτα λιγότερο από αξιοσημείωτα.


Δείτε περισσότερα

Πώς αποδίδει το Google Gemini;

Η Google προβάλλει το Gemini ως το καλύτερο μοντέλο AI στον πλανήτη μέσω των σημείων αναφοράς που δημοσίευσε. Εάν αυτά τα σημεία αναφοράς αντέχουν μέχρι και δοκιμές τρίτου μέρους, το Gemini θα είναι το κορυφαίο σκυλί στην αγορά, τουλάχιστον έως ότου το OpenAI κυκλοφορήσει το ChatGPT-5. Ο μεγάλος κανόνας με την οικονομία όπως είναι σήμερα δομημένη είναι ότι καθώς οι εταιρείες ανταγωνίζονται για να έχουν το καλύτερο προϊόν, συνήθως κερδίζουν οι καταναλωτές.

Ο Gemini θα πρέπει να ωθήσει το OpenAI να συνεχίσει να πιέζει την καινοτομία, αλλά προφανώς, υπήρξαν πολλές ανησυχίες σχετικά με την απερίσκεπτη έρευνα χωρίς τις κατάλληλες εκτιμήσεις για την ασφάλεια, ακόμη και από CEO όπως ο Satya Nadella που συνέκρινε την AI με την ατομική ενέργεια.

Το Gemini Ultra είναι το πρώτο μοντέλο που ξεπέρασε τους ανθρώπινους ειδικούς στο MMLU (masive multitask language κατανόηση), το οποίο χρησιμοποιεί έναν συνδυασμό 57 μαθημάτων όπως μαθηματικά, φυσική, ιστορία, νόμος, ιατρική και ηθική για τον έλεγχο τόσο της παγκόσμιας γνώσης όσο και των ικανοτήτων επίλυσης προβλημάτων.


Google

Το Google Gemini ξεπέρασε το ChatGPT-4V στα περισσότερα σημεία αναφοράς που εμφανίστηκαν από την Google. Μερικές φορές πάνω από 4% μονάδες. Το σημείο αναφοράς με το πιο ενδιαφέρον όνομα από τη δέσμη, το HellaSwag, ήταν αυτό που το Gemini είχε χαμηλότερη απόδοση σε σύγκριση με το ChatGPT-4V. Ρίξτε μια ματιά στην πλήρη λίστα των σημείων αναφοράς.

Σύρετε για οριζόντια κύλιση
Ικανότητα Σημείο αναφοράς Περιγραφή Gemini Ultra GPT-4V
Γενικός MMLU Αναπαράσταση ερωτήσεων σε 57 θέματα (συμπεριλαμβανομένου του STEM, των ανθρωπιστικών επιστημών και άλλων) 90,0% CoT@32* 86,4% 5 βολές* (αναφέρεται)
Αιτιολογία Big-Bench Hard Διαφορετικό σύνολο απαιτητικών εργασιών που απαιτούν συλλογισμό πολλών βημάτων 83,6% 3 βολές 83,1% 3 βολές (API),

Σειρά 2 – Κελί 0
ΠΤΩΣΗ Κατανόηση ανάγνωσης (Βαθμολογία F1) 82.4 Μεταβλητές βολές 80,9 3-βολές (αναφέρεται)

Σειρά 3 – Κελί 0
HellaSwag Κοινός συλλογισμός για καθημερινές εργασίες 87,8% 10 βολές* 95,3% 10 βολές* (αναφέρεται)
Μαθηματικά GSM8K Βασικοί αριθμητικοί χειρισμοί (συμπεριλαμβανομένων μαθηματικών προβλημάτων δημοτικού) 94,4% maj1@32 92,0% CoT 5 βολών (αναφέρθηκε)

Σειρά 5 – Κελί 0
ΜΑΘΗΜΑΤΙΚΑ Προκλητικά μαθηματικά προβλήματα (συμπεριλαμβανομένης της άλγεβρας, της γεωμετρίας, του προ-λογισμού και άλλων) 53,2% 4-βολές 52,9% 4 βολών (API)
Κώδικας HumanEval Δημιουργία κώδικα Python 74,4% 0-σουτ (IT)* 67,0% 0-σουτ* (αναφέρθηκε)

Σειρά 7 – Κελί 0
Natural2Code Δημιουργία κώδικα Python. Νέο συγκρατημένο σύνολο δεδομένων που μοιάζει με HumanEval, δεν έχει διαρρεύσει στον Ιστό 74,9% 0-σουτ 73,9% 0-shot (API)

Σειρά 8 – Κελί 0

Σειρά 8 – Κελί 1

Σειρά 8 – Κελί 2

Σειρά 8 – Κελί 3

Σειρά 8 – Κελί 4

Αν και αυτές οι βαθμολογίες είναι εντυπωσιακές, πιθανότατα δεν σημαίνουν έναν τόνο για τον μέσο καταναλωτή. Η Google που ωθεί το Gemini Nano στο Pixel 8 Pro είναι πιο συναρπαστικό για μένα, καθώς είναι ένα μοντέλο για εργασίες στη συσκευή. Πολλοί κατασκευαστές αρχίζουν να προσθέτουν δυνατότητες τεχνητής νοημοσύνης στη συσκευή, όπως το TensorRT-LLM της NVIDIA στις συσκευές που κατασκευάζουν. Για μένα, αυτή είναι μια πιο συναρπαστική προοπτική για το μέλλον της τεχνητής νοημοσύνης, όπου μπορούμε να έχουμε αληθινούς προσωπικούς βοηθούς ενσωματωμένους στα τηλέφωνά μας και να προσαρμόσουμε το μοντέλο AI μας ώστε να λειτουργεί καλύτερα για τις ατομικές μας ανάγκες.

Μία από τις καλύτερες, και πιθανώς πιθανές, μελλοντικές εφαρμογές για αυτά τα LLM AI είναι κάτι που όλοι έχουμε ονειρευτεί από το

Trek πριν από 80 και πλέον χρόνια. Ένας παγκόσμιος μεταφραστής γλώσσας. Το ChatGPT μπορεί ήδη να λειτουργήσει ως μεταφραστής, αλλά υπάρχει πολύ μεγάλος χρόνος επεξεργασίας για τη δημιουργία των μεταφράσεων. Υπάρχουν πλέον μοντέλα τεχνητής νοημοσύνης που μπορούν να μεταφράσουν τη φωνητική δράση σε άλλη γλώσσα, διατηρώντας ανέπαφη τη φωνή του αρχικού ηθοποιού. Είμαι μεγάλος θαυμαστής των anime, καθώς και των ιαπωνικών και κορεατικών δραμάτων, θα μου άρεσε ένας κόσμος όπου μπορώ να πατήσω ένα κουμπί στην τηλεόρασή μου και να ακούσω τη φωνή των αρχικών ηθοποιών, αλλά απλώς να την ακούσω στα αγγλικά σε πραγματικό- χρόνος. Καθώς αυτές οι μεγάλες εταιρείες ανταγωνίζονται για να ξεπεράσουν η μία την άλλη στην πρόοδο της τεχνητής νοημοσύνης, αυτή η πραγματικότητα πλησιάζει όλο και πιο κοντά.


VIA:

WindowsCentral


Follow TechWar.gr on Google News