Το ChatGPT έχει επιτέλους ανταγωνισμό — Το Google Bard με τους Gemini μόλις το συνδύασε με μια τεράστια αναβάθμιση



Το Google Bard με Gemini μόλις ισοφάρισε την απόδοση του ChatGPT σε μια δημοφιλή αρένα chatbot, έρχεται δεύτερος στον πίνακα κατάταξης ακριβώς πίσω από το GPT-4-Turbo, το πιο προηγμένο μοντέλο του OpenAI.

Με την υποστήριξη μιας πρόσφατα ενημερωμένης έκδοσης του νέου μοντέλου τεχνητής νοημοσύνης Gemini Pro, ο Bard έχει δει αξιοσημείωτη αύξηση στην απόδοση από την κυκλοφορία του μοντέλου τον Δεκέμβριο. Η δική μου δοκιμή του Bard εναντίον της δωρεάν έκδοσης του ChatGPT είδε τον Bard να βγαίνει στην κορυφή.

The Large Model Systems Organization (LMSYS)

Chatbot Arena

αντιπαραθέτει τα κορυφαία μοντέλα τεχνητής νοημοσύνης με τους ανθρώπους να κρίνουν και να βαθμολογούν την απόδοση. Περιλαμβάνει τόσο μοντέλα κλειστού κώδικα όπως το GPT-4 ή το Gemini Pro, καθώς και τεχνητή νοημοσύνη ανοιχτού κώδικα όπως το Meta’s Llama 2.

Αυτή είναι η πρώτη φορά που ο Bard κέρδισε τη βασική έκδοση του GPT-4, η οποία τροφοδοτεί την premium έκδοση τόσο του ChatGPT όσο και του Microsoft Copilot. Jeff Dean, Επικεφαλής Επιστήμονας στο Google DeepMind

έγραψε στο Χ

ότι η πρόσφατη επιτυχία οφείλεται σε μια νέα έκδοση του Gemini Pro που ονομάζεται “scale”.

Πώς λειτουργεί η αρένα chatbot;


(Πίστωση εικόνας: LMSys)

Όπως κάθε πεδίο μάχης, το Chatbot Arena βάζει δύο μοντέλα στο ρινγκ, η διαφορά είναι ότι δεν έχετε ιδέα για την ταυτότητα των ανταγωνιστών.

Γράφετε μια προτροπή, αποστέλλεται σε δύο ανώνυμα μοντέλα και αφού εμφανιστεί η απάντηση, πρέπει να καθορίσετε ποια είναι η καλύτερη απόκριση από τα δύο.

Μόνο το υποκείμενο σύστημα γνωρίζει ποιο μοντέλο κέρδισε κάθε γύρο και οι συλλογικές ανθρώπινες αποφάσεις χρησιμοποιούνται για τη δημιουργία του leaderboard. Μέχρι στιγμής έχουν ψηφιστεί πάνω από 200.000 ψήφοι.

Σύρετε για οριζόντια κύλιση
LMSys Chatboat Arena leaderboard
Τάξη Μοντέλο Οργάνωση Αδεια
1 GPT-4 Turbo OpenAI Ιδιόκτητος
2 Bard (Gemini Pro) Google Ιδιόκτητος
3 GPT-4-0314 OpenAI Ιδιόκτητος
4 GPT-4-0613 OpenAI Ιδιόκτητος
5 Mistral Medium Mistral Ιδιόκτητος
6 Claude-1 Ανθρωπικό Ιδιόκτητος
7 Claude-2,0 Ανθρωπικό Ιδιόκτητος
8 Mixtral-8x7b Mistral Apache 2.0
9 Gemini Pro (API προγραμματιστών) Google Ιδιόκτητος
10 Claude 2.1 Ανθρωπικό Ιδιόκτητος

Πώς συγκρίνεται ο Bard με τον ανταγωνισμό;

Το Gemini Pro από μόνο του, ως API και όχι μέρος του Bard με ζωντανή πρόσβαση στο Διαδίκτυο βρίσκεται στο νούμερο 9 και μια παλαιότερη έκδοση του Gemini Pro βρίσκεται στο νούμερο 12 του τρέχοντος leaderboard.

Ενώ ο Bard with Gemini Pro έχει μπει δυνατά στο νούμερο δύο, τρεις από τις πέντε κορυφαίες είναι όλες οι εκδόσεις του μοντέλου GPT-4 του OpenAI με το GPT-4-Turbo να καταλαμβάνει την πρώτη θέση.

Εννέα από τα δέκα κορυφαία μοντέλα είναι ιδιόκτητα, με το Mixtra-8x7b της γαλλικής startup Mistral’s το μόνο ανοιχτού κώδικα μεγάλης γλώσσας μοντέλο στην επάνω περιοχή του πίνακα.

Το Anthropic’s Claude και το Mistral’s Mistral Medium, μια ιδιόκτητη έκδοση του μοντέλου Mixtral, είναι τα μόνα μοντέλα εκτός Google ή OpenAI στην πρώτη δεκάδα.

Τι νέο υπάρχει με το Google Bard;


Δείτε περισσότερα

Σύμφωνα με τον Jeff Dean Bard «τροφοδοτείται τώρα από το μοντέλο Gemini Pro-scale, μια ενημέρωση στη βασική έκδοση του Gemini Pro και αυτή η αλλαγή του επέτρεψε να μπει στο νούμερο δύο. Αυτό εξακολουθεί να βασίζεται στην έκδοση μεσαίου επιπέδου της οικογένειας LLMs Gemini.

Η Google λέγεται ότι θα κυκλοφορήσει το Gemini Ultra, το πιο προηγμένο και εγγενώς πολυτροπικό μοντέλο της κάποια στιγμή φέτος.

Αυτό θα τροφοδοτήσει μια νέα premium έκδοση του chatbot του που ονομάζεται Bard Advanced και, πιθανότατα, θα ξεπεράσει σημαντικά το event GPT-4-Turbo.

Ο Dean έγραψε στο X: «Ο αγώνας θερμαίνεται όσο ποτέ άλλοτε! Πολύ ενθουσιασμένος που θα δούμε τι θα ακολουθήσει για την κυκλοφορία του Bard + Gemini Ultra.”


Περισσότερα από το Tom’s Guide

Βέλος

Επιστροφή στους φορητούς υπολογιστές Ultrabook


Βέλος


Φορτώστε περισσότερες προσφορές


VIA:

TomsGuide.com


Follow TechWar.gr on Google News