Η Google ανακοινώνει το Gemini 1.5, μια εντυπωσιακή αναβάθμιση στο κορυφαίο μοντέλο τεχνητής νοημοσύνης της

By

Marizas Dimitris

On

Φεβ 16, 2024

Η Google μόλις ανακοίνωσε (αλλά δεν κυκλοφόρησε) το

Gemini

1.5,

μι

α ενημέρωση στο μοντέλο της ναυαρχίδας της γλώσσας — το μοντέλο που χρησιμοποιήθηκε στο chatbot κάποτε γνωστό ως Bard, αλλά μετονομάστηκε συνεργικά σε Gemini πριν από μια εβδομάδα.

Ο μεγάλος ισχυρισμός με αυτήν την έκδοση είναι “μια σημαντική ανακάλυψη στην κατανόηση του μακροπρόθεσμου πλαισίου μεταξύ των τρόπων”. Προορίζεται επίσης να είναι ένα βήμα προς τα πάνω από την άποψη της απόδοσης, αφού έχει κατασκευαστεί σε έναν τύπο αρχιτεκτονικής γνωστό ως “Mixture-of-Experts (MoE),” που σημαίνει απόδοση που υποτίθεται ότι μοιάζει με το Gemini 1.0, αλλά βασίζεται σε λιγότερες GPU που διψούν για ηλεκτρισμό αποσπώντας τη μίζα για να το πετύχετε.

Αυτός ο πρώτος ισχυρός ισχυρισμός σχετικά με την πολυτροπική κατανόηση “μεγάλου πλαισίου” είναι όσο ορατότητα και αν ακούγεται, αλλά ο συνιδρυτής του Google Deepmind δημοσίευσε ένα demo στο X με σκοπό να δείξει τι σημαίνει αυτό στην πράξη.

Το tweet μπορεί να έχει διαγραφεί

Χρησιμοποιώντας έξυπνα ένα μεγάλο κομμάτι κειμένου

δημόσιο

υ τομέα που δεν θα κατατάξει κανέναν κολλητή πνευματικών δικαιωμάτων – σε αυτήν την περίπτωση μια μεταγραφή 402 σελίδων της αποστολής της NASA που προσγειώθηκε στο φεγγάρι – το LLM είναι σε θέση να περιορίσει την εστίασή του σε αυτό που χρειάζεται ο χρήστης (“πλαίσιο”) παρά το γεγονός ότι η προτροπή είναι απολύτως γιγαντιαία (“μακρύ”), οπότε προφανώς αυτό σημαίνει “μακροχρόνιο πλαίσιο”.

Στο demo, το Gemini 1.5 μπορεί να ξεχωρίσει τρεις διασκεδαστικές στιγμές από το μυθιστόρημα μήκους κειμένου. Είναι επίσης σε θέση να εντοπίσει το γεγονός στη μεταγραφή που ταιριάζει με μια εικόνα μιας σεληνιακής μπότας – το μέρος όπου, ξέρετε, ο Νιλ Άρμστρονγκ περπατά στο φεγγάρι – το οποίο διευκρινίζει τι σημαίνει “πολυτροπικός” σε αυτό το πλαίσιο: μοντέλο αναγνώρισης εικόνας που λειτουργεί χέρι-χέρι με το LLM.

ΔΕΙΤΕ ΕΠΙΣΗΣ:

Η σειρά Samsung Galaxy S24 έρχεται με το μοντέλο Gemini AI της Google

Αυτή η αναβάθμιση αποτελεί μέρος μιας συνεχιζόμενης προσπάθειας για να παραμείνει η Google στη συνομιλία της τεχνητής νοημοσύνης, αφού το

OpenAI

έφαγε το γεύμα όλων με τεχνητή νοημοσύνη το 2022, κυκλοφόρησε το ChatGPT. Στα τέλη του περασμένου έτους, η Google άρχισε να διαφημίζει σοβαρά τις αλλαγές που θα έρθουν με τον Bard και το μοντέλο που το τροφοδοτεί, το οποίο παραμένει επίσης ένα μοντέλο μεγάλης γλώσσας, περισσότερο γνωστό για την ενσωμάτωση των παπουτσιών στα δημοφιλή προϊόντα Google και Android παρά για χρήση όπως το ChatGPT για την επίλυση της ημέρας- σημερινά προβλήματα και τα μυαλά σε κοκτέιλ πάρτι. Συγκεκριμένα, μια ερευνητική εργασία τον Δεκέμβριο του 2023 ανέδειξε μια έκδοση του Gemini που είχε ξεπεράσει την απόδοση του μοντέλου GPT-4 του OpenAI σε ορισμένες περιπτώσεις και έγινε το πρώτο LLM που έλαβε επιτυχή βαθμολογία σε ένα συγκεκριμένο τεστ AI του “

Multitask Language Understanding ” ή MLU

.

Μεταξύ άλλων ισχυρισμών σχετικά με το Gemini 1.5, η Google λέει ότι το νέο μοντέλο μπορεί να συνθλίψει μεγάλα σύνολα δεδομένων με εντυπωσιακή ακρίβεια και – σε έναν κάπως πιο εντυπωσιακό ισχυρισμό – να αποδώσει καλά σε

αιτιολογία

σε όλους τους τύπους δεδομένων. Η συλλογιστική είναι η πιο διάσημη αδυναμία μεταξύ των περισσότερων LLM.

Σύμφωνα με τον CEO Sundar Pichai, η Google κυκλοφορεί το Gemini 1.5 σε μια περιορισμένη ομάδα. “Είμαστε ενθουσιασμένοι που προσφέρουμε μια περιορισμένη προεπισκόπηση αυτής της πειραματικής λειτουργίας σε προγραμματιστές και εταιρικούς πελάτες”, έγραψε ο Pichai στην ανάρτηση ιστολογίου της Google.

Η ευρύτερη βάση των χρηστών Gemini θα είναι ο απόλυτος κριτής των ισχυρισμών απόδοσης της Google, όταν θα τους επιτραπεί πραγματικά να δοκιμάσουν το Gemini 1.5 ως μέρος ενός επίσημου προϊόντος που κυκλοφόρησε. Κυκλοφόρησε το πιο ισχυρό μοντέλο της Google, το Gemini Ultra

πριν από μία εβδομάδα

οπότε μπορεί να περάσει λίγος καιρός, και είναι πιθανώς ασφαλές να υποθέσουμε ότι το Gemini 1.5, θα αποτελέσει μια μέρα μέρος του νέου premium — με άλλα λόγια «επί πληρωμή» — πακέτου προϊόντων Workspace της Google που ονομάζεται

Google One AI Premium

.

Θέματα

Τεχνητή Νοημοσύνη Google

VIA:

mashable.com

Η Google ανακοινώνει το Gemini 1.5, μια εντυπωσιακή αναβάθμιση στο κορυφαίο μοντέλο τεχνητής νοημοσύνης της

Απάντηση Ακύρωση απάντησης

Απάντηση

Ακύρωση απάντησης