Η Google ανακοινώνει το Gemini 1.5, μια εντυπωσιακή αναβάθμιση στο κορυφαίο μοντέλο τεχνητής νοημοσύνης της
Η Google μόλις ανακοίνωσε (αλλά δεν κυκλοφόρησε) το
Gemini
1.5,
μι
α ενημέρωση στο μοντέλο της ναυαρχίδας της γλώσσας — το μοντέλο που χρησιμοποιήθηκε στο chatbot κάποτε γνωστό ως Bard, αλλά μετονομάστηκε συνεργικά σε Gemini πριν από μια εβδομάδα.
Ο μεγάλος ισχυρισμός με αυτήν την έκδοση είναι “μια σημαντική ανακάλυψη στην κατανόηση του μακροπρόθεσμου πλαισίου μεταξύ των τρόπων”. Προορίζεται επίσης να είναι ένα βήμα προς τα πάνω από την άποψη της απόδοσης, αφού έχει κατασκευαστεί σε έναν τύπο αρχιτεκτονικής γνωστό ως “Mixture-of-Experts (MoE),” που σημαίνει απόδοση που υποτίθεται ότι μοιάζει με το Gemini 1.0, αλλά βασίζεται σε λιγότερες GPU που διψούν για ηλεκτρισμό αποσπώντας τη μίζα για να το πετύχετε.
Αυτός ο πρώτος ισχυρός ισχυρισμός σχετικά με την πολυτροπική κατανόηση “μεγάλου πλαισίου” είναι όσο ορατότητα και αν ακούγεται, αλλά ο συνιδρυτής του Google Deepmind δημοσίευσε ένα demo στο X με σκοπό να δείξει τι σημαίνει αυτό στην πράξη.
Το tweet μπορεί να έχει διαγραφεί
Χρησιμοποιώντας έξυπνα ένα μεγάλο κομμάτι κειμένου
δημόσιο
υ τομέα που δεν θα κατατάξει κανέναν κολλητή πνευματικών δικαιωμάτων – σε αυτήν την περίπτωση μια μεταγραφή 402 σελίδων της αποστολής της NASA που προσγειώθηκε στο φεγγάρι – το LLM είναι σε θέση να περιορίσει την εστίασή του σε αυτό που χρειάζεται ο χρήστης (“πλαίσιο”) παρά το γεγονός ότι η προτροπή είναι απολύτως γιγαντιαία (“μακρύ”), οπότε προφανώς αυτό σημαίνει “μακροχρόνιο πλαίσιο”.
Στο demo, το Gemini 1.5 μπορεί να ξεχωρίσει τρεις διασκεδαστικές στιγμές από το μυθιστόρημα μήκους κειμένου. Είναι επίσης σε θέση να εντοπίσει το γεγονός στη μεταγραφή που ταιριάζει με μια εικόνα μιας σεληνιακής μπότας – το μέρος όπου, ξέρετε, ο Νιλ Άρμστρονγκ περπατά στο φεγγάρι – το οποίο διευκρινίζει τι σημαίνει “πολυτροπικός” σε αυτό το πλαίσιο: μοντέλο αναγνώρισης εικόνας που λειτουργεί χέρι-χέρι με το LLM.
ΔΕΙΤΕ ΕΠΙΣΗΣ:
Η σειρά Samsung Galaxy S24 έρχεται με το μοντέλο Gemini AI της Google
Αυτή η αναβάθμιση αποτελεί μέρος μιας συνεχιζόμενης προσπάθειας για να παραμείνει η Google στη συνομιλία της τεχνητής νοημοσύνης, αφού το
OpenAI
έφαγε το γεύμα όλων με τεχνητή νοημοσύνη το 2022, κυκλοφόρησε το ChatGPT. Στα τέλη του περασμένου έτους, η Google άρχισε να διαφημίζει σοβαρά τις αλλαγές που θα έρθουν με τον Bard και το μοντέλο που το τροφοδοτεί, το οποίο παραμένει επίσης ένα μοντέλο μεγάλης γλώσσας, περισσότερο γνωστό για την ενσωμάτωση των παπουτσιών στα δημοφιλή προϊόντα Google και Android παρά για χρήση όπως το ChatGPT για την επίλυση της ημέρας- σημερινά προβλήματα και τα μυαλά σε κοκτέιλ πάρτι. Συγκεκριμένα, μια ερευνητική εργασία τον Δεκέμβριο του 2023 ανέδειξε μια έκδοση του Gemini που είχε ξεπεράσει την απόδοση του μοντέλου GPT-4 του OpenAI σε ορισμένες περιπτώσεις και έγινε το πρώτο LLM που έλαβε επιτυχή βαθμολογία σε ένα συγκεκριμένο τεστ AI του “
Multitask Language Understanding ” ή MLU
.
Μεταξύ άλλων ισχυρισμών σχετικά με το Gemini 1.5, η Google λέει ότι το νέο μοντέλο μπορεί να συνθλίψει μεγάλα σύνολα δεδομένων με εντυπωσιακή ακρίβεια και – σε έναν κάπως πιο εντυπωσιακό ισχυρισμό – να αποδώσει καλά σε
αιτιολογία
σε όλους τους τύπους δεδομένων. Η συλλογιστική είναι η πιο διάσημη αδυναμία μεταξύ των περισσότερων LLM.
Σύμφωνα με τον CEO Sundar Pichai, η Google κυκλοφορεί το Gemini 1.5 σε μια περιορισμένη ομάδα. “Είμαστε ενθουσιασμένοι που προσφέρουμε μια περιορισμένη προεπισκόπηση αυτής της πειραματικής λειτουργίας σε προγραμματιστές και εταιρικούς πελάτες”, έγραψε ο Pichai στην ανάρτηση ιστολογίου της Google.
Η ευρύτερη βάση των χρηστών Gemini θα είναι ο απόλυτος κριτής των ισχυρισμών απόδοσης της Google, όταν θα τους επιτραπεί πραγματικά να δοκιμάσουν το Gemini 1.5 ως μέρος ενός επίσημου προϊόντος που κυκλοφόρησε. Κυκλοφόρησε το πιο ισχυρό μοντέλο της Google, το Gemini Ultra
πριν από μία εβδομάδα
οπότε μπορεί να περάσει λίγος καιρός, και είναι πιθανώς ασφαλές να υποθέσουμε ότι το Gemini 1.5, θα αποτελέσει μια μέρα μέρος του νέου premium — με άλλα λόγια «επί πληρωμή» — πακέτου προϊόντων Workspace της Google που ονομάζεται
Google One AI Premium
.
Θέματα
Τεχνητή Νοημοσύνη Google
VIA:
mashable.com

