Η Google κυκλοφόρησε μια προεπισκόπηση μιας σημαντικής νέας έκδοσης του
μοντέλο
υ της σε μεγάλη
γλώσσα
Gemini αυτή την εβδομάδα για να τη καταστήσει διαθέσιμη για πρώιμες δοκιμές, και εάν οι ισχυρισμοί της εταιρείας είναι αληθινοί, αυτό θα μπορούσε να είναι το πιο ικανό LLM που έχουμε δει μέχρι τώρα.
Το λέω επειδή η Google ισχυρίζεται ότι αυτή η νέα έκδοση, το Google Gemini 1.5, είναι πιο αποτελεσματική από την προκάτοχό της και πιο ικανή για “κατανόηση μακροπρόθεσμου πλαισίου”, με ένα πιθανό παράθυρο περιβάλλοντος έως και 1 εκατομμυρίου διακριτικών.
Αυτός είναι ένας τεχνικός τρόπος μέτρησης του πόσα μπορεί να καταλάβει ένα μοντέλο προτού φτάσει σε ένα όριο, και είναι πολύ σημαντικό που η Google ισχυρίζεται ότι το Gemini 1.5 μπορεί να χειριστεί έως και 1 εκατομμύριο μάρκες — για να το θέσουμε σε προοπτική, το Gemini 1.0 είχε ένα παράθυρο περιβάλλοντος 32.000 μάρκες.
Σε αυτό το διάγραμμα η Google απεικονίζει τον τρόπο με τον οποίο το παράθυρο περιβάλλοντος 1M token του Gemini 1.5 συγκρίνεται με τα σύγχρονα LLMs όπως το Claude 2.1 της Anthropic και το ChatGPT-4 Turbo του OpenAI.
(Πίστωση εικόνας: Google)
Ανταγωνιστές όπως το ChatGPT Plus και το
Microsoft Copilot
, που τρέχουν επί του παρόντος στο
GPT-4 Turbo
LLM του OpenAI, έχουν παράθυρα περιβάλλοντος έως και 128.000 μάρκες. Επομένως, το γεγονός ότι η Google ισχυρίζεται ότι το Gemini 1.5 μπορεί να κατανοήσει έως και 1 εκατομμύριο μάρκες είναι μια σημαντική
αναβάθμιση
.
Σύμφωνα με την Google, ένα παράθυρο περιβάλλοντος 1 εκατομμυρίου token επιτρέπει στο Gemini 1.5 να κατανοεί έως και μία ώρα βίντεο, 11 ώρες ήχου, περισσότερες από 700.000 λέξεις (έτσι μπορεί να διαβάσει, να αφομοιώσει και να απαντήσει σε ερωτήσεις σχετικά με το Πόλεμος και Ειρήνη του Τολστόι) ή περισσότερες από 30.000 γραμμές του κώδικα. Με λίγα λόγια, είναι μια μεγάλη αναβάθμιση.
Ωστόσο, είναι σημαντικό να σημειωθεί ότι δεν θα έχουν όλοι όσοι χρησιμοποιούν το Google Gemini 1.5 πρόσβαση στο πλήρες παράθυρο περιβάλλοντος 1 εκατομμυρίου διακριτικών, τώρα ή κατά την κυκλοφορία.
Σύμφωνα με μια Google
ανάρτηση
που δημοσιεύτηκε σήμερα (15 Φεβρουαρίου), η εταιρεία δίνει σε μια περιορισμένη ομάδα προγραμματιστών και επιχειρηματικών πελατών έγκαιρη πρόσβαση στο Gemini 1.5 και το πλήρες παράθυρο διακριτικών 1M (μέσω των πλατφορμών προγραμματιστών AI Studio και Vertex AI), ώστε να μπορούν να το χτυπήσουν και να δουν τι υπάρχει δυνατόν.
Αλλά η Google λέει ότι οι υπόλοιποι από εμάς θα πρέπει να περιμένουμε λίγο για την επίσημη κυκλοφορία του Gemini 1.5 Pro. Και όταν φτάσει, το βασικό επίπεδο θα περιοριστεί στο πιο τυπικό παράθυρο 128.000 token για την αγορά. Η Google λέει ότι σχεδιάζει να «εισαγάγει επίπεδα τιμολόγησης» που θα κλιμακώνονται μέχρι το όριο του 1 εκατομμυρίου συμβολαίων, οπότε αν θέλετε να παίξετε με μια τεχνητή νοημοσύνη που μπορεί να παρακολουθήσει και να κατανοήσει μια ολόκληρη ταινία Buster Keaton (δείτε το παραπάνω κλιπ) να είστε έτοιμοι να πληρώσετε.
Περισσότερα από το Tom’s Guide
VIA:
TomsGuide.com

