Το Gemini 1.5 γίνεται επίσημο, έχει ένα καλύτερο και πιο εκτεταμένο παράθυρο περιβάλλοντος, συγκρίσιμη απόδοση με το Gemini 1.0 Ultra
Έχουν περάσει μόνο μερικοί μήνες από τότε που η Google κυκλοφόρησε το Gemini 1.0 και τώρα, η εταιρεία προχώρησε και ανακοίνωσε το Gemini 1.5 — το μοντέλο επόμενης γενιάς που έχει “δραματικά βελτιωμένη απόδοση”. Η Google ισχυρίζεται ότι ένα από τα καλύτερα πράγματα σχετικά με τη νέα ενημέρωση είναι ότι θα προσφέρει ένα πολύ μεγαλύτερο παράθυρο περιβάλλοντος, οπότε αν είστε σαν εμένα και σας αρέσει να χρησιμοποιείτε το chatbot, τότε αυτό είναι σίγουρα κάτι που θα σας ενδιαφέρει.
Η ικανότητα του Gemini 1.5 δείχνει ότι η Google δεν μπλέκει στον αγώνα για να γίνει μια από τις καλύτερες εταιρείες με τεχνητή νοημοσύνη
Εδώ είναι τι έχει να πει η Google για το Gemini 1.5,
Το «παράθυρο περιβάλλοντος» ενός μοντέλου τεχνητής νοημοσύνης αποτελείται από διακριτικά, τα οποία είναι τα δομικά στοιχεία που χρησιμοποιούνται για την επεξεργασία πληροφοριών. Τα διακριτικά μπορεί να είναι ολόκληρα μέρη ή υποενότητες λέξεων, εικόνων, βίντεο, ήχου ή κώδικα. Όσο μεγαλύτερο είναι το παράθυρο περιβάλλοντος ενός μοντέλου, τόσο περισσότερες πληροφορίες μπορεί να λάβει και να επεξεργαστεί σε μια δεδομένη προτροπή – καθιστώντας το αποτέλεσμα πιο συνεπές, σχετικό και χρήσιμο.
Αξίζει επίσης να σημειωθεί ότι το Gemini 1.5 Pro εξακολουθεί να είναι η μεσαία προσφορά της Google και το τυπικό παράθυρο περιβάλλοντος που προσφέρει είναι 128.000 μάρκες. Για λόγους σύγκρισης, η παλαιότερη έκδοση έχει 32.000 μάρκες. Η νέα ενημέρωση μπορεί να μεταφράσει περισσότερες από 700.000 λέξεις, καθώς και βάσεις κωδικών με περισσότερες από 30.000 γραμμές κώδικα, 11 ώρες ήχου και 1 ώρα βίντεο. Το GPT-4 turbo προσφέρει επίσης 128,00 μάρκες. Συγκριτικά, έχουμε το Claude 2.1, το οποίο προσφέρει 200.000 μάρκες. Αν αναρωτιέστε πώς θα λειτουργήσει η νέα ενημέρωση, εδώ είναι μια εξήγηση που έδωσε η Google.
«1.5 Pro μπορεί
αναλύει απρόσκοπτα, ταξινομεί και συνοψίζει μεγάλες ποσότητες περιεχομένου
μέσα σε μια δεδομένη προτροπή. Για παράδειγμα, όταν δοθούν οι μεταγραφές 402 σελίδων από την αποστολή του Apollo 11 στη Σελήνη, μπορεί να αιτιολογήσει συζητήσεις, συμβάντα και λεπτομέρειες που βρίσκονται στο έγγραφο.»
Επιπλέον, εδώ είναι περισσότερα που μπορεί να κάνει το Gemini 1.5 Pro.
«1.5 Pro μπορεί
εκτελούν εξαιρετικά εξελιγμένες εργασίες κατανόησης και συλλογισμού για διαφορετικούς τρόπους, συμπεριλαμβανομένου του βίντεο
. Για παράδειγμα, όταν δίνεται 44 λεπτά σιωπής
Την ταινία Buster Keaton
το μοντέλο μπορεί να αναλύσει με ακρίβεια διάφορα σημεία πλοκής και γεγονότα, ακόμη και να αιτιολογήσει μικρές λεπτομέρειες στην ταινία που θα μπορούσαν εύκολα να χαθούν.”
Προχωρώντας περαιτέρω, Gemini 15 Pro:
μπορώ
εκτελούν πιο σχετικές εργασίες επίλυσης προβλημάτων σε μεγαλύτερα μπλοκ κώδικα
. Όταν δίνεται μια προτροπή με περισσότερες από 100.000 γραμμές κώδικα, μπορεί να εξηγήσει καλύτερα παραδείγματα, να προτείνει χρήσιμες τροποποιήσεις και να δώσει εξηγήσεις σχετικά με τον τρόπο λειτουργίας των διαφορετικών τμημάτων του κώδικα.
Ένα άλλο πράγμα που πρέπει να σημειωθεί εδώ είναι ότι η Google εκτελεί έως και 1 εκατομμύριο μάρκες σε παραγωγή και αυτά θα είναι διαθέσιμα στους πρώτους δοκιμαστές. Ταυτόχρονα, η εταιρεία έχει δοκιμάσει με επιτυχία πάνω από 10 εκατομμύρια μάρκες. Αυτό δείχνει ότι το Gemini 1.5 και οι μελλοντικές ενημερώσεις δεν πρόκειται να επιβραδυνθούν.
Η Google ισχυρίζεται ότι όλες αυτές οι προόδους του Gemini 1.5 γίνονται πιθανώς χρησιμοποιώντας τη νέα αρχιτεκτονική Mixture-of-Experts MoE όπου τα μοντέλα «διαιρούνται σε μικρότερα «ειδικά» νευρωνικά δίκτυα». Και χάρη σε αυτό, η νέα ενημέρωση είναι πιο αποτελεσματική τόσο στην εκπαίδευση όσο και στην εξυπηρέτηση.
Ανάλογα με τον τύπο της εισόδου που δίνεται, τα μοντέλα MoE μαθαίνουν να ενεργοποιούν επιλεκτικά μόνο τις πιο σχετικές οδούς εμπειρογνωμόνων στο νευρωνικό τους δίκτυο. Αυτή η εξειδίκευση ενισχύει μαζικά την αποτελεσματικότητα του μοντέλου.
Όσον αφορά την απόδοση, η google ισχυρίζεται ότι το Gemini 1.5 Pro μπορεί να ξεπεράσει την παλαιότερη έκδοση στο 87% των σημείων αναφοράς, που εκτείνονται σε διάφορα πεδία, συμπεριλαμβανομένων των αξιολογήσεων κειμένου, κώδικα, εικόνας, ήχου και βίντεο. Η Google ισχυρίζεται περαιτέρω ότι, αυτή τη στιγμή, η απόδοση είναι συγκρίσιμη με το 1.0 Ultra.
Το Gemini 1.5 Pro δείχνει επίσης εντυπωσιακές δεξιότητες “εκμάθησης εντός του πλαισίου”, που σημαίνει ότι μπορεί να μάθει μια νέα δεξιότητα από πληροφορίες που δίνονται σε μια μεγάλη προτροπή, χωρίς να χρειάζεται πρόσθετη λεπτομέρεια.
Δυστυχώς, θα πρέπει να περιμένετε για να ξεκινήσετε με το Gemini 1.5 Pro, καθώς η Google ισχυρίζεται ότι το μεγαλύτερο παράθυρο περιβάλλοντος είναι επί του παρόντος σε περιορισμένη χωρητικότητα για τους προγραμματιστές και τους εταιρικούς πελάτες. Στην τρέχουσα φάση του, εξακολουθεί να είναι πειραματικό, επομένως ίσως χρειαστεί να περιμένετε λίγο ακόμα πριν είναι διαθέσιμο σε όλους.
Σύντομα, σχεδιάζουμε να εισαγάγουμε επίπεδα τιμολόγησης που ξεκινούν από το τυπικό παράθυρο περιβάλλοντος των 128.000 και κλιμακώνονται έως και 1 εκατομμύριο μάρκες, καθώς βελτιώνουμε το μοντέλο.
Είναι ασφαλές να πούμε ότι το Gemini 1.5 Pro θα κάνει πάταγο μόλις είναι διαθέσιμο σε όλους. Χαίρομαι πολύ που η Google εργάζεται συνεχώς για τη βελτίωση του μοντέλου AI της. Ακόμα κι αν όλοι μας δεν έχουμε πρόσβαση σε αυτό, χαίρομαι που κυκλοφορεί και θα είναι διαθέσιμο σε όλους μας πολύ σύντομα στο μέλλον.
Πηγή ειδήσεων:
Ιστολόγιο Google
VIA:
wccftech.com


