Αρχική






news





Το Google Gemini αναλύεται – The Verge

Το Google Gemini αναλύεται – The Verge





Η τεχνητή νοημοσύνη έχει γίνει η φετινή τεχνολογία θαύμα. Αλλά επειδή έρχεται σε πολλές διαφορετικές γεύσεις από πολλές διαφορετικές εταιρείες, μπορεί να είναι

Πραγματικά

μπερδεμένος. Δεν έχετε μόνο το

ChatGPT που δημιουργήθηκε από την OpenAI, αλλά έχετε τα τρία μεγάλα — Google, Apple και Microsoft — να μαγειρεύουν τις δικές τους εκδόσεις.

Η τελευταία απόπειρα της Google ονομάζεται Gemini και δεν είναι λιγότερο μπερδεμένη από τις άλλες.


Όταν άρχισα να ερευνώ για πρώτη φορά το Gemini, έκανα μια αναζήτηση στο Google για “εκδόσεις του Google Gemini”. Πέρα από την αναζήτηση, έλαβα μια σύνοψη που δημιουργήθηκε από AI που ξεκίνησε:

«Το Google Gemini έχει τρεις εκδόσεις: Ultra, Pro και Nano. Το Ultra είναι το μεγαλύτερο

και έχει σχεδιαστεί για σύνθετες εργασίες, ενώ το Pro είναι το καλύτερο μοντέλο για την κλιμάκωση σε ένα ευρύ φάσμα εργασιών και το Nano είναι το πιο αποτελεσματικό μοντέλο για εργασίες στη συσκευή».

Εντάξει, αρκετά καλό. Αλλά δεν είναι η πλήρης ιστορία.

Τι είναι ο Δίδυμος;

Ο Δίδυμος είναι το τρίτο ζώδιο, που σχετίζεται με τα δίδυμα Κάστορα και Πόλοξ από την ελληνική μυθολογία.

Εντάξει συγγνώμη. Δεν μπόρεσα να αντισταθώ. Το Gemini είναι ένα

που δημιουργήθηκε από την Google και έχει αντικαταστήσει το προηγούμενο chatbot που ονομάζεται Bard. Βασίζεται σε κάτι που ονομάζεται μοντέλο μεγάλων γλωσσών (ή LLM), που ονομάζεται επίσης Gemini, το οποίο αναπτύχθηκε από την DeepMind, μέρος της Google.


Προκαλώντας σύγχυση, το Gemini είναι ταυτόχρονα chatbox και LLM.


Στιγμιότυπο οθόνης: Google

Ο Δίδυμος λοιπόν είναι και τα δύο chatbox

και

ένα LLM; Πόσοι τύποι Διδύμων υπάρχουν;

Πόσο χρόνο έχεις? Σοβαρά, όμως, θα περιοριστούμε στους τύπους Διδύμων που μπορεί να συναντήσετε επειδή ο αριθμός των επαναλήψεων είναι ατελείωτος.

Αρχικά, όταν παρουσιάστηκε τον Δεκέμβριο του 2023, το Gemini πρόσφερε τρεις διαφορετικές εκδόσεις (γνωστές ως μοντέλα): Nano ως ελαφριά έκδοση Android, Pro για καθημερινή χρήση και Ultra για βαριά επαγγελματική / επιχειρηματική χρήση.

Στη συνέχεια, στις 14 Μαΐου, κατά τη διάρκεια της εκδήλωσης I/O 2024, η Google παρουσίασε το Gemini 1.5 Pro, το πρώτο σε αυτό που η εταιρεία αποκάλεσε «μεσαίου μεγέθους πολυτροπικό μοντέλο». Σύμφωνα με την Google, η νέα έκδοση του Pro είναι σχεδόν εξίσου ισχυρή με την προηγούμενη έκδοση Ultra και έχει σκοπό να βελτιώσει τις υπάρχουσες εφαρμογές και να δημιουργήσει νέες για καθημερινή χρήση.

Περίμενε. Πολυτροπικό;

Με άλλα λόγια, μπορεί να δέχεται προτροπές σε όλους τους διαφορετικούς τρόπους επικοινωνίας: κείμενο, εικόνες, ήχο και βίντεο.

Αυτά λοιπόν για τα μοντέλα, σωστά;

Λοιπόν, όχι ακριβώς. Υπάρχει επίσης το Gemini 1.5 Flash, το οποίο είναι μια πιο γρήγορη έκδοση του Gemini για προγραμματιστές που θα μπορούν να το χρησιμοποιούν σε συγκεκριμένες εφαρμογές. Με άλλα λόγια, εκτός και αν είστε προγραμματιστής, δεν είναι κάτι με το οποίο θα συνεργαστείτε.

Έτσι, για να επαναλάβουμε, τώρα έχουμε τέσσερα μοντέλα Gemini για να συνεργαστούν οι προγραμματιστές: Ultra, Pro, Flash και Nano. (Θα σας πούμε πώς μπορείτε να παίξετε με αυτό μόνοι σας σε λίγο.)

Παρακολούθησα την εκδήλωση της Google και συνέχισαν να μιλούν για 1 εκατομμύριο μάρκες, 2 εκατομμύρια μάρκες. Τι ήταν αυτό;

Αυτό λαμβάνετε όταν παρακολουθείτε μια εκδήλωση που προορίζεται περισσότερο για προγραμματιστές παρά για καθημερινούς ανθρώπους σαν εμάς. Αλλά στην πραγματικότητα δεν είναι τόσο δύσκολο.

Τα διακριτικά είναι τα στοιχεία των λέξεων που χρησιμοποιούνται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης όπως το Gemini. Όσο περισσότερα διακριτικά είναι ικανό ένα μοντέλο AI, τόσο περισσότερες πληροφορίες μπορείτε να τροφοδοτήσετε το AI και τόσο καλύτερα θα καταλάβει τι χρειάζεστε και τι μπορεί να σας δώσει.

Εντάξει, πίσω στο Gemini 1.5 Pro. Τι μπορώ να το κάνω;

Λοιπόν, εάν είστε προγραμματιστής, μπορείτε να το χρησιμοποιήσετε για να προσθέσετε ή να δημιουργήσετε μια δέσμη νέων εφαρμογών. Διαφορετικά, η Google το προσθέτει σε πολλές από τις υπάρχουσες εφαρμογές της και δημιουργεί νέες.

Αρέσει?

Λοιπόν, για παράδειγμα, ας ξεκινήσουμε με το

. Μια

που αναμένεται αυτό το καλοκαίρι, που ονομάζεται Ask Photos, θα σας επιτρέψει να κάνετε αναζήτηση χρησιμοποιώντας πιο σύνθετα ερωτήματα. Αντί να βρίσκετε απλώς όλες τις φωτογραφίες της γιαγιάς σας, για παράδειγμα, θα πρέπει να μπορείτε να της ζητήσετε «Βρείτε όλες τις φωτογραφίες της γιαγιάς μου όλα αυτά τα χρόνια που την δείχνουν να εργάζεται στα ξυλουργικά της έργα».

Υπάρχει επίσης η υπάρχουσα εφαρμογή Lens, η οποία χρησιμοποιεί κείμενο και φωτογραφίες για να σας βοηθήσει να εντοπίσετε και να ερευνήσετε πράγματα. Το Lens θα μπορεί πλέον να βρίσκει πληροφορίες και χρησιμοποιώντας βίντεο. Η Google το απέδειξε τραβώντας ένα βίντεο με ένα πικάπ που δεν συμπεριφέρεται σωστά και χρησιμοποιώντας ένα βίντεο για να ανακαλύψει γιατί το τονικό βραχίονα δεν έρχεται σε επαφή με το δίσκο.

Γνωρίζετε αυτήν την πλαϊνή γραμμή στα Έγγραφα Google, τα Υπολογιστικά φύλλα, τις Παρουσιάσεις, το Drive και το Gmail; Αυτό όπου μπορείτε πλέον να έχετε πρόσβαση σε διάφορες άλλες εφαρμογές Google; Λοιπόν, θα το αναλάβει ο Gemini, ο οποίος θα χρησιμοποιηθεί για την ενοποίηση — ή, τουλάχιστον, για τη σύνδεση — μιας ποικιλίας εφαρμογών Google, ώστε να μπορείτε, ας πούμε, να αναφέρετε εύκολα ένα Έγγραφο Google σε ένα μήνυμα ηλεκτρονικού ταχυδρομείου ή αντίστροφα. Θα πρέπει να κυκλοφορήσει στους συνδρομητές τον επόμενο μήνα.


Επισκοπήσεις AI που εξηγούν τις επισκοπήσεις AI.


Στιγμιότυπο οθόνης: Google

Ακόμη και η βασική αναζήτηση της Google έχει επηρεαστεί: Οι επισκοπήσεις τεχνητής νοημοσύνης οδηγούν πλέον τα αποτελέσματα αναζήτησής σας, δίνοντάς σας μια σύνοψη που δημιουργείται από την τεχνητή νοημοσύνη του τι πιστεύει η Google ότι ψάχνετε. (Αν και υπήρξαν πολλές αντιδράσεις σε αυτό και αρκετοί χρήστες προσπαθούν να το ξεφορτωθούν.)

Αυτές είναι υπάρχουσες εφαρμογές. Τι θα λέγατε για καινούργια;

Πολλά από αυτά. Επί του παρόντος, ορισμένα περιλαμβάνουν:


Έργο Astra

, που είναι ουσιαστικά ο Βοηθός Google με την πρόσθετη δυνατότητα να βλέπεις (μέσω της κάμερας του τηλεφώνου σου) και να ανταποκρίνεται σε και με την προφορική γλώσσα. Αυτό είναι ακόμα στις πρώτες του μέρες, οπότε μάλλον δεν θα το δείτε για λίγο.


LearnLM

, που θα βοηθήσει τους μαθητές να βρουν απαντήσεις στις ερωτήσεις τους χρησιμοποιώντας εκπαιδευτικές πηγές. σύμφωνα με την εταιρεία, έχει ήδη ενσωματωθεί σε ορισμένα προϊόντα και παρουσιάζεται στους εκπαιδευτικούς.


Veo

, ένα «δημιουργικό μοντέλο βίντεο τεχνητής νοημοσύνης». Γεννητικός όπως μέσα θα

δημιουργήστε βίντεο 1080p που του ζητάτε να δημιουργήσει

. Θέλετε ένα βίντεο με μια γάτα που φορά ένα νυχτικό και ένα καπέλο που πηδάει πάνω από τη Σελήνη; Το Veos είναι αυτό που θέλετε να χρησιμοποιήσετε. Λοιπόν, όταν μπορείτε — όπως το Project Astra, είναι ακόμα υπό δοκιμή και δεν θα είναι διαθέσιμο στο ευρύ κοινό για λίγο.

Όλα αυτά ακούγονται ενδιαφέροντα. Πώς μπορώ να εγγραφώ; Και είναι δωρεάν;

Μπορείτε να ξεκινήσετε να εργάζεστε με το chatbot Gemini 1.0

αυτή τη στιγμή και εδώ

. Ωστόσο, αν θέλετε να παίξετε με το Gemini 1.5 Pro — το οποίο είναι πιο γρήγορο και σας δίνει περισσότερες δυνατότητες — θα πρέπει να εγγραφείτε στο

Gemini Advanced

, το οποίο θα κοστίζει 20 $ το μήνα μετά από μια δοκιμή δύο μηνών. (Το Gemini Advanced θεωρείται μέρος μιας συνδρομής στο Google One, επομένως θα λάβετε επίσης 2 TB αποθήκευσης δεδομένων και άλλα προνόμια του Google One.)

Εάν είστε επιχείρηση που χρησιμοποιεί το Google Workspace και θέλετε να δοκιμάσετε τα πιο εξελιγμένα επίπεδα της τεχνητής νοημοσύνης (που ξεκινούν επίσης από 20 $ το μήνα), μπορείτε να βρείτε περισσότερες πληροφορίες

εδώ

.

Κάτι άλλο που πρέπει να ξέρω;

Μόνο οι συνήθεις προφυλάξεις. Όπως όλες οι εφαρμογές τεχνητής νοημοσύνης, οι απαντήσεις του Gemini μπορεί να είναι δυσοίωνες – με άλλα λόγια, εντελώς λάθος. Η τεχνολογία είναι σίγουρα στα πρώτα της στάδια, και έτσι, ενώ μπορεί να είναι ένα χρήσιμο εργαλείο, θα πρέπει επίσης να ελέγξετε τυχόν δεδομένα που λαμβάνετε. Έχει γίνει έτσι ώστε οι λανθασμένες πληροφορίες που δημιουργούνται από κινητήρες τεχνητής νοημοσύνης έχουν το δικό τους όνομα: ψευδαισθήσεις, επειδή με την πρόσβαση σε λάθος πληροφορίες, οι AI δημιουργούν τη δική τους πραγματικότητα. Λοιπόν, αγοραστής προσοχή.


Δεν είναι κακή ιδέα να είστε προσεκτικοί με τις απαντήσεις των Διδύμων.


Στιγμιότυπο οθόνης: Google

Τούτου λεχθέντος, φαίνεται ότι τα AI θα είναι μαζί μας για πολύ καιρό. Δεν είναι κακή ιδέα να κάνετε κάποια πρακτική για να εξοικειωθείτε με αυτά και πώς λειτουργούν. Εκτός από το ChatGPT και το Gemini, υπάρχουν οι επερχόμενοι υπολογιστές CoPilot Plus της Microsoft, οι οποίοι θα διαθέτουν ενσωματωμένο υλικό με δυνατότητα AI, για να μην αναφέρουμε την μόλις ανακοινωθείσα και επερχόμενη σουίτα χαρακτηριστικών της Apple που ονομάζεται Apple Intelligence. Ανάλογα λοιπόν με το αγαπημένο σας λειτουργικό σύστημα, για να μην αναφέρουμε το επίπεδο περιέργειάς σας, μπορείτε να πειραματιστείτε με μια ποικιλία chatbots AI, βελτιωμένες εφαρμογές και άλλες δυνατότητες.

VIA:

theverge.com








Marizas Dimitris


Marizas Dimitris

TechWar.GR — Ειδήσεις Τεχνολογίας, Gadgets, Ψυχαγωγία


Αφοσιωμένος λάτρης κινητών Samsung, ο Δημήτρης έχει εξελίξει μια ιδιαίτερη σχέση με τα προϊόντα της εταιρίας, εκτιμώντας τον σχεδιασμό, την απόδοση και την καινοτομία που προσφέρουν. Γράφοντας και διαβάζοντας τεχνολογικά νέα από όλο τον κόσμο.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ


Ακύρωση απάντησης



εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ