Η Google ανακοινώνει το μοντέλο γλώσσας PaLM 2 AI, που τροφοδοτεί ήδη 25 υπηρεσίες της Google
Related Posts
Η Google ανακοίνωσε το PaLM 2: το τελευταίο της μοντέλο γλώσσας AI και ανταγωνιστή ανταγωνιστικών συστημάτων όπως το GPT-4 του OpenAI.
«Τα μοντέλα PaLM 2 είναι ισχυρότερα στη λογική και τη συλλογιστική, χάρη στην ευρεία εκπαίδευση στη λογική και τη λογική», δήλωσε ο CEO της Google, Sundar Pichai, επί σκηνής στο συνέδριο I/O της εταιρείας. “Είναι επίσης εκπαιδευμένο σε πολύγλωσσο κείμενο που εκτείνεται σε περισσότερες από 100 γλώσσες.”
Το PaLM 2 είναι πολύ καλύτερο σε μια σειρά εργασιών που βασίζονται σε κείμενο, είπε ο ανώτερος διευθυντής έρευνας της Google Slav Petrov σε δημοσιογράφους σε μια στρογγυλή τράπεζα πριν από την ανακοίνωση του μοντέλου στο συνέδριο I/O της Google, συμπεριλαμβανομένης της λογικής, της κωδικοποίησης και της μετάφρασης. «Είναι σημαντικά βελτιωμένο σε σύγκριση με το PaLM 1 [which was
announced in April 2022
]», είπε ο Πετρόφ.
Ως παράδειγμα των πολύγλωσσων δυνατοτήτων του, ο Petrov έδειξε πώς το PaLM 2 μπορεί να κατανοεί ιδιωματισμούς σε διάφορες γλώσσες, δίνοντας το παράδειγμα της γερμανικής φράσης «Ich verstehe nur Bahnhof», που κυριολεκτικά μεταφράζεται σε «καταλαβαίνω μόνο τον σιδηροδρομικό σταθμό» αλλά είναι καλύτερη. εννοείται ως «Δεν καταλαβαίνω τι λες» ή, ως αγγλικό ιδίωμα, «για μένα είναι όλα ελληνικά».
Σε μια ερευνητική εργασία που περιγράφει τις δυνατότητες του PaLM 2, οι μηχανικοί της Google ισχυρίστηκαν ότι η γλωσσική επάρκεια του συστήματος είναι «αρκετή για τη διδασκαλία αυτής της γλώσσας» και σημείωσαν ότι αυτό οφείλεται εν μέρει στη μεγαλύτερη επικράτηση μη αγγλικών κειμένων στα δεδομένα εκπαίδευσης.
Ένα παράδειγμα διευρυμένων πολυγλωσσικών δεξιοτήτων του PalM 2.
Εικόνα: Google
Όπως και άλλα μοντέλα μεγάλων γλωσσών, που απαιτούν τεράστιο χρόνο και πόρους για να δημιουργηθούν, το PaLM 2 είναι λιγότερο ένα προϊόν από μια οικογένεια προϊόντων — με διαφορετικές εκδόσεις που θα αναπτυχθούν σε καταναλωτικές και εταιρικές ρυθμίσεις. Το σύστημα είναι διαθέσιμο σε τέσσερα μεγέθη, που ονομάζονται Gecko, Otter, Bison και Unicorn, από το μικρότερο στο μεγαλύτερο και έχει ρυθμιστεί με ακρίβεια σε δεδομένα συγκεκριμένου τομέα για την εκτέλεση ορισμένων εργασιών για εταιρικούς πελάτες.
Σκεφτείτε αυτές τις προσαρμογές, όπως να πάρετε ένα βασικό πλαίσιο φορτηγού και να προσθέσετε έναν νέο κινητήρα ή έναν μπροστινό προφυλακτήρα για να ολοκληρώσετε ορισμένες εργασίες ή να δουλέψετε καλύτερα σε συγκεκριμένο έδαφος. Υπάρχει μια έκδοση του PaLM που έχει εκπαιδευτεί σε δεδομένα υγείας (Med-PaLM 2), η οποία λέει η Google μπορεί να απαντήσει σε ερωτήσεις παρόμοιες με αυτές που βρέθηκαν στην Εξέταση Ιατρικής Αδειοδότησης των ΗΠΑ σε επίπεδο «ειδικών» και μια άλλη έκδοση εκπαιδευμένη σε δεδομένα κυβερνοασφάλειας (Sec-PaLM 2 ) που μπορεί να «εξηγήσει τη συμπεριφορά πιθανών κακόβουλων σεναρίων και να βοηθήσει στον εντοπισμό απειλών στον κώδικα», είπε ο Petrov. Και τα δύο αυτά μοντέλα θα είναι διαθέσιμα μέσω του Google Cloud, αρχικά σε επιλεγμένους πελάτες.
Μέσα στον τομέα της Google, το PaLM 2 χρησιμοποιείται ήδη για την τροφοδοσία 25 λειτουργιών και προϊόντων, συμπεριλαμβανομένου του Bard, του πειραματικού chatbot της εταιρείας. Οι ενημερώσεις που διατίθενται μέσω του Bard περιλαμβάνουν βελτιωμένες δυνατότητες κωδικοποίησης και μεγαλύτερη υποστήριξη γλώσσας. Χρησιμοποιείται επίσης για την παροχή δυνατοτήτων σε εφαρμογές Google Workspace όπως τα Έγγραφα, οι Παρουσιάσεις και τα Υπολογιστικά φύλλα.
Συγκεκριμένα, η Google λέει ότι η ελαφρύτερη έκδοση του PaLM 2, το Gecko, είναι αρκετά μικρή για να τρέχει σε κινητά τηλέφωνα, επεξεργάζοντας 20 μάρκες ανά δευτερόλεπτο — περίπου ισοδύναμα με περίπου 16 ή 17 λέξεις. Η Google δεν είπε ποιο υλικό χρησιμοποιήθηκε για τη δοκιμή αυτού του μοντέλου, μόνο ότι εκτελούσε «στα πιο πρόσφατα τηλέφωνα». Ωστόσο, η μικρογραφία τέτοιων γλωσσικών μοντέλων είναι σημαντική. Τέτοια συστήματα είναι ακριβά για να λειτουργούν στο cloud και η δυνατότητα χρήσης τους τοπικά θα είχε άλλα οφέλη, όπως βελτιωμένο απόρρητο. Το πρόβλημα είναι ότι οι μικρότερες εκδόσεις γλωσσικών μοντέλων είναι αναπόφευκτα λιγότερο ικανές από τα μεγαλύτερα αδέρφια τους.
Ένα παράδειγμα των βελτιωμένων δυνατοτήτων συλλογιστικής του PaLM 2
.
Εικόνα: Google
Με το PaLM 2, η Google θα ελπίζει να κλείσει το «κενό AI» μεταξύ της εταιρείας και ανταγωνιστών όπως η Microsoft, η οποία έχει προωθήσει επιθετικά τα εργαλεία γλώσσας AI στη σουίτα λογισμικού Office της. Η Microsoft προσφέρει πλέον λειτουργίες τεχνητής νοημοσύνης που βοηθούν στη σύνοψη εγγράφων, τη σύνταξη email, τη δημιουργία διαφανειών για παρουσιάσεις και πολλά άλλα. Η Google θα πρέπει να διατηρήσει την ισοτιμία με την εταιρεία διαφορετικά κινδυνεύει να θεωρηθεί αργή στην υλοποίηση της έρευνάς της για την τεχνητή νοημοσύνη.
Αν και το PaLM 2 είναι σίγουρα ένα βήμα προς τα εμπρός για την εργασία της Google στα μοντέλα γλώσσας τεχνητής νοημοσύνης, πάσχει από προβλήματα και προκλήσεις που είναι κοινά στην τεχνολογία ευρύτερα.
Για παράδειγμα, ορισμένοι ειδικοί αρχίζουν να αμφισβητούν τη νομιμότητα των δεδομένων εκπαίδευσης που χρησιμοποιούνται για τη δημιουργία γλωσσικών μοντέλων. Αυτά τα δεδομένα συνήθως αφαιρούνται από το Διαδίκτυο και συχνά περιλαμβάνουν κείμενο που προστατεύεται από πνευματικά δικαιώματα και πειρατικά ηλεκτρονικά βιβλία. Οι εταιρείες τεχνολογίας που δημιουργούν αυτά τα μοντέλα έχουν γενικά απαντήσει αρνούμενοι να απαντήσουν σε ερωτήσεις σχετικά με το από πού προέρχονται τα δεδομένα εκπαίδευσής τους. Η Google συνέχισε αυτή την παράδοση στην περιγραφή της για το PaLM 2, σημειώνοντας μόνο ότι το εκπαιδευτικό σώμα του συστήματος αποτελείται από «ένα διαφορετικό σύνολο πηγών: έγγραφα ιστού, βιβλία, κώδικα, μαθηματικά και δεδομένα συνομιλίας», χωρίς να προσφέρει περισσότερες λεπτομέρειες.
Υπάρχουν επίσης προβλήματα εγγενή στην παραγωγή γλωσσικών μοντέλων, όπως οι «ψευδαισθήσεις» ή η τάση αυτών των συστημάτων να συνθέτουν απλώς πληροφορίες. Μιλώντας σε
Το χείλος
ο αντιπρόεδρος έρευνας της Google, Zoubin Ghahramani, λέει ότι, από αυτή την άποψη, το PaLM 2 ήταν μια βελτίωση σε προηγούμενα μοντέλα «με την έννοια ότι καταβάλλουμε τεράστια προσπάθεια για τη συνεχή βελτίωση των μετρήσεων της γείωσης και της απόδοσης», αλλά σημείωσε ότι το πεδίο στο σύνολό τους «έχει ακόμη δρόμους μπροστά» για την καταπολέμηση των ψευδών πληροφοριών που δημιουργούνται από την τεχνητή νοημοσύνη.

