Η Google ισχυρίζεται ότι ο Bard βελτιώνεται στα μαθηματικά και στον προγραμματισμό

Ο Bard, το πολιορκημένο chatbot με τεχνητή νοημοσύνη της

, βελτιώνεται σιγά σιγά σε εργασίες που περιλαμβάνουν λογική και συλλογισμό. Αυτό σύμφωνα με μια ανάρτηση ιστολογίου

δημοσίευσε

σήμερα από τον τεχνολογικό γίγαντα, ο οποίος προτείνει ότι — χάρη σε μια τεχνική που ονομάζεται «σιωπηρή εκτέλεση κώδικα» — το Bard έχει πλέον βελτιωθεί ειδικά στους τομείς των μαθηματικών και της κωδικοποίησης.

Όπως εξηγεί η ανάρτηση του ιστολογίου, τα μεγάλα γλωσσικά μοντέλα (LLM) όπως το Bard είναι ουσιαστικά μηχανές πρόβλεψης. Όταν τους δίνεται μια προτροπή, δημιουργούν μια απάντηση προβλέποντας ποιες λέξεις είναι πιθανό να ακολουθήσουν σε μια πρόταση. Αυτό τους κάνει εξαιρετικά καλούς συγγραφείς ηλεκτρονικού ταχυδρομείου και δοκιμίων, αλλά κάπως επιρρεπείς σε σφάλματα προγραμματιστές λογισμικού.

Αλλά περιμένετε, μπορείτε να πείτε – τι γίνεται με τα μοντέλα που δημιουργούν κώδικα όπως το Copilot του GitHub και το CodeWhisperer της

; Λοιπόν, αυτά δεν είναι γενικής χρήσης. Σε αντίθεση με τον Bard και τους ανταγωνιστές του

, που εκπαιδεύτηκαν χρησιμοποιώντας μια τεράστια γκάμα δειγμάτων κειμένου από τον Ιστό, ηλεκτρονικά βιβλία και άλλους πόρους, τα Copilot, CodeWhisperer και συγκρίσιμα μοντέλα δημιουργίας κώδικα εκπαιδεύτηκαν και βελτιώθηκαν σχεδόν αποκλειστικά σε κώδικα δείγματα.

Με κίνητρο να αντιμετωπίσει τις ανεπάρκειες κωδικοποίησης και μαθηματικών στα γενικά LLM, η Google ανέπτυξε σιωπηρή εκτέλεση κώδικα, η οποία επιτρέπει στον Bard να γράφει και

εκτέλεση

δικό της κωδικό. Η τελευταία έκδοση του Bard εντοπίζει προτροπές που μπορεί να ωφεληθούν από τον λογικό κώδικα, γράφει τον κωδικό “κάτω από την κουκούλα”, τον δοκιμάζει και χρησιμοποιεί το αποτέλεσμα για να δημιουργήσει μια φαινομενικά πιο ακριβή απόκριση.

Προγραμματισμός Google Bard


Συντελεστές εικόνας:

Google

Βάσει της εσωτερικής συγκριτικής αξιολόγησης, η Google λέει ότι οι απαντήσεις του νέου Bard σε προβλήματα λέξεων και μαθηματικών «βασισμένων σε υπολογισμούς» βελτιώθηκαν κατά 30% σε σύγκριση με την προηγούμενη έκδοση του Bard. Φυσικά, θα πρέπει να δούμε αν αυτοί οι ισχυρισμοί αντέχουν σε εξωτερικές δοκιμές.

“Ακόμη και με αυτές τις βελτιώσεις, ο Bard δεν θα τα καταφέρνει πάντα σωστά – για παράδειγμα, ο Bard μπορεί να μην δημιουργήσει κώδικα για να βοηθήσει την άμεση απόκριση, ο κώδικας που δημιουργεί μπορεί να είναι λάθος ή ο Bard μπορεί να μην συμπεριλάβει τον εκτελεσμένο κώδικα στην απάντησή του,” Bard Ο επικεφαλής προϊόντος Jack Krawczyk και ο αντιπρόεδρος της μηχανικής Amarnag Subramanya έγραψαν στην ανάρτηση ιστολογίου. «Με όλα αυτά που λέγονται, αυτή η βελτιωμένη ικανότητα απόκρισης με δομημένες, λογικές δυνατότητες είναι ένα σημαντικό βήμα για να γίνει ο Bard ακόμα πιο χρήσιμος».

Όταν ξεκίνησε η Google

Βάρδος

νωρίτερα φέτος, δεν συγκρίθηκε ευνοϊκά με τα Bing Chat και ChatGPT. Πράγματι, η κυκλοφορία ήταν λίγο καταστροφική, με μια διαφήμιση της Google που περιείχε μια λανθασμένη απάντηση από τον Bard — μειώνοντας για λίγο τη μετοχή της εταιρείας κατά 8%.


Σύμφωνα με πληροφορίες

αρκετοί υπάλληλοι της Google που δοκίμασαν τον Bard πριν από την κυκλοφορία του προκάλεσαν σοβαρές ανησυχίες στον γίγαντα της αναζήτησης, με ένα άτομο να το αποκαλεί “παθολογικό ψεύτη” και ένα άλλο να το θεωρεί “χειρότερο από άχρηστο”.

Με έμμεση δημιουργία κώδικα και άλλες βελτιώσεις, όπως υποστήριξη για νέες γλώσσες, ερωτήματα πολλαπλών τρόπων και δημιουργία εικόνων, η Google ανταποκρίνεται στην κριτική — και προσπαθεί να ανατρέψει την κατάσταση.

Ωστόσο, το αν θα είναι αρκετό για να συμβαδίσει με τα κορυφαία chatbot τεχνητής νοημοσύνης στον χώρο, μένει να φανεί. Πρόσφατα, η Anthropic παρουσίασε ένα μοντέλο chatbot AI με ένα πολύ διευρυμένο “παράθυρο περιβάλλοντος”, το οποίο επιτρέπει στο μοντέλο να συνομιλεί σχετικά συνεκτικά για ώρες ή και ημέρες σε αντίθεση με τα λεπτά. Και το

, ο προγραμματιστής πίσω από το ChatGPT, έχει αρχίσει να υποστηρίζει προσθήκες που υπερφορτίζουν το ChatGPT με εξωτερικές γνώσεις και δεξιότητες.


techcrunch.com



You might also like


Leave A Reply



Cancel Reply

Your email address will not be published.