Το Google Bard έχει κυκλοφορήσει και προσπαθεί να ανταγωνιστεί το
Bing
της Microsoft και το ChatGPT του OpenAI, αλλά ο βοηθός συνο
μι
λίας AI της Google δεν έχει ένα βασικό χαρακτηριστικό που είχαν οι άλλοι βοηθοί συνομιλίας AI: τη δημιουργία εικόνων.
Ευτυχώς, αυτή η ανισορροπία στη δύναμη φτάνει στο τέλος της. Σε μια ανάρτηση ιστολογίου, η Google
ανακοινώθηκε
την τελευταία του ενημέρωση στο Bard, η οποία, εκτός από την κυκλοφορία του Gemini Pro σε περισσότερες γλώσσες, επιτρέπει επίσης τη δημιουργία εικόνων που δημιουργούνται από AI για πρώτη φορά.
Η πιο αξιοσημείωτη ενημέρωση για τον Bard σήμερα είναι η δυνατότητα δημιουργίας εικόνων μέσω μιας προτροπής κειμένου. Η λειτουργία, η οποία είναι προς το παρόν διαθέσιμη μόνο στα Αγγλικά, έχει σχεδιαστεί για να «εξισορροπεί την ποιότητα και την ταχύτητα, παρέχοντας υψηλής ποιότητας, φωτορεαλιστικά αποτελέσ
ματ
α. Απλώς πληκτρολογήστε μια περιγραφή – όπως “δημιουργήστε μια εικόνα ενός σκύλου που καβαλάει μια σανίδα του σερφ” – και ο Bard θα δημιουργήσει προσαρμοσμένα, ευρείας εμβέλειας γραφικά που θα σας βοηθήσουν να πραγματοποιήσετε την ιδέα σας.”
Για μια επιπλέον δημιουργική ώθηση, μπορείτε τώρα να δημιουργήσετε εικόνες σε Bard στα Αγγλικά στις περισσότερες χώρες σε όλο τον κόσμο, χωρίς κόστος. Αυτή η νέα δυνατότητα τροφοδοτείται από το ενημερωμένο μας μοντέλο Imagen 2, το οποίο έχει σχεδιαστεί για να εξισορροπεί την ποιότητα και την ταχύτητα, παρέχοντας υψηλής ποιότητας, φωτορεαλιστικά αποτελέσματα. Απλώς πληκτρολογήστε μια περιγραφή – όπως “δημιουργήστε μια εικόνα ενός σκύλου που καβαλάει μια σανίδα του σερφ” – και ο Bard θα δημιουργήσει προσαρμοσμένα, ευρείας εμβέλειας γραφικά που θα σας βοηθήσουν να πραγματοποιήσετε την ιδέα σας.
Η δυνατότητα δημιουργίας εικόνων είναι ενεργοποιημένη από το νέο της Google
Μοντέλο Imagen 2
το οποίο η εταιρεία λέει ότι προσφέρει τις «υψηλότερης ποιότητας εικόνες μέχρι στιγμής, καθώς και βελτιώσεις σε τομείς με τους οποίους συχνά παλεύουν τα συστήματα κειμένου σε εικόνα, όπως η απόδοση ρεαλιστικών χεριών και ανθρώπινων προσώπων και η διατήρηση των εικόνων απαλλαγμένων από οπτικά τεχνουργήματα που αποσπούν την προσοχή».
Το Imagen 2 έχει εκπαιδευτεί σε ζεύγη περιγραφής εικόνας υψηλότερης ποιότητας και δημιουργεί πιο λεπτομερείς εικόνες που ευθυγραμμίζονται καλύτερα με τη σημασιολογία των γλωσσικών προτροπών των ατόμων. Είναι πιο ακριβές από το προηγούμενο σύστημά μας στην επεξεργασία λεπτομερειών και είναι πιο ικανό να καταγράφει αποχρώσεις — παρέχοντας πιο φωτορεαλιστικές εικόνες σε μια σειρά από στυλ και περιπτώσεις χρήσης.
Δοκίμασα τη νέα δυνατότητα δημιουργίας εικόνας με μια βασική προτροπή, ζητώντας της να δημιουργήσει μια εικόνα ενός πεζοπόρου σε ένα βουνό. Έβγαλε δύο εικόνες με μια πιο ρεαλιστική και μια πιο καλλιτεχνική. Και οι δύο πεζοπόροι είχαν μπαστούνια πεζοπορίας, παρόλο που δεν τους ζήτησα. Ωραία, όμως, οι πόλοι πεζοπορίας είναι ο τρόπος. Φαίνεται ότι η δυνατότητα είναι ευρέως διαθέσιμη αμέσως, οπότε ξεκινήστε τη δημιουργία!

Εκτός από τη δημιουργία εικόνων, η τελευταία ενημέρωση φέρνει επίσης το Gemini Pro σε περισσότερες γλώσσες. Η εταιρεία έφερε ήδη το Gemini Pro στο Bard στα αγγλικά, αλλά επεκτείνει την τεχνολογία σε περισσότερες από 40 ακόμη γλώσσες. Το Gemini Pro κάνει τον Bard «πολύ πιο ικανό σε πράγματα όπως η κατανόηση, η περίληψη, η συλλογιστική, η κωδικοποίηση και ο προγραμματισμός».
Ο οργανισμός Large Model Systems, κορυφαίος αξιολογητής μοντέλων γλώσσας και chatbots σε διάφορες γλώσσες, μοιράστηκε πρόσφατα ότι το Bard with Gemini Pro είναι ένα από τα πιο προτιμώμενα chatbots διαθέσιμα (με ή χωρίς κόστος), σημειώνοντας ότι έχει κάνει ένα «εκπληκτικό άλμα» προς τα
εμπ
ρός . Και οι τυφλές αξιολογήσεις με τους τρίτους αξιολογητές μας αναγνώρισαν τον Bard with Gemini Pro ως έναν από τους τεχνητές νοημοσύνης συνομιλίας με τις καλύτερες επιδόσεις, σε σύγκριση με κορυφαίες δωρεάν και επί πληρωμή εναλλακτικές λύσεις.
Καθώς η Google μπαίνει τελικά στη δημιουργία εικόνων με τον Bard, ο Yelp είναι εδώ χρησιμοποιώντας την τεχνητή νοημοσύνη για να προσδιορίσει ποιες εικόνες φαγητού βλέπετε στα εστιατόρια. Η τεχνητή νοημοσύνη προφανώς θα εμπλέκεται σε αυτό που βλέπουμε με τον ένα ή τον άλλο τρόπο — ακόμα κι αν δεν δημιουργεί τις εικόνες από μόνη της.
VIA:
bgr.com


