Η Microsoft διπλασιάζει την τεχνητή νοημοσύνη με νέες δυνατότητες Bing
Related Posts
Η Microsoft ξεκινά
στην επόμενη φάση της επέκτασης του Bing. Και – δεν αποτελεί έκπληξη – περιστρέφεται σε μεγάλο βαθμό γύρω από την τεχνητή νοημοσύνη.
Σε μια εκδήλωση προεπισκόπησης αυτή την εβδομάδα στη Νέα Υόρκη, στελέχη της Microsoft, συμπεριλαμβανομένου του Yusuf Mehdi, CVP και επικεφαλής μάρκετινγκ καταναλωτών, έδωσαν στα μέλη του Τύπου, συμπεριλαμβανομένου αυτού του δημοσιογράφου, μια ματιά στο εύρος των δυνατοτήτων που κατευθύνονται στο Bing τις επόμενες ημέρες, εβδομάδες και μήνες.
Δεν επανεφευρίσκουν τόσο τον τροχό, όσο βασίζονται σε αυτό που η Microsoft έχει εισάγει στην εμπειρία Bing τους τελευταίους τρεις μήνες περίπου. Από τότε που ξεκίνησε το Bing Chat, το chatbot που υποστηρίζεται από AI και τροφοδοτείται από τα μοντέλα GPT-4 και DALL-E 2 της OpenAI, η Microsoft λέει ότι οι επισκέπτες στο Bing – το οποίο έχει ξεπεράσει τα 100 εκατομμύρια καθημερινούς ενεργούς χρήστες – έχουν συμμετάσχει σε πάνω από μισό δισεκατομμύριο συνομιλίες και έχουν δημιουργήσει πάνω από 200 εκατομμύρια εικόνες.
Κοιτάζοντας μπροστά, το Bing θα γίνει πιο οπτικό, χάρη σε περισσότερες απαντήσεις με επίκεντρο την εικόνα και τα γραφικά στη Συνομιλία Bing. Θα γίνει επίσης πιο εξατομικευμένο, με δυνατότητες που θα επιτρέπουν στους χρήστες να εξάγουν το ιστορικό συνομιλιών Bing και να αντλούν περιεχόμενο από προσθήκες τρίτων (περισσότερα για αυτά αργότερα). Και θα περιλαμβάνει την πολυτροπικότητα, τουλάχιστον με την έννοια ότι το Bing Chat θα μπορεί να απαντά σε ερωτήσεις στο πλαίσιο των εικόνων.
«Νομίζω ότι είναι ασφαλές να πούμε ότι βρισκόμαστε σε εξέλιξη με τη μεταμόρφωση της αναζήτησης», δήλωσε ο Mehdi σε προετοιμασμένες παρατηρήσεις. «Στο μυαλό μας, πιστεύουμε ότι σήμερα θα είναι η αρχή της επόμενης γενιάς αυτής της “αποστολής αναζήτησης”».
Ανοιχτό και οπτικό
Από σήμερα, το νέο Bing — αυτό με τη συνομιλία Bing — είναι πλέον διαθέσιμο χωρίς λίστα αναμονής. Οποιοσδήποτε μπορεί να το δοκιμάσει πραγματοποιώντας είσοδο με λογαριασμό Microsoft.
Είναι λίγο πολύ η εμπειρία που ξεκίνησε πριν από αρκετούς μήνες. Αλλά όπως αναφέρθηκε προηγουμένως, το Bing Chat θα απαντήσει σύντομα με εικόνες – τουλάχιστον όπου έχει νόημα. Οι απαντήσεις σε ερωτήσεις (π.χ. “Πού είναι το μάτσου πίτσου;”) θα συνοδεύονται από σχετικές εικόνες, εάν υπάρχουν, όπως η τυπική ροή αναζήτησης Bing, αλλά συμπυκνωμένες σε μια διεπαφή που μοιάζει με κάρτα.
Απαντήσεις με οπτικά στοιχεία, νέες δυνατότητες στη Συνομιλία Bing.
Σε μια επίδειξη στην εκδήλωση, ένας εκπρόσωπος πληκτρολόγησε την ερώτηση “Μήπως ο κάκτος saguaro μεγαλώνει λουλούδια;” και το Bing Chat τράβηξε μια απάντηση μήκους παραγράφου μαζί με μια εικόνα του εν λόγω κάκτου. Για μένα, προκάλεσε το “
Πλαίσια πληροφοριών
” στην Αναζήτηση Google.
Η Microsoft δεν λέει ποιες κατηγορίες περιεχομένου, ακριβώς, θα μπορούσαν να ενεργοποιήσουν μια εικόνα. Αλλά έχει φιλτράρισμα για να αποτρέψει την εμφάνιση άσεμνων εικόνων – ή έτσι ισχυρίζεται.
Η Sarah Bird, επικεφαλής της υπεύθυνης τεχνητής νοημοσύνης στη Microsoft, μου είπε ότι η συνομιλία Bing επωφελείται από το φιλτράρισμα και την εποπτεία που υπάρχουν ήδη με την αναζήτηση Bing. Πέρα από αυτό, η Συνομιλία Bing χρησιμοποιεί έναν συνδυασμό “ταξινομητών τοξικότητας” ή μοντέλων AI που έχουν εκπαιδευτεί για τον εντοπισμό δυνητικά επιβλαβών μηνυμάτων προτροπής και μαύρων λιστών για να διατηρεί τη συνομιλία σχετικά καθαρή.
Αυτά τα μέτρα δεν εμπόδισαν το Bing Chat να εκτροχιαστεί όταν κυκλοφόρησε για πρώτη φορά σε προεπισκόπηση στις αρχές Φεβρουαρίου, αξίζει να σημειωθεί. Η κάλυψή μας βρήκε το chatbot να εκτοξεύει παραπληροφόρηση για τα εμβόλια και να γράφει μια μισητή επίστρωση από την οπτική γωνία του Αδόλφου Χίτλερ. Άλλοι δημοσιογράφοι το πήραν για να κάνουν απειλές, να ισχυριστούν πολλαπλές ταυτότητες και ακόμη και να τους ντροπιάσουν που το νουθέτησαν.
Σε ένα άλλο χτύπημα εναντίον της Microsoft, η εταιρεία μόλις πριν από λίγους μήνες απέλυσε την ομάδα ηθικής και κοινωνίας στον μεγαλύτερο οργανισμό AI. Η κίνηση άφησε τη Microsoft χωρίς ειδική ομάδα για να διασφαλίσει ότι οι αρχές AI είναι στενά συνδεδεμένες με το σχεδιασμό προϊόντων.
Ο Bird, ωστόσο, ισχυρίζεται ότι έχει σημειωθεί ουσιαστική πρόοδος και ότι αυτά τα είδη ζητημάτων AI δεν επιλύονται εν μία νυκτί – όσο δημόσιο και αν είναι το Bing Chat. Μεταξύ άλλων μέτρων, μια ομάδα ανθρώπινων συντονιστών είναι σε θέση να παρακολουθεί για κατάχρηση, είπε, όπως οι χρήστες που προσπαθούν να χρησιμοποιήσουν το Bing Chat για να δημιουργήσουν μηνύματα ηλεκτρονικού “ψαρέματος”.
Αλλά – καθώς τα μέλη του Τύπου δεν είχαν την ευκαιρία να αλληλεπιδράσουν με την τελευταία έκδοση του Bing πέρα από τα επιμελημένα demos – δεν μπορώ να πω σε ποιο βαθμό όλα αυτά έκαναν τη διαφορά. Αναμφίβολα θα γίνει σαφές μόλις οι λαοί πάρουν τα χέρια τους σε αυτό.
Μια πτυχή της συνομιλίας Bing που
Είναι
Βελτίωση είναι η διαφάνεια γύρω από τις απαντήσεις της — ειδικά απαντήσεις που βασίζονται σε γεγονότα. Σύντομα, όταν σας ζητηθεί να συνοψίσετε ένα έγγραφο ή σχετικά με τα περιεχόμενα ενός εγγράφου (π.χ. “τι λέει αυτή η σελίδα για τη γέφυρα του Μπρούκλιν;”), είτε πρόκειται για PDF 20 σελίδων είτε για άρθρο της Wikipedia, η Συνομιλία Bing θα περιλαμβάνει παραπομπές που υποδεικνύουν από ποιο σημείο του κειμένου προήλθαν οι πληροφορίες. Κάνοντας κλικ πάνω τους θα επισημανθεί το αντίστοιχο απόσπασμα.
Αναδυόμενη παραγωγικότητα
Σε ένα άλλο νέο χαρακτηριστικό στο οπτικό μέτωπο, το Bing Chat θα είναι σε θέση να δημιουργήσει γραφήματα και γραφήματα όταν τροφοδοτείται η σωστή προτροπή και δεδομένα. Προηγουμένως, ρωτώντας κάτι σαν “Ποιες είναι οι πιο πυκνοκατοικημένες πόλεις στη Βραζιλία;” θα έδινε μια βασική λίστα αποτελεσμάτων. Ωστόσο, σε μια προεπισκόπηση στο εγγύς μέλλον, η συνομιλία Bing θα παρουσιάσει αυτά τα αποτελέσματα οπτικά και στον τύπο γραφήματος της επιλογής ενός χρήστη.
Αυτό φαινομενικά αντιπροσωπεύει ένα βήμα για το Bing προς μια πλήρη πλατφόρμα παραγωγικότητας, ειδικά όταν συνδυάζεται με τις βελτιωμένες δυνατότητες δημιουργίας κειμένου σε εικόνα που έρχονται κάτω από τον αγωγό.
Ο δημιουργός εικόνων στη συνομιλία Bing.
Τις επόμενες εβδομάδες, το Bing Image Creator – το εργαλείο της Microsoft που μπορεί να δημιουργήσει εικόνες από μηνύματα κειμένου, που τροφοδοτείται από το DALL-E 2 – θα καταλαβαίνει περισσότερες γλώσσες εκτός από τα αγγλικά (πάνω από 100 συνολικά). Όπως και με τα αγγλικά, οι χρήστες θα μπορούν να βελτιώσουν τις εικόνες που δημιουργούν με προτροπές παρακολούθησης (π.χ. “Make an image of a bunny rabbit”, ακολουθούμενο από “now make the fur pink”).
Η γενετική τέχνη AI βρίσκεται στα πρωτοσέλιδα πολύ, τον τελευταίο καιρό – και όχι για τους πιο αισιόδοξους λόγους απαραίτητα.
Οι ενάγοντες έχουν ασκήσει αρκετές αγωγές εναντίον της OpenAI και των ανταγωνιστών προμηθευτών της, ισχυριζόμενοι ότι τα δεδομένα που προστατεύονται από πνευματικά δικαιώματα – κυρίως τέχνη – χρησιμοποιήθηκαν χωρίς την άδειά τους για την εκπαίδευση παραγωγικών μοντέλων όπως το DALL-E 2. Τα παραγωγικά μοντέλα «μαθαίνουν» να δημιουργούν τέχνη και πολλά άλλα «εκπαιδεύοντας» σε δείγματα εικόνων και κειμένων, που συνήθως ξύνονται αδιακρίτως από τον δημόσιο ιστό.
Ρώτησα τον Bird για το αν η Microsoft διερευνά τρόπους αποζημίωσης των δημιουργών των οποίων το έργο σαρώθηκε στα δεδομένα εκπαίδευσης, ακόμη και αν η επίσημη θέση της εταιρείας είναι ότι είναι θέμα
Ορθή χρήση
. Αρκετές πλατφόρμες που λανσάρουν εργαλεία τεχνητής νοημοσύνης, συμπεριλαμβανομένου του Shutterstock, έχουν ξεκινήσει κεφάλαια δημιουργών προς αυτή την κατεύθυνση. Άλλοι, όπως το Spawning, δημιουργούν μηχανισμούς που επιτρέπουν στους καλλιτέχνες να εξαιρεθούν εντελώς από την εκπαίδευση μοντέλων AI.
Ο Bird υπονόησε ότι αυτά τα ζητήματα θα πρέπει τελικά να αντιμετωπιστούν – και ότι οι δημιουργοί περιεχομένου αξίζουν κάποια μορφή αποζημίωσης. Αλλά δεν ήταν πρόθυμη να δεσμευτεί σε κάτι συγκεκριμένο αυτή την εβδομάδα.
Πολυτροπική αναζήτηση
Αλλού στο μέτωπο της εικόνας, το Bing Chat αποκτά τη δυνατότητα κατανόησης εικόνων καθώς και κειμένου. Οι χρήστες θα μπορούν να ανεβάζουν εικόνες και να πραγματοποιούν αναζήτηση στο web για σχετικό περιεχόμενο, για παράδειγμα αντιγράφοντας μια σύνδεση σε μια εικόνα ενός χταποδιού με βελονάκι και ζητώντας από τη Συνομιλία Bing την ερώτηση “πώς μπορώ να το κάνω αυτό;” για να λάβουν οδηγίες βήμα προς βήμα.
Η πολυτροπικότητα τροφοδοτεί επίσης τη νέα λειτουργία περιβάλλοντος σελίδας στην εφαρμογή Edge για κινητά. Οι χρήστες θα μπορούν να κάνουν ερωτήσεις στη Συνομιλία Bing σχετικά με τη σελίδα για κινητές συσκευές που προβάλλουν.
Η Microsoft δεν θα έλεγε τίποτα από τα δύο, αλλά φαίνεται πιθανό ότι αυτές οι νέες πολυτροπικές ικανότητες προέρχονται από το GPT-4, το οποίο μπορεί να κατανοήσει εικόνες εκτός από κείμενο. Όταν η OpenAI ανακοίνωσε το GPT-4, δεν έκανε τις δυνατότητες κατανόησης εικόνας του μοντέλου διαθέσιμες σε όλους τους πελάτες – και ακόμα δεν το έχει κάνει. Θα στοιχημάτιζα ότι η Microsoft, όμως, όντας σημαντικός επενδυτής και στενός συνεργάτης της OpenAI, έχει κάποιο είδος προνομιακής πρόσβασης.
Οποιοδήποτε εργαλείο μεταφόρτωσης εικόνων μπορεί να καταχραστεί, φυσικά, γι ‘αυτό η Microsoft χρησιμοποιεί αυτοματοποιημένο φιλτράρισμα και κατακερματισμό για να αποκλείσει παράνομες μεταφορτώσεις, σύμφωνα με τον Bird. Ωστόσο, η κριτική επιτροπή είναι έξω για το πόσο καλά λειτουργούν αυτά – δεν μας δόθηκε η ευκαιρία να δοκιμάσουμε οι ίδιοι τις μεταφορτώσεις εικόνων.
Νέες λειτουργίες συνομιλίας
Η πολυτροπικότητα και οι νέες οπτικές δυνατότητες δεν είναι το μόνο που έρχεται στη Συνομιλία Bing.
Σύντομα, η Συνομιλία Bing θα αποθηκεύει τα ιστορικά συνομιλιών των χρηστών, επιτρέποντάς τους να συνεχίσουν από εκεί που σταμάτησαν και να επιστρέψουν σε προηγούμενες συνομιλίες όταν το επιθυμούν. Είναι μια εμπειρία παρόμοια με τη λειτουργία ιστορικού συνομιλιών που έφερε πρόσφατα η OpenAI στο ChatGPT, εμφανίζοντας μια λίστα συνομιλιών και τις απαντήσεις του bot σε καθεμία από αυτές τις συνομιλίες.
Οι λεπτομέρειες της λειτουργίας ιστορικού συνομιλιών δεν έχουν ακόμη εξομαλυνθεί, όπως ακριβώς πόσο καιρό θα αποθηκευτούν οι συνομιλίες. Ωστόσο, οι χρήστες θα μπορούν να διαγράψουν το ιστορικό τους ανά πάσα στιγμή, λέει η Microsoft – απαντώντας στις επικρίσεις που είχαν αρκετές κυβερνήσεις της Ευρωπαϊκής Ένωσης εναντίον του ChatGPT.
Εξαγωγή και κοινή χρήση συνομιλιών από τη Συνομιλία Bing.
Το Bing Chat θα αποκτήσει επίσης λειτουργίες εξαγωγής και κοινής χρήσης, επιτρέποντας στους χρήστες να μοιράζονται συνομιλίες στα μέσα κοινωνικής δικτύωσης ή σε ένα έγγραφο του Word. Η Dena Saunders, συνεργάτης GM στην ομάδα εμπειρίας ιστού της Microsoft, δήλωσε στο TechCrunch ότι ένα πιο ισχυρό σύστημα αντιγραφής και επικόλλησης είναι στα σκαριά – αλλά όχι σε προεπισκόπηση ακόμα – για γραφήματα και εικόνες που δημιουργούνται μέσω του Bing Chat.
Ίσως η πιο μετασχηματιστική προσθήκη στο Bing Chat, ωστόσο, είναι τα πρόσθετα. Από συνεργάτες όπως το OpenTable και το Wolfram Alpha, οι προσθήκες επεκτείνουν σημαντικά αυτό που μπορεί να κάνει η Συνομιλία Bing, για παράδειγμα βοηθώντας τους χρήστες να κάνουν κράτηση ή να δημιουργήσουν απεικονίσεις και να λάβουν απαντήσεις σε προκλητικές επιστήμεςnd μαθηματικές ερωτήσεις.
Όπως και το ιστορικό συνομιλιών, η λειτουργικότητα των προσθηκών που δεν είναι ακόμη ζωντανή βρίσκεται στα πολύ προκαταρκτικά στάδια. Δεν υπάρχει αγορά προσθηκών για να μιλήσουμε. Οι προσθήκες μπορούν να ενεργοποιηθούν ή να απενεργοποιηθούν από τη διεπαφή web της συνομιλίας Bing.
Ο Saunders υπαινίχθηκε, αλλά δεν επιβεβαίωσε, ότι το σύστημα προσθηκών Bing Chat συσχετίστηκε – ή ίσως ταυτόσημο με – το OpenAI που εισήχθη πρόσφατα
Πρόσθετα
για το ChatGPT. Αυτό θα είχε σίγουρα νόημα, δεδομένων των ομοιοτήτων μεταξύ των δύο.
Άκρη, ανανεωμένη
Το Bing Chat είναι διαθέσιμο μέσω του Edge καθώς και μέσω του web, φυσικά. Και ο Edge αποκτά μια νέα στρώση χρώματος μαζί με το Bing Chat.
Παρουσιάστηκε για πρώτη φορά τον Φεβρουάριο, το νέο και βελτιωμένο Edge διαθέτει στρογγυλεμένες γωνίες σύμφωνα με τη φιλοσοφία σχεδιασμού των Windows 11 της Microsoft. Τα στοιχεία στο πρόγραμμα περιήγησης είναι πλέον πιο “κοντέινερ”, όπως το έθεσε ένας εκπρόσωπος της Microsoft, και υπάρχουν λεπτές τροποποιήσεις παντού, όπως η εικόνα του λογαριασμού Microsoft που μετακινείται αριστερά από το κέντρο.
Στο Compose, το εργαλείο συνομιλίας Bing του Edge που μπορεί να γράψει μηνύματα ηλεκτρονικού ταχυδρομείου και πολλά άλλα δεδομένης μιας βασικής προτροπής (π.χ. “γράψτε μια πρόσκληση στο πάρτι γενεθλίων του σκύλου μου”), μια νέα επιλογή επιτρέπει στους χρήστες να προσαρμόσουν το μήκος, τη διατύπωση και τον τόνο του κειμένου που δημιουργείται σχεδόν σε οτιδήποτε θέλουν. Πληκτρολογήστε τον επιθυμητό τόνο και η Συνομιλία Bing θα γράψει ένα μήνυμα που ταιριάζει — ο Bird λέει ότι υπάρχουν φίλτρα για να αποτρέψουν τη χρήση σαφώς προβληματικών τόνων, όπως “μισητός” ή “ρατσιστής”.
Πολύ πιο ενδιαφέρουσες από το Compose, αν και — τουλάχιστον για μένα — είναι ενέργειες στο Edge, οι οποίες μεταφράζουν ορισμένες προτροπές συνομιλίας Bing σε αυτοματισμούς.
Πληκτρολογώντας μια εντολή όπως “φέρτε τους κωδικούς πρόσβασής μου από άλλο πρόγραμμα περιήγησης” στη Συνομιλία Bing στην πλαϊνή γραμμή του Edge, ανοίγει η σελίδα ρυθμίσεων δεδομένων περιήγησης του Edge, ενώ η προτροπή “play ‘The Devil Wears Prada’” εμφανίζει μια λίστα επιλογών ροής, συμπεριλαμβανομένου του Vudu και (προβλέψιμα) του Microsoft Store. Υπάρχει ακόμη και μια ενέργεια που οργανώνει αυτόματα — και χρωματικές συντεταγμένες — τις καρτέλες περιήγησης.
Ενέργειες άκρων σε… ενέργεια.
Οι δράσεις βρίσκονται επί του παρόντος σε πρωτόγονο στάδιο. Αλλά είναι σαφές πού πηγαίνει η Microsoft, εδώ. Κάποιος φαντάζεται ενέργειες που τελικά επεκτείνονται πέρα από το Edge για να φτάσουν σε άλλα προϊόντα της Microsoft, όπως το Office 365, και ίσως μια μέρα σε ολόκληρη την επιφάνεια εργασίας των Windows.
Ο Saunders δεν επιβεβαίωσε ούτε διέψευσε ότι αυτό είναι το φινάλε. “Μείνετε συντονισμένοι για το Microsoft Build”, μου είπε, αναφερόμενη στο επερχόμενο συνέδριο προγραμματιστών της Microsoft. Θα το κάνουμε.

