Αυτή την εβδομάδα στο AI: Οι αγοραστές θέλουν πραγματικά το GenAI της Amazon;
Το να συμβαδίζεις με έναν κλάδο τόσο γρήγορο όσο η
τεχνητή νοημοσύνη
είναι μια μεγάλη παραγγελία. Έτσι, έως ότου μια τεχνητή νοημοσύνη μπορεί να το κάνει για εσάς, ακολουθεί μια χρήσιμη συλλογή από πρόσφατες ιστορίες στον κόσμο της μηχανικής μάθησης, μαζί με αξιοσημείωτες έρευνες και πειράματα που δεν καλύψαμε από μόνα τους.
Αυτή την εβδομάδα, η Amazon ανακοίνωσε τον Rufus, έναν βοηθό αγορών με τεχνητή νοημοσύνη και εκπαιδευμένο στον κατάλογο προϊόντων του γίγαντα του ηλεκτρονικού εμπορίου καθώς και πληροφορίες από όλο τον Ιστό. Ο Rufus ζει μέσα στην εφαρμογή για κινητά της Amazon, βοηθώντας στην εύρεση προϊόντων, πραγματοποιώντας συγκρίσεις προϊόντων και λαμβάνοντας συστάσεις για το τι να αγοράσετε.
Από ευρεία έρευνα στην αρχή ενός ταξιδιού για ψώνια, όπως «τι να λάβετε υπόψη όταν αγοράζετε παπούτσια για τρέξιμο;» σε συγκρίσεις όπως “ποιες είναι οι διαφορές μεταξύ παπουτσιών τρεξίματος μονοπατιού και δρόμου;” … Το Rufus βελτιώνει ουσιαστικά πόσο εύκολο είναι για τους πελάτες να βρουν και να ανακαλύψουν τα καλύτερα προϊόντα για να καλύψουν τις ανάγκες τους», γράφει η Amazon σε μια ανάρτηση ιστολογίου.
Όλα αυτά είναι υπέροχα. Αλλά το ερώτημά μου είναι ποιος το φωνάζει
Πραγματικά?
Δεν είμαι πεπεισμένος ότι το GenAI, ιδιαίτερα σε μορφή chatbot, είναι ένα κομμάτι τεχνολογίας που ενδιαφέρει ο μέσος άνθρωπος — ή ακόμα και το σκέφτεται. Οι έρευνες με υποστηρίζουν σε αυτό. Τον περασμένο Αύγουστο, το Pew Research Center διαπίστωσε ότι μεταξύ εκείνων στις ΗΠΑ που έχουν ακούσει για το GenAI ChatGPT του OpenAI (18% των ενηλίκων), μόνο το 26% το έχει δοκιμάσει. Φυσικά, η χρήση ποικίλλει ανάλογα με την ηλικία, με μεγαλύτερο ποσοστό νέων (κάτω των 50 ετών) να αναφέρει ότι το έχει χρησιμοποιήσει σε σχέση με μεγαλύτερους. Αλλά το γεγονός παραμένει ότι η συντριπτική πλειονότητα δεν ξέρει – ή δεν ενδιαφέρεται – να χρησιμοποιήσει αυτό που είναι αναμφισβήτητα το πιο δημοφιλές προϊόν GenAI εκεί έξω.
Το GenAI έχει τα ευρέως δημοσιοποιημένα προβλήματά του, μεταξύ των οποίων η τάση να συνθέτει γεγονότα, να παραβιάζει τα
πνευματικά δικαιώματα
και να εκπέμπει μεροληψία και τοξικότητα. Η προηγούμενη προσπάθεια της Amazon σε ένα chatbot GenAI, το Amazon Q, δυσκολεύτηκε πολύ – αποκαλύπτοντας εμπιστευτικές πληροφορίες την πρώτη ημέρα της κυκλοφορίας του. Αλλά θα υποστήριζα ότι το μεγαλύτερο πρόβλημα του GenAI τώρα —τουλάχιστον από την σκοπιά των καταναλωτών— είναι ότι υπάρχουν λίγοι γενικά επιτακτικοί λόγοι για να το χρησιμοποιήσετε.
Σίγουρα, το GenAI όπως το Rufus μπορεί να βοηθήσει σε συγκεκριμένες, στενές εργασίες, όπως ψώνια ανά περίσταση (π.χ. εύρεση ρούχων για το χειμώνα), σύγκριση κατηγοριών προϊόντων (π.χ. η διαφορά μεταξύ λιπ γκλος και λαδιού) και εμφάνιση κορυφαίων προτάσεων (π.χ. δώρα για την Ημέρα του Αγίου Βαλεντίνου). Ωστόσο, καλύπτει τις ανάγκες των περισσότερων αγοραστών; Όχι σύμφωνα με πρόσφατο
ψηφοφορία
από την εκκίνηση λογισμικού ηλεκτρονικού εμπορίου Namogoo.
Η Namogoo, η οποία ρώτησε εκατοντάδες καταναλωτές για τις ανάγκες και τις απογοητεύσεις τους όσον αφορά τις ηλεκτρονικές αγορές, διαπίστωσε ότι οι εικόνες των προϊόντων ήταν μακράν ο πιο σημαντικός παράγοντας για μια καλή εμπειρία ηλεκτρονικού εμπορίου, ακολουθούμενες από κριτικές και περιγραφές προϊόντων. Οι ερωτηθέντες κατέταξαν την αναζήτηση ως την τέταρτη πιο σημαντική και την «απλή πλοήγηση» την πέμπτη. Η ανάμνηση των προτιμήσεων, των πληροφοριών και του ιστορικού αγορών ήταν τελευταία.
Το συμπέρασμα είναι ότι οι άνθρωποι ψωνίζουν γενικά έχοντας στο μυαλό τους ένα προϊόν. ότι η αναζήτηση είναι μια εκ των υστέρων σκέψη. Ίσως ο Ρούφους ταρακουνήσει την εξίσωση. Έχω την τάση να πιστεύω ότι όχι, ειδικά αν πρόκειται για μια δύσκολη κυκλοφορία (και μπορεί κάλλιστα να δοθεί η
ρεσεψιόν
από τα άλλα πειράματα αγορών GenAI της Amazon) — αλλά υποθέτω ότι έχουν συμβεί πιο περίεργα πράγματα.
Ακολουθούν μερικές άλλες αξιοσημείωτες ιστορίες AI από τις τελευταίες ημέρες:
-
Οι Χάρτες Google πειραματίζονται με το GenAI
:
Οι Χάρτες Google εισάγουν μια λειτουργία GenAI για να σας βοηθήσει να ανακαλύψετε νέα μέρη. Αξιοποιώντας μεγάλα γλωσσικά μοντέλα (LLM), η δυνατότητα αναλύει τις περισσότερες από 250 εκατομμύρια τοποθεσίες στους Χάρτες Google και συνεισφορές από περισσότερους από 300 εκατομμύρια Τοπικούς οδηγούς για να δημιουργήσει προτάσεις με βάση αυτό που αναζητάτε.
-
Εργαλεία GenAI για μουσική και πολλά άλλα:
Σε άλλες ειδήσεις της Google, ο τεχνολογικός γίγαντας κυκλοφόρησε εργαλεία GenAI για τη δημιουργία μουσικής, στίχων και εικόνων και έφερε το Gemini Pro, ένα από τα πιο ικανά LLM του, στους χρήστες του chatbot Bard παγκοσμίως. -
Νέα ανοιχτά μοντέλα AI:
Το Allen Institute for AI, το μη κερδοσκοπικό ερευνητικό ινστιτούτο τεχνητής νοημοσύνης που ιδρύθηκε από τον αείμνηστο συνιδρυτή της Microsoft, Paul Allen, κυκλοφόρησε αρκετά μοντέλα γλώσσας GenAI που ισχυρίζεται ότι είναι πιο «ανοικτά» από άλλα — και, κυρίως, άδεια με τέτοιο τρόπο ώστε οι προγραμματιστές να μπορούν να χρησιμοποιούν
απε
ριόριστα για εκπαίδευση, πειραματισμό και ακόμη και εμπορευματοποίηση. -
Η FCC κινείται για την απαγόρευση των κλήσεων που δημιουργούνται από AI:
Η FCC προτείνει να κριθεί θεμελιωδώς παράνομη η χρήση τεχνολογίας κλωνοποίησης φωνής σε ρομποκλήσεις, καθιστώντας ευκολότερη τη χρέωση των χειριστών αυτών των απατών. -
Το Shopify κυκλοφορεί το πρόγραμμα επεξεργασίας εικόνων:
Το Shopify κυκλοφορεί ένα πρόγραμμα επεξεργασίας πολυμέσων GenAI για τη βελτίωση των εικόνων προϊόντων. Οι έμποροι μπορούν να επιλέξουν έναν τύπο από επτά στυλ ή να πληκτρολογήσουν μια ερώτηση για να δημιουργήσουν ένα νέο φόντο. -
GPT, που επικαλούνται:
Το OpenAI πιέζει την υιοθέτηση GPT, εφαρμογών τρίτων κατασκευαστών που υποστηρίζονται από τα μοντέλα τεχνητής νοημοσύνης του, ενεργοποιώντας το ChatGPT
χρήστες να τους επικαλούνται σε οποιαδήποτε συνομιλία. Οι χρήστες του ChatGPT επί πληρωμή μπορούν να φέρουν GPT σε μια συνομιλία πληκτρολογώντας “@” και επιλέγοντας ένα GPT από τη λίστα.
-
Το OpenAI συνεργάζεται με την Common Sense:
Σε μια άσχετη ανακοίνωση, το OpenAI είπε ότι συνεργάζεται με την Common Sense Media, τον μη κερδοσκοπικό οργανισμό που εξετάζει και κατατάσσει την
καταλληλότητα
διαφόρων μέσων και τεχνολογίας για παιδιά, για να συνεργαστεί σε οδηγίες τεχνητής νοημοσύνης και εκπαιδευτικό υλικό για γονείς, εκπαιδευτικούς και νέους ενήλικες. -
Αυτόνομη περιήγηση:
Η Εταιρεία Browser, η οποία κατασκευάζει το Arc Browser, προσπαθεί να δημιουργήσει μια τεχνητή νοημοσύνη που σερφάρει στον ιστό για εσάς και σας δίνει αποτελέσματα παρακάμπτοντας τις μηχανές αναζήτησης, γράφει ο Ivan.
Περισσότερες μηχανικές εκμάθηση
Γνωρίζει ένα AI τι είναι «κανονικό» ή «τυπικό» για μια δεδομένη κατάσταση, μέσο ή έκφραση; Κατά κάποιο τρόπο, τα μεγάλα γλωσσικά μοντέλα είναι μοναδικά κατάλληλα για τον προσδιορισμό των μοτίβων που μοιάζουν περισσότερο με άλλα μοτίβα στα σύνολα δεδομένων τους.
Και
μάλιστα
αυτό βρήκαν οι ερευνητές του Yale
στην έρευνά τους για το εάν μια τεχνητή νοημοσύνη θα μπορούσε να αναγνωρίσει την «τυπικότητα» ενός πράγματος σε μια ομάδα άλλων. Για παράδειγμα, λαμβάνοντας υπόψη 100 ρομαντικά μυθιστορήματα, ποιο είναι το πιο και ποιο το λιγότερο «τυπικό» δεδομένου του τι έχει αποθηκεύσει το μοντέλο για αυτό το είδος;
Είναι ενδιαφέρον (και απογοητευτικό), οι καθηγητές Balázs Kovács και Gaël Le Mens εργάστηκαν για χρόνια πάνω στο δικό τους μοντέλο, μια παραλλαγή του BERT, και μόλις επρόκειτο να δημοσιεύσουν, το ChatGPT κυκλοφόρησε και με πολλούς τρόπους αντιγράφει ακριβώς αυτό που έκαναν. «Θα μπορούσατε να κλάψετε», είπε η Le Mens σε ένα δελτίο τύπου. Αλλά τα καλά νέα είναι ότι το νέο AI και το παλιό, συντονισμένο μοντέλο τους υποδηλώνουν ότι πράγματι, αυτός ο τύπος συστήματος μπορεί να προσδιορίσει τι είναι τυπικό και άτυπο σε ένα σύνολο δεδομένων, ένα εύρημα που θα μπορούσε να είναι χρήσιμο στη συνέχεια. Και οι δύο επισημαίνουν ότι παρόλο που το ChatGPT υποστηρίζει τη διατριβή τους στην πράξη, ο κλειστός χαρακτήρας του καθιστά δύσκολη την επιστημονική εργασία.
Οι επιστήμονες στο Πανεπιστήμιο της Πενσυλβάνια εξέταζαν
μια άλλη περίεργη έννοια για ποσοτικοποίηση: η κοινή λογική
. Ζητώντας από χιλιάδες ανθρώπους να βαθμολογήσουν δηλώσεις, πράγματα όπως “παίρνετε αυτό που δίνετε” ή “μην τρώτε φαγητό μετά την ημερομηνία λήξης τους” σχετικά με το πόσο “κοινολογικά” ήταν. Δεν αποτελεί έκπληξη, αν και εμφανίστηκαν πρότυπα, «λίγες πεποιθήσεις αναγνωρίστηκαν σε επίπεδο ομάδας».
«Τα ευρήματά μας υποδηλώνουν ότι η ιδέα κάθε ατόμου για την κοινή λογική μπορεί να είναι μοναδικά δική του, καθιστώντας την έννοια λιγότερο κοινή από ό,τι θα περίμενε κανείς», λέει ο συν-επικεφαλής συγγραφέας Mark Whiting. Γιατί εμφανίζεται αυτό σε ένα ενημερωτικό δελτίο τεχνητής νοημοσύνης; Διότι όπως σχεδόν όλα τα άλλα, αποδεικνύεται ότι κάτι τόσο «απλό» όπως η κοινή λογική, που θα περίμενε κανείς να αποκτήσει τελικά η τεχνητή νοημοσύνη, δεν είναι καθόλου απλό! Αλλά ποσοτικοποιώντας το με αυτόν τον τρόπο, οι ερευνητές και οι ελεγκτές μπορεί να είναι σε θέση να πουν πόση κοινή λογική έχει ένα AI, ή με ποιες ομάδες και προκαταλήψεις ευθυγραμμίζεται.
Μιλώντας για προκαταλήψεις, πολλά μοντέλα μεγάλων γλωσσών είναι αρκετά χαλαρά με τις πληροφορίες που προσλαμβάνουν, πράγμα που σημαίνει ότι αν τους δώσετε τη σωστή προτροπή, μπορούν να απαντήσουν με τρόπους προσβλητικούς, λανθασμένους ή και τους δύο. Η Latimer είναι μια startup που στοχεύει να το αλλάξει αυτό με ένα μοντέλο που έχει σχεδιαστεί για να είναι πιο περιεκτικό.
Αν και δεν υπάρχουν πολλές λεπτομέρειες σχετικά με την προσέγγισή τους, ο Latimer λέει ότι το μοντέλο τους χρησιμοποιεί Retrieval Augmented Generation (σκέφτεται να βελτιώσει τις απαντήσεις) και ένα σωρό μοναδικά αδειοδοτημένο περιεχόμενο και δεδομένα που προέρχονται από πολλούς πολιτισμούς που δεν αντιπροσωπεύονται συνήθως σε αυτές τις βάσεις δεδομένων. Έτσι, όταν ρωτάς για κάτι, το μοντέλο δεν επιστρέφει σε κάποια μονογραφία του 19ου αιώνα για να σου απαντήσει. Θα μάθουμε περισσότερα για το μοντέλο όταν η Latimer δημοσιεύσει περισσότερες πληροφορίες.
Συντελεστές εικόνας:
Purdue / Bedrich Benes
Ωστόσο, ένα πράγμα που σίγουρα μπορεί να κάνει ένα μοντέλο τεχνητής νοημοσύνης είναι να καλλιεργεί δέντρα. Ψεύτικα δέντρα. Ερευνητές στο Ινστιτούτο Ψηφιακής Δασοκομίας του Purdue (όπου θα ήθελα να εργαστώ, καλέστε με) έφτιαξαν ένα εξαιρετικά συμπαγές μοντέλο που
προσομοιώνει την ανάπτυξη ενός δέντρου ρεαλιστικά
. Αυτό είναι ένα από εκείνα τα προβλήματα που φαίνεται απλό αλλά δεν είναι. Μπορείτε να προσομοιώσετε την ανάπτυξη δέντρων που λειτουργεί αν κάνετε ένα παιχνίδι ή ταινία, σίγουρα, αλλά τι γίνεται με τη σοβαρή επιστημονική εργασία; «Αν και η τεχνητή νοημοσύνη έχει γίνει φαινομενικά διάχυτη, μέχρι στιγμής έχει αποδειχθεί πολύ επιτυχημένη στη μοντελοποίηση τρισδιάστατων γεωμετριών που δεν σχετίζονται με τη φύση», δήλωσε ο επικεφαλής συγγραφέας Bedrich Benes.
Το νέο τους μοντέλο είναι περίπου ένα megabyte, το οποίο είναι εξαιρετικά μικρό για ένα σύστημα AI. Αλλά φυσικά το DNA είναι ακόμη μικρότερο και πιο πυκνό, και κωδικοποιεί ολόκληρο το δέντρο, από τη ρίζα μέχρι το μπουμπούκι. Το μοντέλο εξακολουθεί να λειτουργεί αφηρημένα – δεν είναι σε καμία περίπτωση μια τέλεια προσομοίωση της φύσης – αλλά δείχνει ότι οι πολυπλοκότητες της ανάπτυξης δέντρων μπορούν να κωδικοποιηθούν σε ένα σχετικά απλό μοντέλο.
Τελευταίο, ένα ρομπότ από ερευνητές του Πανεπιστημίου του Κέμπριτζ που μπορεί να διαβάσει μπράιγ πιο γρήγορα από έναν άνθρωπο, με ακρίβεια 90%. Γιατί ρωτάς? Στην πραγματικότητα, δεν είναι για τυφλούς να χρησιμοποιούν – η ομάδα αποφάσισε ότι αυτό ήταν μια ενδιαφέρουσα και εύκολα ποσοτικοποιημένη εργασία για να δοκιμάσει την ευαισθησία και την ταχύτητα των ρομποτικών άκρων των δακτύλων. Αν μπορεί να διαβάσει μπράιγ απλώς μεγεθύνοντας πάνω του, αυτό είναι καλό σημάδι!
Μπορείτε να διαβάσετε περισσότερα για αυτήν την ενδιαφέρουσα προσέγγιση εδώ
. Ή δείτε το παρακάτω βίντεο:
VIA:
techcrunch.com

