Η εβδομάδα στην τεχνητή νοημοσύνη: Η Google καταβάλλει κάθε προσπάθεια στο I/O καθώς οι κανονισμοί επιβάλλονται
Related Posts
Το να συμβαδίζεις με έναν κλάδο τόσο γρήγορο όσο η τεχνητή νοημοσύνη είναι μια μεγάλη παραγγελία. Έτσι, έως ότου μια τεχνητή νοημοσύνη μπορεί να το κάνει για εσάς, εδώ είναι μια χρήσιμη σύνοψη των ιστοριών της περασμένης εβδομάδας στον κόσμο της μηχανικής μάθησης, μαζί με αξιοσημείωτες έρευνες και πειράματα που δεν καλύψαμε από μόνα τους.
Αυτή την εβδομάδα, η Google κυριάρχησε στον κύκλο ειδήσεων AI με μια σειρά νέων προϊόντων που παρουσιάστηκαν στο ετήσιο συνέδριο προγραμματιστών I/O. Εκτελούν τη γκάμα από μια τεχνητή νοημοσύνη που δημιουργεί κώδικα που προορίζεται να ανταγωνιστεί το Copilot του GitHub σε μια γεννήτρια μουσικής AI που μετατρέπει τα μηνύματα κειμένου σε σύντομα τραγούδια.
Αρκετός αριθμός αυτών των εργαλείων φαίνεται να είναι νόμιμη εξοικονόμηση εργατικού δυναμικού — κάτι περισσότερο από χνούδι μάρκετινγκ, αυτό σημαίνει. Με ενδιαφέρει ιδιαίτερα το Project Tailwind, μια εφαρμογή λήψης σημειώσεων που αξιοποιεί την τεχνητή νοημοσύνη για την οργάνωση, τη σύνοψη και την ανάλυση αρχείων από έναν προσωπικό φάκελο των Εγγράφων Google. Αλλά εκθέτουν επίσης τους περιορισμούς και τις αδυναμίες ακόμη και των καλύτερων τεχνολογιών τεχνητής νοημοσύνης σήμερα.
Πάρτε το PaLM 2, για παράδειγμα, το νεότερο μοντέλο μεγάλων γλωσσών (LLM) της Google. Το PaLM 2 θα τροφοδοτήσει το ενημερωμένο εργαλείο συνομιλίας Bard της Google, τον ανταγωνιστή της εταιρείας στο ChatGPT του OpenAI, και θα λειτουργήσει ως το βασικό μοντέλο για τις περισσότερες από τις νέες δυνατότητες AI της Google. Όμως, ενώ το PaLM 2 μπορεί να γράψει κώδικα, μηνύματα ηλεκτρονικού ταχυδρομείου και πολλά άλλα, όπως συγκρίσιμα LLM, απαντά επίσης σε ερωτήσεις με τοξικούς και προκατειλημμένους τρόπους.
Η γεννήτρια μουσικής της Google, επίσης, είναι αρκετά περιορισμένη σε ό,τι μπορεί να επιτύχει. Όπως έγραψα στα χέρια μου, τα περισσότερα από τα τραγούδια που έχω δημιουργήσει με τον ήχο MusicLM είναι βατά στην καλύτερη περίπτωση — και στη χειρότερη σαν ένα τετράχρονο παιδί που αφήνεται ελεύθερο σε
ΚΑΛΙΑΚΟΥΔΑ
.
Έχουν γραφτεί πολλά για το πώς η τεχνητή νοημοσύνη θα αντικαταστήσει τις θέσεις εργασίας — ενδεχομένως ισοδύναμο με 300 εκατομμύρια θέσεις πλήρους απασχόλησης, σύμφωνα με
κανω ΑΝΑΦΟΡΑ
από την Goldman Sachs. Σε ένα
επισκόπηση
από τον Harris, το 40% των εργαζομένων που είναι εξοικειωμένοι με το εργαλείο chatbot του OpenAI, ChatGPT, ανησυχούν ότι θα αντικαταστήσει πλήρως τις εργασίες τους.
Το AI της Google δεν είναι το τέλος όλων. Πράγματι, της εταιρείας
αναμφισβήτητα πίσω
στον αγώνα AI. Αλλά είναι ένα αναμφισβήτητο γεγονός ότι η Google χρησιμοποιεί
μερικοί από τους κορυφαίους ερευνητές τεχνητής νοημοσύνης στον κόσμο
. Και αν αυτό είναι το καλύτερο που μπορούν να διαχειριστούν, είναι απόδειξη του γεγονότος ότι η τεχνητή νοημοσύνη απέχει πολύ από το να λυθεί το πρόβλημα.
Ακολουθούν οι άλλοι τίτλοι τεχνητής νοημοσύνης από τις τελευταίες ημέρες:
-
Η Meta φέρνει τη γενετική τεχνητή νοημοσύνη στις διαφημίσεις:
Η Meta ανακοίνωσε αυτή την εβδομάδα ένα sandbox τεχνητής νοημοσύνης, κατά κάποιο τρόπο, για τους διαφημιστές για να τους βοηθήσουν να δημιουργήσουν εναλλακτικά αντίγραφα, δημιουργία φόντου μέσω μηνυμάτων κειμένου και περικοπή εικόνων για διαφημίσεις Facebook ή Instagram. Η εταιρεία είπε ότι οι λειτουργίες είναι διαθέσιμες σε επιλεγμένους διαφημιστές αυτήν τη στιγμή και θα επεκτείνει την πρόσβαση σε περισσότερους διαφημιστές τον Ιούλιο. -
Προστέθηκε πλαίσιο:
Η Anthropic έχει επεκτείνει το παράθυρο περιβάλλοντος για τον Claude – το ναυαρχίδα του μοντέλου τεχνητής νοημοσύνης που δημιουργεί κείμενο, ακόμα σε προεπισκόπηση – από 9.000 μάρκες σε 100.000 μάρκες. Το παράθυρο περιβάλλοντος αναφέρεται στο κείμενο που εξετάζει το μοντέλο πριν δημιουργήσει πρόσθετο κείμενο, ενώ τα διακριτικά αντιπροσωπεύουν ακατέργαστο κείμενο (π.χ., η λέξη “φανταστικό” θα χωριστεί στα διακριτικά “fan”, “tas” και “tic”). Ιστορικά και ακόμη και σήμερα, η κακή μνήμη ήταν εμπόδιο στη χρησιμότητα της τεχνητής νοημοσύνης που δημιουργεί κείμενο. Αλλά μεγαλύτερα παράθυρα περιβάλλοντος θα μπορούσαν να το αλλάξουν αυτό. -
Anthropic touts “constitutional AI”:
Τα μεγαλύτερα παράθυρα πλαισίου δεν είναι ο μόνος παράγοντας διαφοροποίησης των μοντέλων Anthropic. Αυτή την εβδομάδα, η εταιρεία παρουσίασε λεπτομερώς τη «συνταγματική τεχνητή νοημοσύνη», την εσωτερική της τεχνική εκπαίδευσης τεχνητής νοημοσύνης που στοχεύει να εμποτίσει τα συστήματα τεχνητής νοημοσύνης με «αξίες» που ορίζονται από ένα «σύνταγμα». Σε αντίθεση με άλλες προσεγγίσεις, η Anthropic υποστηρίζει ότι η συνταγματική τεχνητή νοημοσύνη κάνει τη συμπεριφορά των συστημάτων τόσο πιο κατανοητή όσο και απλούστερη στην προσαρμογή ανάλογα με τις ανάγκες. -
Ένα LLM που δημιουργήθηκε για έρευνα:
Το μη κερδοσκοπικό Allen Institute for AI Research (AI2) ανακοίνωσε ότι σχεδιάζει να εκπαιδεύσει ένα LLM εστιασμένο στην έρευνα που ονομάζεται Open Language Model, προσθέτοντας στη μεγάλη και αναπτυσσόμενη βιβλιοθήκη ανοιχτού κώδικα. Το AI2 βλέπει το Open Language Model, ή το OLMo για συντομία, ως μια πλατφόρμα και όχι απλώς ως μοντέλο — ένα που θα επιτρέψει στην ερευνητική κοινότητα να λάβει κάθε στοιχείο που δημιουργεί το AI2 και είτε να το χρησιμοποιήσει ο ίδιος είτε να επιδιώξει να το βελτιώσει. -
Νέο ταμείο για AI:
Σε άλλες ειδήσεις του AI2, το AI2 Incubator, το startup fund της μη κερδοσκοπικής τεχνητής νοημοσύνης, ανεβάζει και πάλι στροφές στο τριπλάσιο του προηγούμενου μεγέθους του — 30 εκατομμύρια δολάρια έναντι 10 εκατομμυρίων δολαρίων. Είκοσι μία εταιρείες πέρασαν από τη θερμοκοιτίδα από το 2017, προσελκύοντας περίπου 160 εκατομμύρια δολάρια σε περαιτέρω επενδύσεις και τουλάχιστον μία σημαντική εξαγορά: το XNOR, ένα εξάρτημα επιτάχυνσης και απόδοσης AI που στη συνέχεια εξαγοράστηκε από την Apple για περίπου 200 εκατομμύρια δολάρια. -
Κανόνες εισαγωγής της ΕΕ για τη γενετική τεχνητή νοημοσύνη:
Σε μια σειρά ψηφοφοριών στο Ευρωπαϊκό Κοινοβούλιο, οι ευρωβουλευτές στήριξαν αυτή την εβδομάδα μια σειρά τροπολογιών στο σχέδιο νομοθεσίας για την τεχνητή νοημοσύνη του μπλοκ — συμπεριλαμβανομένης της διευθέτησης των απαιτήσεων για τα λεγόμενα θεμελιώδη μοντέλα που στηρίζουν τις παραγωγικές τεχνολογίες τεχνητής νοημοσύνης όπως το ChatGPT του OpenAI. Οι τροπολογίες αναθέτουν το βάρος στους παρόχους βασικών μοντέλων να εφαρμόζουν ελέγχους ασφαλείας, μέτρα διακυβέρνησης δεδομένων και μετριασμούς κινδύνου πριν διαθέσουν τα μοντέλα τους στην αγορά -
Ένας παγκόσμιος μεταφραστής:
Η Google δοκιμάζει μια ισχυρή νέα υπηρεσία μετάφρασης που επαναφέρει το βίντεο σε μια νέα γλώσσα, ενώ συγχρονίζει επίσης τα χείλη του ομιλητή με λέξεις που δεν μίλησε ποτέ. Θα μπορούσε να είναι πολύ χρήσιμο για πολλούς λόγους, αλλά η εταιρεία ήταν εκ των προτέρων σχετικά με την πιθανότητα κατάχρησης και τα μέτρα που έγιναν για την αποτροπή της. -
Αυτοματοποιημένες επεξηγήσεις:
Λέγεται συχνά ότι τα LLM σύμφωνα με το ChatGPT του OpenAI είναι ένα μαύρο κουτί, και σίγουρα, υπάρχει κάποια αλήθεια σε αυτό. Σε μια προσπάθεια να ξεφλουδίσει τα στρώματά τους, το OpenAI είναι
ανάπτυξη
ένα εργαλείο για να προσδιορίζει αυτόματα ποια μέρη ενός LLM είναι υπεύθυνα για ποιες από τις συμπεριφορές του. Οι μηχανικοί πίσω από αυτό τονίζουν ότι βρίσκεται στα αρχικά στάδια, αλλά ο κώδικας για την εκτέλεση του είναι διαθέσιμος σε ανοιχτό κώδικα στο GitHub από αυτήν την εβδομάδα. -
Η IBM εγκαινιάζει νέες υπηρεσίες AI:
Στο ετήσιο συνέδριο Think, η IBM ανακοίνωσε την IBM Watsonx, μια νέα πλατφόρμα που παρέχει εργαλεία για τη δημιουργία μοντέλων τεχνητής νοημοσύνης και παρέχει πρόσβαση σε προεκπαιδευμένα μοντέλα για τη δημιουργία κώδικα υπολογιστή, κειμένου και πολλά άλλα. Η εταιρεία λέει ότι το λανσάρισμα είχε ως κίνητρο τις προκλήσεις που πολλές επιχειρήσεις εξακολουθούν να αντιμετωπίζουν στην ανάπτυξη της τεχνητής νοημοσύνης στο χώρο εργασίας.
Άλλες μηχανές εκμάθησης
Συντελεστές εικόνας:
Προσγείωση AI
Η νέα εταιρεία του Andrew Ng
Προσγείωση AI
ακολουθεί μια πιο διαισθητική προσέγγιση για τη δημιουργία εκπαίδευσης όρασης υπολογιστή. Το να κάνεις ένα μοντέλο να καταλάβει τι θέλεις να αναγνωρίσεις στις εικόνες είναι αρκετά επίπονο, αλλά
η τεχνική τους «οπτικής προτροπής».
σας επιτρέπει να κάνετε μόνο μερικές πινελιές και να καταλάβετε την πρόθεσή σας από εκεί. Όποιος πρέπει να δημιουργήσει μοντέλα τμηματοποίησης λέει “θεέ μου, επιτέλους!” Πιθανώς πολλοί φοιτητές που περνούν ώρες καλύπτοντας οργανίδια και οικιακά αντικείμενα.
Η Microsoft υπέβαλε αίτηση
μοντέλα διάχυσης με μοναδικό και ενδιαφέρον τρόπο
, ουσιαστικά τα χρησιμοποιεί για να δημιουργήσει ένα διάνυσμα δράσης αντί για μια εικόνα, έχοντας το εκπαιδεύσει σε πολλές παρατηρούμενες ανθρώπινες ενέργειες. Είναι ακόμα πολύ νωρίς και η διάχυση δεν είναι η προφανής λύση για αυτό, αλλά καθώς είναι σταθερά και ευέλικτα, είναι ενδιαφέρον να δούμε πώς μπορούν να εφαρμοστούν πέρα από καθαρά οπτικές εργασίες. Η εργασία τους θα παρουσιαστεί στο ICLR αργότερα φέτος.
Συντελεστές εικόνας:
Μετα
Η Meta πιέζει επίσης τα άκρα της τεχνητής νοημοσύνης με
ImageBind
, το οποίο ισχυρίζεται ότι είναι το πρώτο μοντέλο που μπορεί να επεξεργάζεται και να ενσωματώνει δεδομένα από έξι διαφορετικούς τρόπους: εικόνες και βίντεο, ήχο, τρισδιάστατα δεδομένα βάθους, θερμικές πληροφορίες και δεδομένα κίνησης ή θέσης. Αυτό σημαίνει ότι στον μικρό χώρο ενσωμάτωσης της μηχανικής εκμάθησης, μια εικόνα μπορεί να συσχετιστεί με έναν ήχο, ένα τρισδιάστατο σχήμα και διάφορες περιγραφές κειμένου, οποιαδήποτε από τις οποίες θα μπορούσε να ερωτηθεί ή να χρησιμοποιηθεί για τη λήψη μιας απόφασης. Είναι ένα βήμα προς τη «γενική» τεχνητή νοημοσύνη, καθώς απορροφά και συσχετίζει δεδομένα περισσότερο σαν τον εγκέφαλο — αλλά εξακολουθεί να είναι βασικό και πειραματικό, οπότε μην ενθουσιάζεστε πολύ ακόμα.
Εάν αυτές οι πρωτεΐνες αγγίξουν… τι συμβαίνει;
Όλοι ενθουσιάστηκαν με το AlphaFold, και για καλό λόγο, αλλά στην πραγματικότητα η δομή είναι μόνο ένα μικρό μέρος της πολύ περίπλοκης επιστήμης της πρωτεομικής. Είναι σημαντικό και δύσκολο να προβλεφθεί το πώς αλληλεπιδρούν αυτές οι πρωτεΐνες — αλλά αυτό είναι καινούργιο
Μοντέλο PeSTo από την EPFL
προσπαθεί να κάνει ακριβώς αυτό. «Εστιάζει σε σημαντικά άτομα και αλληλεπιδράσεις εντός της πρωτεϊνικής δομής», δήλωσε ο επικεφαλής της ανάπτυξης Lucien Krapp. «Σημαίνει ότι αυτή η μέθοδος καταγράφει αποτελεσματικά τις πολύπλοκες αλληλεπιδράσεις εντός των πρωτεϊνικών δομών για να επιτρέψει την ακριβή πρόβλεψη των διεπαφών δέσμευσης πρωτεϊνών». Ακόμα κι αν δεν είναι ακριβές ή 100% αξιόπιστο, το να μην χρειάζεται να ξεκινήσετε από το μηδέν είναι εξαιρετικά χρήσιμο για τους ερευνητές.
Οι ομοσπονδιακοί προχωρούν πολύ στο AI. Ο Πρόεδρος έπεσε μάλιστα σε ένα
συνάντηση με ένα σωρό κορυφαίους CEOs AI
να πει πόσο σημαντικό είναι να γίνει αυτό σωστά. Ίσως πολλές εταιρείες να μην είναι απαραιτήτως οι κατάλληλες για να ρωτήσουν, αλλά θα έχουν τουλάχιστον κάποιες ιδέες που αξίζει να εξεταστούν. Αλλά έχουν ήδη λομπίστες, σωστά;
Είμαι πιο ενθουσιασμένος με το
νέα ερευνητικά κέντρα AI που εμφανίζονται με ομοσπονδιακή χρηματοδότηση
. Η βασική έρευνα είναι εξαιρετικά απαραίτητη για να αντισταθμιστεί η εργασία που επικεντρώνεται στο προϊόν που γίνεται από εταιρείες όπως η OpenAI και η Google — οπότε όταν έχετε κέντρα τεχνητής νοημοσύνης με εντολές να διερευνήσετε πράγματα όπως
κοινωνικές επιστήμες (στο CMU)
ή κλιματική αλλαγή και γεωργία (
στο U της Μινεσότα
), μοιάζει με πράσινα χωράφια (τόσο μεταφορικά όσο και κυριολεκτικά). Αν και θέλω επίσης να δώσω μια μικρή κραυγή σε αυτό
Μετα-έρευνα για τη μέτρηση της δασοκομίας
.
Κάνοντας AI μαζί σε μια μεγάλη οθόνη — είναι επιστήμη!
Πολλές ενδιαφέρουσες συζητήσεις εκεί έξω για την τεχνητή νοημοσύνη. σκέφτηκα
αυτή η συνέντευξη με τους ακαδημαϊκούς Jacob Foster και Danny Snelson του UCLA (το alma mater, go Bruins)
ήταν ένα ενδιαφέρον. Εδώ είναι μια υπέροχη σκέψη για τα LLM για να προσποιηθείτε ότι βρήκατε αυτό το Σαββατοκύριακο όταν οι άνθρωποι μιλούν για AI:
Αυτά τα συστήματα αποκαλύπτουν πόσο τυπικά συνεπής είναι τα περισσότερα γραπτά. Όσο πιο γενικές είναι οι μορφές που προσομοιώνουν αυτά τα μοντέλα πρόβλεψης, τόσο πιο επιτυχημένα είναι. Αυτές οι εξελίξεις μας ωθούν να αναγνωρίσουμε τις κανονιστικές λειτουργίες των μορφών μας και ενδεχομένως να τις μεταμορφώσουμε. Μετά την εισαγωγή της φωτογραφίας, η οποία είναι πολύ καλή στην σύλληψη ενός αναπαραστατικού χώρου, το ζωγραφικό περιβάλλον ανέπτυξε τον ιμπρεσιονισμό, ένα ύφος που απέρριψε εντελώς την ακριβή αναπαράσταση για να παραμείνει στην υλικότητα του ίδιου του χρώματος.
Το χρησιμοποιεί οπωσδήποτε!

