Αυτή την εβδομάδα στο AI: Το OpenAI παίζει για κρατήσεις με GPT

By

Marizas Dimitris

On

Νοέ 10, 2023

Το να συμβαδίζεις με έναν κλάδο τόσο γρήγορο όσο η τεχνητή νοημοσύνη είναι μια μεγάλη παραγγελία. Έτσι, έως ότου μια τεχνητή νοημοσύνη μπορεί να το κάνει για εσάς, ακολουθεί μια χρήσιμη συλλογή από πρόσφατες ιστορίες στον κόσμο της μηχανικής

μάθηση

ς, μαζί με αξιοσημείωτες έρευνες και πειράματα που δεν καλύψαμε από μόνα τους.

Αυτή την εβδομάδα στην τεχνητή νοημοσύνη, το OpenAI πραγματοποίησε το πρώτο από αυτά που πιθανώς θα είναι πολλά συνέδρια προγραμματιστών που θα ακολουθήσουν. Κατά τη διάρκεια της κεντρικής ομιλίας, η εταιρεία παρουσίασε μια σειρά από νέα προϊόντα, όπως μια βελτιωμένη έκδοση του GPT-4, νέα μοντέλα μετατροπής κειμένου σε ομιλία και ένα API για το DALL-E 3 που δημιουργεί εικόνα, μεταξύ άλλων.

Αλλά χωρίς αμφιβολία η πιο σημαντική ανακοίνωση ήταν τα GPT.

Τα GPT του OpenAI παρέχουν έναν τρόπο στους προγραμματιστές να δημιουργήσουν τα δικά τους συστήματα συνομιλίας AI που υποστηρίζονται από μοντέλα του OpenAI και να τα δημοσιεύουν σε μια αγορά που φιλοξενείται από το OpenAI που ονομάζεται GPT Store. Σύντομα, οι προγραμματιστές θα μπορούν ακόμη και να δημιουργούν έσοδα από GPT με βάση τον αριθμό των ατόμων που τα χρησιμοποιούν, δήλωσε στη σκηνή ο CEO του OpenAI Sam Altman στη διάσκεψη.

«Πιστεύουμε ότι αν δώσετε στους ανθρώπους καλύτερα εργαλεία, θα κάνουν καταπληκτικά πράγματα», είπε ο Άλτμαν. “Μπορείτε να δημιουργήσετε ένα GPT… και στη συνέχεια μπορείτε να το δημοσιεύσετε για να το χρησιμοποιήσουν άλλοι και επειδή συνδυάζουν οδηγίες, διευρυμένες γνώσεις και ενέργειες, μπορούν να σας βοηθήσουν περισσότερο.”

Η μετατόπιση του OpenAI από πάροχο μοντέλων τεχνητής νοημοσύνης σε πλατφόρμα ήταν ενδιαφέρουσα, σίγουρα — αλλά όχι ακριβώς απρόβλεπτη. Η startup τηλεγράφησε τις φιλοδοξίες της τον Μάρτιο με την κυκλοφορία των προσθηκών για το ChatGPT, το chatbot που λειτουργεί με τεχνητή νοημοσύνη, το οποίο έφερε για πρώτη φορά τρίτους στο μοντέλο οικοσύστημα του OpenAI.

Αλλά αυτό που έπιασε αυτόν τον συγγραφέα απροσδόκητο ήταν το εύρος και το βάθος της οικοδόμησης GPT του OpenAI – και της εμπορευματοποίησης – εργαλείων έξω από την πύλη.

Ο συνάδελφός μου Devin Coldewey, ο οποίος παρακολούθησε αυτοπροσώπως το συνέδριο του OpenAI, μου λέει ότι η εμπειρία του GPT ήταν «λίγο δυσάρεστη» στα demo — αλλά λειτουργεί όπως διαφημίζεται, λίγο πολύ. Τα GPT δεν απαιτούν εμπειρία κωδικοποίησης και μπορεί να είναι τόσο απλά ή σύνθετα όσο επιθυμεί ένας προγραμματιστής. Για παράδειγμα, ένα GPT μπορεί να εκπαιδευτεί σε μια συλλογή βιβλίων μαγειρικής, ώστε να μπορεί να απαντήσει σε ερωτήσεις σχετικά με τα συστατικά για μια συγκεκριμένη συνταγή. Ή ένα GPT θα μπορούσε να απορροφήσει τις ιδιόκτητες βάσεις κωδικών μιας εταιρείας, έτσι ώστε οι προγραμματιστές να μπορούν να ελέγξουν το στυλ τους ή να δημιουργήσουν κώδικα σύμφωνα με τις βέλτιστες πρακτικές.

Τα GPT εκδημοκρατίζουν αποτελεσματικά τη δημιουργία εφαρμογών τεχνητής νοημοσύνης — τουλάχιστον για εφαρμογές που χρησιμοποιούν την οικογένεια μοντέλων του OpenAI. Και αν ήμουν οι αντίπαλοι του OpenAI —τουλάχιστον οι αντίπαλοι χωρίς υποστήριξη από την Big Tech— θα έτρεχα στον εικονιστικό χώρο αποθήκης για να συγκεντρώσω μια απάντηση.

Το GPT θα μπορούσε να σκοτώσει συμβούλους των οποίων τα επιχειρηματικά μοντέλα περιστρέφονται γύρω από την κατασκευή όσων είναι ουσιαστικά GPT για τους πελάτες. Και για πελάτες με ταλέντο προγραμματιστή, θα μπορούσε να κάνει παρόχους μοντέλων αυτό

όχι

προσφέρουν οποιαδήποτε μορφή εργαλείων δημιουργίας εφαρμογών λιγότερο ελκυστικά, δεδομένης της πολυπλοκότητας της σύζευξης των API ενός παρόχου σε υπάρχουσες εφαρμογές και υπηρεσίες.

Είναι καλό αυτό; Θα έλεγα όχι απαραίτητα — και ανησυχώ για το ενδεχόμενο μονοπωλίου. Αλλά το OpenAI έχει πλεονέκτημα πρώτης κίνησης και το αξιοποιεί — καλώς ή κακώς.

Ακολουθούν μερικές άλλες αξιοσημείωτες ιστορίες AI από τις τελευταίες ημέρες:

Η Samsung αποκαλύπτει το γενεσιουργό AI:

Μόλις λίγες μέρες μετά την εκδήλωση προγραμματιστών του OpenAI, η Samsung αποκάλυψε τη δική της γενεαλογική οικογένεια τεχνητής νοημοσύνης, τη Samsung Gauss, στο Samsung AI Forum 2023. Αποτελείται από τρία μοντέλα — ένα μοντέλο μεγάλης γλώσσας παρόμοιο με το ChatGPT, ένα μοντέλο παραγωγής κώδικα και μια δημιουργία εικόνας και μοντέλο επεξεργασίας — Το Samsung Gauss χρησιμοποιείται τώρα εσωτερικά με το προσωπικό της Samsung, είπε η εταιρεία τεχνολογίας και θα είναι διαθέσιμο στους δημόσιους χρήστες «στο εγγύς μέλλον».
Η Microsoft παρέχει σε startup δωρεάν υπολογιστές AI:

Η Microsoft ανακοίνωσε αυτή την εβδομάδα ότι ενημερώνει το πρόγραμμα εκκίνησης της, το Microsoft for Startups Founders Hub, για να συμπεριλάβει μια δωρεάν επιλογή υποδομής Azure AI για συμπλέγματα εικονικών μηχανών GPU «υψηλών προδιαγραφών» που βασίζονται στην Nvidia για εκπαίδευση και εκτέλεση μοντέλων παραγωγής. Το Y Combinator και η κοινότητα των ιδρυτών startup θα είναι οι πρώτοι που θα αποκτήσουν πρόσβαση στα cluster σε ιδιωτική προεπισκόπηση, ακολουθούμενο από το M12, το venture fund της Microsoft και τις νεοφυείς επιχειρήσεις στο χαρτοφυλάκιο της M12 — και ενδεχομένως άλλους επενδυτές startup και επιταχυντές μετά από αυτό.
Το YouTube δοκιμάζει παραγωγικές δυνατότητες AI:

Το YouTube θα αρχίσει σύντομα να πειραματίζεται με νέες δυνατότητες παραγωγής τεχνητής νοημοσύνης, σύμφωνα με την εταιρεία

ανακοινώθηκε

αυτή την εβδομάδα. Ως μέρος του πακέτου premium που διατίθεται στους συνδρομητές YouTube που πληρώνουν, οι χρήστες θα μπορούν να δοκιμάσουν ένα εργαλείο συνομιλίας που χρησιμοποιεί τεχνητή νοημοσύνη για να απαντά σε ερωτήσεις σχετικά με το περιεχόμενο του YouTube και να κάνει προτάσεις, καθώς και μια λειτουργία που συνοψίζει θέματα στα σχόλια ενός βίντεο.
Μια συνέντευξη με τον επικεφαλής της ρομποτικής της DeepMind:

Ο Brian μίλησε με τον Vincent Vanhoucke, επικεφαλής ρομποτικής του Google DeepMind, για τις μεγάλες ρομποτικές φιλοδοξίες της Google. Η συνέντευξη έθιξε μια σειρά θεμάτων, συμπεριλαμβανομένων των ρομπότ γενικής χρήσης, της γενετικής τεχνητής νοημοσύνης και — από όλα τα πράγματα — του Wi-Fi γραφείου.
Η startup AI του Kai-Fu Lee αποκαλύπτει το μοντέλο:

Ο Kai-Fu Lee, ο επιστήμονας υπολογιστών γνωστός στη Δύση για το μπεστ σέλερ του «AI Superpowers» και στην Κίνα για τα στοιχήματά του στους μονόκερους AI, κερδίζει εντυπωσιακό έδαφος με τη δική του startup τεχνητής νοημοσύνης.

01.AI

. Επτά μήνες μετά την ίδρυσή της, η 01.AI — αξίας 1 δισεκατομμυρίου δολαρίων — κυκλοφόρησε το πρώτο της μοντέλο, τον ανοιχτό κώδικα

Yi-34B

.
Το GitHub πειράζει το προσαρμόσιμο σχέδιο Copilot:

Το GitHub ανακοίνωσε αυτή την εβδομάδα σχέδια για ένα επίπεδο

συνδρομή

ς για επιχειρήσεις που θα επιτρέπει στις εταιρείες να ρυθμίζουν με ακρίβεια τον προγραμματιστή ζεύγους Copilot με βάση την εσωτερική τους βάση κωδικών. Η είδηση αποτελούσε μέρος μιας σειράς αξιοσημείωτων στοιχείων που αποκάλυψε η εταιρεία που ανήκει στη Microsoft στο ετήσιο συνέδριο προγραμματιστών GitHub Universe την Τετάρτη, συμπεριλαμβανομένου ενός νέου προγράμματος συνεργατών, καθώς και παροχής περισσότερης σαφήνειας σχετικά με το πότε το Copilot Chat – η δυνατότητα που αποκάλυψε πρόσφατα η Copilot που μοιάζει με chatbot – θα είναι επίσημα διαθέσιμο.
Η ομάδα μοντέλων δύο ατόμων του Hugging Face:

Η startup AI Hugging Face προσφέρει ένα ευρύ φάσμα εργαλείων φιλοξενίας και ανάπτυξης της επιστήμης δεδομένων. Αλλά μερικά από τα πιο εντυπωσιακά – και ικανά – εργαλεία της εταιρείας αυτές τις μέρες προέρχονται από μια ομάδα δύο ατόμων που σχηματίστηκε μόλις τον Ιανουάριο, που ονομάζεται H4.
Η Mozilla κυκλοφορεί ένα

chatbot AI

:

Νωρίτερα φέτος, η Mozilla εξαγόρασε την Fakespot, μια startup που αξιοποιεί την τεχνητή νοημοσύνη και τη μηχανική μάθηση για να εντοπίσει ψεύτικες και παραπλανητικές κριτικές προϊόντων. Τώρα, η Mozilla λανσάρει το πρώτο της μεγάλο μοντέλο γλώσσας με την άφιξη του

Fakespot Chat,

ένας πράκτορας τεχνητής νοημοσύνης που βοηθά τους καταναλωτές καθώς πραγματοποιούν αγορές μέσω Διαδικτύου απαντώντας σε ερωτήσεις σχετικά με προϊόντα και ακόμη προτείνοντας ερωτήσεις που θα μπορούσαν να είναι χρήσιμες στην έρευνα προϊόντων.

Περισσότερες μηχανικές εκμάθηση

Έχουμε δει σε πολλούς κλάδους πώς τα μοντέλα μηχανικής μάθησης είναι σε θέση να κάνουν πολύ καλές βραχυπρόθεσμες

προβλέψεις

για πολύπλοκες δομές δεδομένων μετά από μελέτη πολλών προηγούμενων παραδειγμάτων. Για παράδειγμα, θα μπορούσε να παρατείνει την περίοδο προειδοποίησης για επερχόμενους σεισμούς, δίνοντας στους ανθρώπους ένα κρίσιμο επιπλέον 20-30 δευτερόλεπτα για να καλύψουν. Και η Google έχει αποδείξει ότι είναι ένα πολύ δυνατό χέρι στην πρόβλεψη των καιρικών προτύπων επίσης.

Αρκετά φαίνονται από την ανάρτηση που δείχνουν πώς η MetNet ενσωματώνει δεδομένα στις προβλέψεις της που βασίζονται σε ML.

Συντελεστές εικόνας:

Google

Το MetNet-3 είναι το πιο πρόσφατο σε μια σειρά μοντέλων καιρού με βάση τη φυσική που εξετάζει μια ποικιλία μεταβλητών, όπως η βροχόπτωση, η θερμοκρασία, ο άνεμος και η νεφοκάλυψη, και παράγουν εκπληκτικά υψηλής ανάλυσης προβλέψεις (χρονικές και χωρικές) για το τι είναι πιθανό έλα επόμενο. Πολλές από αυτές τις προβλέψεις βασίζονται σε αρκετά παλιά μοντέλα, τα οποία ορισμένες φορές είναι ακριβή αλλά άλλες όχι, ή μπορούν να γίνουν πιο ακριβή συνδυάζοντας τα δεδομένα τους με άλλες πηγές — αυτό που κάνει το MetNet-3. Δεν θα μπω πολύ στις λεπτομέρειες, αλλά

ανέβασαν μια πολύ ενδιαφέρουσα ανάρτηση για το θέμα

την περασμένη εβδομάδα που δίνει μια υπέροχη αίσθηση του πώς λειτουργούν οι σύγχρονοι κινητήρες πρόβλεψης καιρού.

Σε άλλες πολύ συγκεκριμένες επιστημονικές ειδήσεις, ερευνητές από το Πανεπιστήμιο του Κάνσας έκαναν

ένας ανιχνευτής για κείμενο που δημιουργείται από AI… για άρθρα σε περιοδικά σχετικά με τη χημεία

. Σίγουρα, δεν είναι χρήσιμο για τους περισσότερους ανθρώπους, αλλά αφού το OpenAI και άλλοι πάτησαν τα φρένα στα μοντέλα ανιχνευτών, είναι χρήσιμο να δείξουμε ότι τουλάχιστον κάτι πιο περιορισμένο είναι δυνατό. «Το μεγαλύτερο μέρος του πεδίου της ανάλυσης κειμένου θέλει έναν πραγματικά γενικό ανιχνευτή που θα λειτουργεί σε οτιδήποτε», δήλωσε η συν-συγγραφέας Heather Desaire. «Πραγματικά αναζητούσαμε την ακρίβεια».

Το μοντέλο τους εκπαιδεύτηκε σε άρθρα από το περιοδικό της American Chemical Society, μαθαίνοντας να γράφουν εισαγωγικές ενότητες μόνο από τον τίτλο και μόνο από την περίληψη. Αργότερα μπόρεσε να αναγνωρίσει τις γραπτές εισαγωγές ChatGPT-3.5 με σχεδόν τέλεια ακρίβεια. Προφανώς πρόκειται για μια εξαιρετικά περιορισμένη περίπτωση χρήσης, αλλά η ομάδα επισημαίνει ότι μπόρεσαν να τη ρυθμίσουν αρκετά γρήγορα και εύκολα, πράγμα που σημαίνει ότι θα μπορούσε να δημιουργηθεί ένας ανιχνευτής για διαφορετικές επιστήμες, περιοδικά και γλώσσες.

Δεν υπάρχει ακόμα ένα για τα δοκίμια εισαγωγής στο κολέγιο, αλλά η τεχνητή νοημοσύνη μπορεί να βρίσκεται στην άλλη πλευρά αυτής της διαδικασίας σύντομα, χωρίς να αποφασίζει ποιος θα μπει, αλλά βοηθώντας τους υπαλλήλους εισαγωγών να εντοπίσουν τα διαμάντια. Ερευνητές από το Πανεπιστήμιο του Κολοράντο και το UPenn έδειξαν ότι ένα μοντέλο ML ήταν σε θέση

αναγνωρίζουν με επιτυχία αποσπάσματα σε δοκίμια μαθητών που έδειχναν ενδιαφέροντα και ιδιότητες

όπως ηγεσία ή “προκοινωνικός σκοπός”.

Οι μαθητές δεν θα βαθμολογούνται με αυτόν τον τρόπο (και πάλι) αλλά είναι ένα πολύ απαραίτητο εργαλείο στην εργαλειοθήκη των διαχειριστών, οι οποίοι πρέπει να περάσουν από χιλιάδες εφαρμογές και θα μπορούσαν να χρησιμοποιήσουν ένα χέρι πότε πότε. Θα μπορούσαν να χρησιμοποιήσουν ένα στρώμα ανάλυσης όπως αυτό για να ομαδοποιήσουν δοκίμια ή ακόμα και να τα τυχαιοποιήσουν καλύτερα, ώστε όλοι όσοι μιλούν για κατασκήνωση να μην καταλήξουν στη σειρά. Και η έρευνα αποκάλυψε ότι η γλώσσα που χρησιμοποιούσαν οι μαθητές ήταν εκπληκτικά προγνωστική για ορισμένους ακαδημαϊκούς παράγοντες, όπως το ποσοστό αποφοίτησης. Φυσικά, θα το εξετάσουν πιο βαθιά αυτό, αλλά είναι σαφές ότι η στυλομετρία που βασίζεται σε ML θα παραμείνει σημαντική.

Ωστόσο, δεν θα χάναμε την παρακολούθηση των περιορισμών της τεχνητής νοημοσύνης, όπως τονίστηκε από μια ομάδα ερευνητών στο Πανεπιστήμιο της Ουάσιγκτον που δοκίμασαν τη συμβατότητα των εργαλείων τεχνητής νοημοσύνης με τις δικές τους ανάγκες προσβασιμότητας. Οι εμπειρίες τους ήταν αναμφισβήτητα ανάμεικτες, με συστήματα σύνοψης που προσθέτουν προκαταλήψεις ή παραισθήσεις (καθιστώντας τις ακατάλληλες για άτομα που δεν μπορούν να διαβάσουν το υλικό πηγής) και εφαρμόζοντας ασυνεπείς κανόνες περιεχομένου προσβασιμότητας.

Αυτή την εβδομάδα στο AI: Το OpenAI παίζει για κρατήσεις με GPT, Αυτή την εβδομάδα στο AI: Το OpenAI παίζει για κρατήσεις με GPT, TechWar.gr

Ταυτόχρονα, ωστόσο, ένα άτομο στο φάσμα του αυτισμού διαπίστωσε ότι η χρήση ενός γλωσσικού μοντέλου για τη δημιουργία μηνυμάτων στο Slack τους βοήθησε να ξεπεράσουν την έλλειψη εμπιστοσύνης στην ικανότητά τους να επικοινωνούν κανονικά. Παρόλο που οι συνάδελφοί της βρήκαν τα μηνύματα κάπως «ρομποτικά», ήταν ένα καθαρό όφελος για τον χρήστη, το οποίο είναι μια αρχή.

Μπορείτε να βρείτε περισσότερες πληροφορίες για αυτή τη μελέτη εδώ

.

Ωστόσο, και τα δύο προηγούμενα στοιχεία θέτουν ακανθώδη ζητήματα μεροληψίας και γενικής παραξενιάς της τεχνητής νοημοσύνης σε μια ευαίσθητη περιοχή, επομένως δεν προκαλεί έκπληξη το γεγονός ότι ορισμένες πολιτείες και δήμοι εξετάζουν τη θέσπιση κανόνων για το τι μπορεί να χρησιμοποιηθεί η τεχνητή νοημοσύνη σε επίσημα καθήκοντα. Το Σιάτλ, για παράδειγμα,

μόλις κυκλοφόρησε ένα σύνολο «κυβερνουσών αρχών»

και πακέτα εργαλείων που πρέπει να συμβουλευτείτε ή να εφαρμόσετε πριν να χρησιμοποιηθεί ένα μοντέλο τεχνητής νοημοσύνης για επίσημους σκοπούς. Αναμφίβολα θα δούμε διαφορετικούς —και ίσως αντιφατικούς— τέτοιους κανόνες να εφαρμόζονται σε όλα τα επίπεδα διακυβέρνησης.

Μέσα στο VR, ένα μοντέλο μηχανικής μάθησης που λειτουργούσε ως ευέλικτος ανιχνευτής χειρονομιών βοήθησε στη δημιουργία

ένα σύνολο από πραγματικά ενδιαφέροντες τρόπους αλληλεπίδρασης με εικονικά αντικείμενα.

“Αν η χρήση της εικονικής πραγματικότητας είναι ακριβώς όπως η χρήση ενός πληκτρολογίου και ενός ποντικιού, τότε ποιο είναι το νόημα να το χρησιμοποιείτε;” ρώτησε ο επικεφαλής συγγραφέας Per Ola Kristensson. «Πρέπει να σου δώσει σχεδόν υπεράνθρωπες δυνάμεις που δεν μπορείς να τις αποκτήσεις αλλού». Σωστή παρατήρηση!

Μπορείτε να δείτε στο παραπάνω βίντεο πώς ακριβώς λειτουργεί, κάτι που όταν το σκεφτείτε βγάζει απόλυτα διαισθητικό νόημα. Δεν θέλω να επιλέξω «αντιγραφή» και μετά «επικόλληση» από ένα μενού χρησιμοποιώντας το δικό μου

~~ποντίκι~~

δάχτυλο. Θέλω να κρατήσω ένα αντικείμενο στο ένα χέρι, μετά να ανοίξω την παλάμη του άλλου και να μπουμ, ένα αντίγραφο! Τότε αν θέλω να τα κόψω, απλά κάνω το χέρι μου ψαλίδι;! Αυτό είναι καταπληκτικό!

Αυτή την εβδομάδα στο AI: Το OpenAI παίζει για κρατήσεις με GPT, Αυτή την εβδομάδα στο AI: Το OpenAI παίζει για κρατήσεις με GPT, TechWar.gr

Συντελεστές εικόνας:

EPFL

Τέλος, μιλώντας για Cut/Paste, αυτό είναι το όνομα του

μια νέα έκθεση στο ελβετικό πανεπιστήμιο EPFL

, όπου φοιτητές και καθηγητές εξέτασαν την ιστορία των κόμικς από τη δεκαετία του 1950 και μετά και πώς η τεχνητή νοημοσύνη θα μπορούσε να τα βελτιώσει ή να τα ερμηνεύσει. Προφανώς η γενεσιουργός

τέχνη

δεν έχει καταλάβει ακόμα, αλλά ορισμένοι καλλιτέχνες είναι προφανώς πρόθυμοι να δοκιμάσουν τη νέα τεχνολογία, παρά την ηθική και πνευματική σύγκρουσή της, και να εξερευνήσουν τις ερμηνείες της στο ιστορικό υλικό. Εάν είστε αρκετά τυχεροί που βρίσκεστε στη Λωζάνη, ρίξτε μια ματιά στο Couper/Coller (την πιασάρικη τοπική έκδοση των απανταχού ψηφιακών ενεργειών).

VIA:

techcrunch.com

Παρόμοια άρθρα