Αυτή την εβδομάδα στο AI: Πειράματα, συνταξιοδοτήσεις και γεγονότα εξαφάνισης
Το να συμβαδίζεις με έναν κλάδο τόσο γρήγορο όσο η τεχνητή νοημοσύνη είναι μια μεγάλη παραγγελία. Έτσι, έως ότου μια τεχνητή νοημοσύνη μπορεί να το κάνει για εσάς, εδώ είναι μια χρήσιμη σύνοψη των ιστοριών της περασμένης εβδομάδας στον κόσμο της μηχανικής μάθησης, μαζί με αξιοσημείωτες έρευνες και πειράματα που δεν καλύψαμε από μόνα τους.
Το YouTube έχει αρχίσει να πειραματίζεται με περιλήψεις που δημιουργούνται από AI για βίντεο στις σελίδες παρακολούθησης και αναζήτησης, αν και μόνο για περιορισμένο αριθμό αγγλόφωνων βίντεο και θεατών.
Σίγουρα, οι περιλήψεις θα μπορούσαν να είναι χρήσιμες για την ανακάλυψη — και την προσβασιμότητα. Δεν μπορεί να μπει στον κόπο κάθε δημιουργός βίντεο να γράψει μια περιγραφή. Αλλά ανησυχώ για τις πιθανότητες για λάθη και προκαταλήψεις που ενσωματώνονται από την τεχνητή νοημοσύνη.
Ακόμη και τα καλύτερα μοντέλα τεχνητής νοημοσύνης σήμερα τείνουν να «παραισθάνονται». Το OpenAI παραδέχεται ελεύθερα ότι το τελευταίο του μοντέλο δημιουργίας και σύνοψης κειμένου, το GPT-4, κάνει μεγάλα λάθη στη συλλογιστική και επινοεί «γεγονότα». Ο Patrick Hymel, ένας επιχειρηματίας στον κλάδο της τεχνολογίας υγείας,
έγραψε για
τους τρόπους με τους οποίους το GPT-4 δημιουργεί αναφορές, γεγονότα και αριθμούς χωρίς καμία αναγνωρίσιμη σύνδεση με πραγματικές πηγές. Και η Fast Company
δοκίμασε την ικανότητα του ChatGPT
για να συνοψίσω τα άρθρα, το βρίσκω… πολύ κακό.
Μπορεί κανείς να φανταστεί τις περιλήψεις βίντεο που δημιουργούνται από την τεχνητή νοημοσύνη να βγαίνουν στο βάθος, δεδομένης της πρόσθετης πρόκλησης της ανάλυσης του περιεχομένου που περιέχεται στα βίντεο. Είναι δύσκολο να αξιολογήσετε την ποιότητα των περιλήψεων που δημιουργούνται από την τεχνητή νοημοσύνη του YouTube. Αλλά είναι καλά αποδεδειγμένο ότι η τεχνητή νοημοσύνη δεν είναι τόσο καλή στη σύνοψη
κείμενο
περιεχόμενο.
Το YouTube αναγνωρίζει διακριτικά ότι οι περιγραφές που δημιουργούνται από την τεχνητή νοημοσύνη δεν υποκαθιστούν το πραγματικό πράγμα. Στη σελίδα υποστήριξης, γράφει: «Αν και ελπίζουμε αυτές οι περιλήψεις να είναι χρήσιμες και να σας δίνουν μια γρήγορη επισκόπηση του τι είναι ένα βίντεο, δεν αντικαθιστούν τις περιγραφές βίντεο (που γράφτηκαν από τους δημιουργούς!).»
Ελπίζουμε ότι η πλατφόρμα δεν θα διαθέσει τη δυνατότητα πολύ βιαστικά. Αλλά λαμβάνοντας υπόψη το μισοψημένο προϊόν τεχνητής νοημοσύνης της Google που λανσαρίστηκε πρόσφατα (δείτε την προσπάθειά του σε έναν αντίπαλο του ChatGPT, τον Bard), δεν είμαι πολύ σίγουρος.
Ακολουθούν μερικές άλλες αξιοσημείωτες ιστορίες AI από τις τελευταίες ημέρες:
Ο Dario Amodei έρχεται στο Disrupt:
Θα πάρουμε συνέντευξη από τον συνιδρυτή της Anthropic για το πώς είναι να έχεις τόσα πολλά χρήματα. Και πράγματα AI επίσης.
Η Αναζήτηση Google αποκτά νέες δυνατότητες AI:
Η Google προσθέτει εικόνες και βίντεο με βάση τα συμφραζόμενα στο πείραμα δημιουργίας αναζήτησης με τεχνητή νοημοσύνη, τη δυνατότητα δημιουργίας αναζήτησης με τεχνητή νοημοσύνη που ανακοινώθηκε στο συνέδριο I/O του Μαΐου. Με τις ενημερώσεις, το SGE εμφανίζει τώρα εικόνες ή βίντεο που σχετίζονται με το ερώτημα αναζήτησης. Η εταιρεία φέρεται επίσης να στρέφει το έργο της Assistant σε μια γενετική τεχνητή νοημοσύνη που μοιάζει με τον Bard.
Η Microsoft σκοτώνει την Cortana:
Απηχώντας τα γεγονότα της σειράς παιχνιδιών Halo από τα οποία αφαιρέθηκε το όνομα, η Cortana έχει καταστραφεί. Ευτυχώς δεν επρόκειτο για έναν απατεώνα στρατηγό τεχνητής νοημοσύνης, αλλά για έναν ψηφιακό βοηθό, του οποίου είχε έρθει η ώρα.
Το Meta αγκαλιάζει τη δημιουργική μουσική AI:
Ο Meta ανακοίνωσε αυτή την εβδομάδα
AudioCraft
ένα πλαίσιο για τη δημιουργία αυτού που περιγράφει ως “υψηλής ποιότητας”, “ρεαλιστικό” ήχο και μουσική από σύντομες περιγραφές κειμένου ή μηνύματα προτροπής.
Η Google τραβάει το AI Test Kitchen:
Η Google απέσυρε την εφαρμογή AI Test Kitchen από το Play Store και το App Store για να επικεντρωθεί αποκλειστικά στην πλατφόρμα Ιστού. Η εταιρεία ξεκίνησε την εμπειρία AI Test Kitchen πέρυσι για να επιτρέψει στους χρήστες να αλληλεπιδρούν με έργα που υποστηρίζονται από διαφορετικά μοντέλα AI, όπως το LaMDA 2.
Τα ρομπότ μαθαίνουν από μικρές ποσότητες δεδομένων:
Σχετικά με το θέμα της Google, το DeepMind, το ερευνητικό εργαστήριο του τεχνολογικού γίγαντα που εστιάζει στην τεχνητή νοημοσύνη, έχει αναπτύξει ένα σύστημα που υποστηρίζει ότι επιτρέπει στα ρομπότ να μεταφέρουν αποτελεσματικά έννοιες που έχουν μάθει σε σχετικά μικρά σύνολα δεδομένων σε διαφορετικά σενάρια.
Το Kickstarter θεσπίζει νέους κανόνες σχετικά με τη γενετική τεχνητή νοημοσύνη:
Το Kickstarter ανακοίνωσε αυτή την εβδομάδα ότι τα έργα στην πλατφόρμα του που χρησιμοποιούν εργαλεία AI για τη δημιουργία περιεχομένου θα πρέπει να αποκαλύπτουν πώς ο ιδιοκτήτης του έργου σχεδιάζει να χρησιμοποιήσει το περιεχόμενο AI στην εργασία του. Επιπλέον, το Kickstarter επιβάλλει τα νέα έργα που περιλαμβάνουν την ανάπτυξη λεπτομερειών τεχνολογίας AI σχετικά με τις πηγές δεδομένων εκπαίδευσης που σκοπεύει να χρησιμοποιήσει ο ιδιοκτήτης του έργου.
Η Κίνα καταπολεμά τη γενετική τεχνητή νοημοσύνη:
Πολλαπλές εφαρμογές τεχνητής νοημοσύνης στη δημιουργία τεχνητών νοημοσύνης αφαιρέθηκαν από το China App Store της Apple αυτή την εβδομάδα, χάρη στους νέους κανόνες που θα απαιτήσουν από τις εφαρμογές τεχνητής νοημοσύνης που λειτουργούν στην Κίνα να αποκτήσουν άδεια διαχείρισης.
Η Stable Diffusion κυκλοφορεί νέο μοντέλο:
Η Stability AI κυκλοφόρησε το Stable Diffusion XL 1.0, ένα μοντέλο κειμένου σε εικόνα που η εταιρεία περιγράφει ως την «πιο προηγμένη» κυκλοφορία μέχρι σήμερα. Η Stability ισχυρίζεται ότι οι εικόνες του μοντέλου είναι «πιο ζωντανά» και «ακριβή» χρώματα και έχουν καλύτερη αντίθεση, σκιές και φωτισμό σε σύγκριση με τα έργα τέχνης του προκατόχου του.
Το μέλλον της τεχνητής νοημοσύνης είναι βίντεο:
Ή τουλάχιστον ένα μεγάλο μέρος της παραγωγής τεχνητής νοημοσύνης είναι, όπως το έχει ο Haje.
Το AI.com άλλαξε από OpenAI σε X.ai:
Είναι εξαιρετικά ασαφές εάν πουλήθηκε, ενοικιάστηκε ή αποτελεί μέρος κάποιου είδους συνεχιζόμενου προγράμματος, αλλά ο πολυπόθητος τομέας δύο γραμμάτων (πιθανώς αξίας 5-10 εκατομμυρίων δολαρίων) δείχνει τώρα την ερευνητική ομάδα X.ai του Elon Musk και όχι τη διεπαφή ChatGPT .
Άλλες μηχανές εκμάθησης
Η τεχνητή νοημοσύνη εργάζεται σε αμέτρητους επιστημονικούς τομείς, όπως έχω την ευκαιρία να τεκμηριώνω εδώ τακτικά, αλλά θα μπορούσαμε να σας συγχωρέσουμε που δεν μπορείτε να απαριθμήσετε περισσότερες από μερικές συγκεκριμένες εφαρμογές απροσδόκητα.
Αυτή η βιβλιογραφική ανασκόπηση στο Nature
είναι μια ολοκληρωμένη καταγραφή των περιοχών και των μεθόδων όπου η τεχνητή νοημοσύνη τίθεται σε ισχύ, όσο είναι πιθανό να βρείτε οπουδήποτε, καθώς και τις προόδους που τις κατέστησαν δυνατές. Δυστυχώς είναι paywalled, αλλά πιθανότατα μπορείτε να βρείτε έναν τρόπο να αποκτήσετε ένα αντίγραφο.
Μπορεί να βρεθεί μια βαθύτερη κατάδυση στις δυνατότητες της τεχνητής νοημοσύνης να βελτιώσει τον παγκόσμιο αγώνα κατά των μολυσματικών ασθενειών
εδώ στο Science
και μερικά φαγητά σε πακέτο
στην περίληψη του UPenn
. Ένα ενδιαφέρον μέρος είναι ότι τα μοντέλα που κατασκευάστηκαν για την πρόβλεψη των αλληλεπιδράσεων φαρμάκων θα μπορούσαν επίσης να βοηθήσουν στην «εξιχνίαση περίπλοκων αλληλεπιδράσεων μεταξύ μολυσματικών οργανισμών και του ανοσοποιητικού συστήματος του ξενιστή». Η παθολογία της νόσου μπορεί να είναι γελοία περίπλοκη, επομένως οι επιδημιολόγοι και οι γιατροί πιθανότατα θα λάβουν οποιαδήποτε βοήθεια μπορούν.
Εντοπίστηκε αστεροειδής, κυρία.
Ένα άλλο ενδιαφέρον παράδειγμα, με την προειδοποίηση ότι δεν πρέπει να ονομάζεται κάθε αλγόριθμος AI, είναι αυτή η πολυθεσμική εργασία
αλγοριθμική αναγνώριση «δυνητικά επικίνδυνων» αστεροειδών
. Οι έρευνες του ουρανού παράγουν έναν τόνο δεδομένων και η διαλογή τους για αμυδρά σήματα όπως οι αστεροειδείς είναι σκληρή δουλειά που είναι εξαιρετικά επιρρεπής στον αυτοματισμό. Το 600 ποδιών 2022 SF289 βρέθηκε κατά τη διάρκεια μιας δοκιμής του αλγορίθμου στο
ΑΤΛΑΣ
δεδομένα. «Αυτή είναι μια μικρή γεύση του τι να περιμένουμε με το Παρατηρητήριο Rubin σε λιγότερο από δύο χρόνια, όταν το HelioLinc3D θα ανακαλύπτει ένα τέτοιο αντικείμενο κάθε βράδυ», δήλωσε ο Mario Jurić του UW. Ανυπομονώ!
Ένα είδος φωτοστέφανου στον ερευνητικό κόσμο της τεχνητής νοημοσύνης διεξάγεται έρευνα
επί
AI — πώς λειτουργεί και γιατί. Συνήθως αυτές οι μελέτες είναι αρκετά δύσκολο να αναλυθούν από μη ειδικούς, και
αυτό από ερευνητές του ETHZ
δεν αποτελεί εξαίρεση. Αλλά ο κύριος συγγραφέας Johannes von Oswald επίσης
έκανε συνέντευξη
εξηγώντας μερικές από τις έννοιες σε απλά αγγλικά. Αξίζει να το διαβάσετε αν είστε περίεργοι για τη διαδικασία «μάθησης» που συμβαίνει σε μοντέλα όπως το ChatGPT.
Η βελτίωση της μαθησιακής διαδικασίας είναι επίσης σημαντική,
και όπως διαπιστώνουν αυτοί οι ερευνητές του Duke
, η απάντηση δεν είναι πάντα “περισσότερα δεδομένα”. Στην πραγματικότητα, περισσότερα δεδομένα μπορούν να εμποδίσουν ένα μοντέλο μηχανικής μάθησης, είπε ο καθηγητής Duke Daniel Reker: «Είναι σαν να εκπαιδεύσατε έναν αλγόριθμο για να διακρίνετε εικόνες σκύλων και γατών, αλλά του δώσατε ένα δισεκατομμύριο φωτογραφίες σκύλων για να μάθετε από αυτά και μόνο εκατό φωτογραφίες από γάτες. Ο αλγόριθμος θα γίνει τόσο καλός στην αναγνώριση των σκύλων που όλα θα αρχίσουν να μοιάζουν με σκύλο και θα ξεχάσει οτιδήποτε άλλο στον κόσμο». Η προσέγγισή τους χρησιμοποίησε μια τεχνική «ενεργητικής μάθησης» που εντόπισε τέτοιες αδυναμίες στο σύνολο δεδομένων και αποδείχθηκε πιο αποτελεσματική χρησιμοποιώντας μόλις το 1/10 των δεδομένων.
Μια μελέτη του University College του Λονδίνου διαπίστωσε ότι οι άνθρωποι ήταν σε θέση να διακρίνουν μόνο την πραγματική από τη συνθετική ομιλία
73 τοις εκατό του χρόνου
, τόσο στα Αγγλικά όσο και στα Μανδαρινικά. Μάλλον όλοι θα γίνουμε καλύτεροι σε αυτό, αλλά στο εγγύς μέλλον η τεχνολογία θα ξεπεράσει την ικανότητά μας να το ανιχνεύσουμε. Μείνετε παγωμένοι εκεί έξω.


