Το τελευταίο AI της DeepMind μπορεί να λύσει προβλήματα γεωμετρίας
Για το σκοπό αυτό, η DeepMind παρουσίασε σήμερα το AlphaGeometry — ένα σύστημα που το εργαστήριο ισχυρίζεται ότι μπορεί να λύσει τόσα προβλήματα γεωμετρίας όσο ο μέσος χρυσός Ολυμπιονίκης της Διεθνούς Μαθηματικής Ολυμπιάδας. Το AlphaGeometry, ο κώδικας του οποίου ήταν ανοιχτού κώδικα σήμερα το πρωί, λύνει 25 προβλήματα γεωμετρίας Ολυμπιάδας εντός του τυπικού χρονικού ορίου, ξεπερνώντας τα 10 του προηγούμενου συστήματος τελευταίας
τεχν
ολογίας.
«Η επίλυση προβλημάτων γεωμετρίας σε επίπεδο Ολυμπιάδας είναι ένα σημαντικό ορόσημο για την ανάπτυξη βαθιάς μαθηματικής λογικής στην πορεία προς πιο προηγμένα και γενικά συστήματα τεχνητής νοημοσύνης», γράφουν οι Trieu Trinh και Thang Luong, ερευνητές της Google AI, σε μια ανάρτηση ιστολογίου που δημοσιεύτηκε σήμερα το πρωί. “[We] Ελπίζουμε ότι… Το AlphaGeometry βοηθά στο άνοιγμα νέων δυνατοτήτων στα μαθηματικά, την επιστήμη και την τεχνητή νοημοσύνη.”
Γιατί η εστίαση στη γεωμετρία; Ο DeepMind υποστηρίζει ότι η απόδειξη μαθηματικών θεωρημάτων ή η λογική εξήγηση γιατί ένα θεώρημα (π.χ. το Πυθαγόρειο θεώρημα) είναι αληθές, απαιτεί τόσο συλλογισμό όσο και την ικανότητα επιλογής από μια σειρά πιθανών βημάτων προς μια λύση. Αυτή η προσέγγιση επίλυσης προβλημάτων θα μπορούσε – αν έχει δίκιο ο DeepMind – να αποδειχθεί χρήσιμη σε συστήματα τεχνητής νοημοσύνης γενικής χρήσης κάποια μέρα.
«Η απόδειξη ότι μια συγκεκριμένη εικασία είναι αληθινή ή ψευδής διευρύνει τις ικανότητες ακόμη και των πιο προηγμένων συστημάτων τεχνητής νοημοσύνης σήμερα», διαβάζει το υλικό τύπου DeepMind που κοινοποιήθηκε στο TechCrunch. «Προς αυτόν τον στόχο, το να μπορούμε να αποδείξουμε μαθηματικά θεωρήματα… είναι ένα σημαντικό ορόσημο καθώς δείχνει την κυριαρχία του λογικού συλλογισμού και την ικανότητα να ανακαλύπτουμε νέα γνώση».
Αλλά η εκπαίδευση ενός συστήματος AI για την επίλυση προβλημάτων γεωμετρίας θέτει μοναδικές προκλήσεις.
Λόγω της πολυπλοκότητας της μετάφρασης των αποδείξεων σε μορφή που μπορούν να κατανοήσουν οι μηχανές, υπάρχει έλλειψη χρήσιμων δεδομένων εκπαίδευσης γεωμετρίας.
Και
πολλά από τα σύγχρονα μοντέλα τεχνητής νοημοσύνης αιχμής, παρόλο που είναι εξαιρετικά στον εντοπισμό προτύπων και σχέσεων στα δεδομένα, δεν έχουν την ικανότητα να συλλογίζονται λογικά μέσω θεωρημάτων.
Η λύση του DeepMind ήταν διπλή.
Συντελεστές εικόνας:
DeepMind
Κατά τη σχεδίαση της AlphaGeometry, το εργαστήριο συνδύασε ένα μοντέλο «νευρωνικής γλώσσας» – ένα μοντέλο αρχιτεκτονικά σύμφωνα με τις γραμμές του ChatGPT – με μια «συμβολική μηχανή εξαγωγής», μια μηχανή που αξιοποιεί κανόνες (π.χ. μαθηματικούς κανόνες) για να συναγάγει λύσεις σε προβλήματα. Οι συμβολικοί κινητήρες μπορεί να είναι άκαμπτοι και αργοί, ειδικά όταν έχουμε να κάνουμε με μεγάλα ή πολύπλοκα σύνολα δεδομένων. Αλλά το DeepMind μετριάστηκε αυτά τα ζητήματα, έχοντας το νευρωνικό μοντέλο να «καθοδηγεί» τη μηχανή εξαγωγής μέσω πιθανών απαντήσεων σε δεδομένα γεωμετρικά προβλήματα.
Αντί για δεδομένα εκπαίδευσης, το DeepMind δημιούργησε τα δικά του
συνθετικός
δεδομένα, δημιουργώντας 100 εκατομμύρια «συνθετικά θεωρήματα» και αποδείξεις ποικίλης πολυπλοκότητας. Στη συνέχεια, το εργαστήριο εκπαίδευσε το AlphaGeometry από την αρχή στα συνθετικά δεδομένα — και το αξιολόγησε σε προβλήματα γεωμετρίας της Ολυμπιάδας
Τα προβλήματα γεωμετρίας της Ολυμπιάδας βασίζονται σε διαγράμματα που πρέπει να προστεθούν «κατασκευάσματα» για να μπορέσουν να επιλυθούν, όπως σημεία, γραμμές ή κύκλοι. Εφαρμοσμένο σε αυτά τα προβλήματα, το νευρωνικό μοντέλο του AlphaGeometry προβλέπει ποιες δομές μπορεί να είναι χρήσιμο να προστεθούν — προβλέψεις που χρησιμοποιεί ο συμβολικός κινητήρας του AlphaGeometry για να κάνει συμπεράσματα σχετικά με τα διαγράμματα για να αναγνωρίσει παρόμοιες λύσεις.
«Με τόσα πολλά παραδείγματα για το πώς αυτές οι κατασκευές οδήγησαν σε αποδείξεις, το γλωσσικό μοντέλο της AlphaGeometry είναι σε θέση να κάνει καλές προτάσεις για νέες κατασκευές όταν παρουσιάζονται με προβλήματα γεωμετρίας της Ολυμπιάδας», γράφουν οι Trinh και Luong. «Το ένα σύστημα παρέχει γρήγορες, «διαισθητικές» ιδέες και το άλλο πιο σκόπιμη, ορθολογική λήψη αποφάσεων».
Τα αποτελέσματα της επίλυσης προβλημάτων του AlphaGeometry, τα οποία δημοσιεύτηκαν σε μελέτη στο περιοδικό
Φύση
αυτή την εβδομάδα, είναι πιθανό να τροφοδοτήσουν τη μακροχρόνια συζήτηση σχετικά με το εάν τα συστήματα τεχνητής νοημοσύνης θα πρέπει να χτιστούν στη χειραγώγηση συμβόλων – δηλαδή, στο χειρισμό συμβόλων που αντιπροσωπεύουν τη γνώση χρησιμοποιώντας κανόνες – ή τα φαινομενικά πιο εγκεφαλικά νευρωνικά δίκτυα.
Οι υποστηρικτές της προσέγγισης των νευρωνικών δικτύων υποστηρίζουν ότι η έξυπνη συμπεριφορά – από την αναγνώριση ομιλίας έως τη δημιουργία εικόνων – δεν μπορεί να προκύψει από τεράστιες ποσότητες δεδομένων και υπολογισμούς. Σε αντίθεση με
συμβολικά συστήματα, τα οποία επιλύουν εργασίες ορίζοντας σύνολα κανόνων χειρισμού συμβόλων αφιερωμένων σε συγκεκριμένες εργασίες (όπως η επεξεργασία μιας γραμμής σε λογισμικό επεξεργαστή κειμένου), τα νευρωνικά δίκτυα προσπαθούν να λύσουν εργασίες μέσω στατιστικής προσέγγισης και
μάθηση
ς από παραδείγματα.
Τα νευρωνικά δίκτυα είναι ο ακρογωνιαίος λίθος ισχυρών συστημάτων τεχνητής νοημοσύνης όπως το DALL-E 3 και το GPT-4 του OpenAI. Όμως, ισχυρίζονται οι υποστηρικτές της συμβολικής τεχνητής νοημοσύνης,
δεν είναι
το τέλος όλων. Η συμβολική τεχνητή νοημοσύνη θα μπορούσε να είναι καλύτερα τοποθετημένη ώστε να κωδικοποιεί αποτελεσματικά τη γνώση του κόσμου, να αιτιολογεί το δρόμο τους μέσα από περίπλοκα σενάρια και να «εξηγεί» πώς κατέληξαν σε μια απάντηση, υποστηρίζουν αυτοί οι υποστηρικτές.
Ως ένα υβριδικό σύστημα συμβολικού νευρωνικού δικτύου παρόμοιο με το AlphaFold 2 και το AlphaGo του DeepMind, το AlphaGeometry ίσως αποδεικνύει ότι οι δύο προσεγγίσεις — χειρισμός συμβόλων και νευρωνικά δίκτυα —
σε συνδυασμό
είναι το καλύτερο μονοπάτι προς τα
εμπ
ρός στην αναζήτηση γενικεύσιμης τεχνητής νοημοσύνης. Ισως.
«Ο μακροπρόθεσμος στόχος μας παραμένει η κατασκευή συστημάτων τεχνητής νοημοσύνης που μπορούν να γενικεύονται σε μαθηματικά πεδία, αναπτύσσοντας την περίπλοκη επίλυση προβλημάτων και συλλογισμό από τα οποία θα εξαρτώνται τα γενικά συστήματα τεχνητής νοημοσύνης, διευρύνοντας ταυτόχρονα τα σύνορα της ανθρώπινης γνώσης», γράφουν οι Trinh και Luong. «Αυτή η προσέγγιση θα μπορούσε να διαμορφώσει τον τρόπο με τον οποίο τα συστήματα AI του μέλλοντος ανακαλύπτουν νέα γνώση, στα μαθηματικά και όχι μόνο».
VIA:
techcrunch.com

