Η καλή παλιομοδίτικη τεχνητή νοημοσύνη παραμένει βιώσιμη παρά την άνοδο των LLM
Θυμάστε πριν από ένα χρόνο, μέχρι τον περασμένο Νοέμβριο πριν μάθουμε για το ChatGPT, όταν η μηχανική μάθηση αφορούσε τη δημιουργία μοντέλων προς επίλυση για μια μεμονωμένη εργασία, όπως εγκρίσεις δανείων ή προστασία από απάτες; Αυτή η προσέγγιση φαινόταν να βγαίνει από το παράθυρο με την άνοδο των γενικευμένων LLM, αλλά το γεγονός είναι ότι τα γενικευμένα μοντέλα δεν ταιριάζουν καλά σε κάθε
πρόβλημα
και τα μοντέλα που βασίζονται σε εργασίες εξακολουθούν να είναι ζωντανά και καλά στην επιχείρηση.
Αυτά τα μοντέλα που βασίζονται σε εργασίες, μέχρι την άνοδο των LLMs, ήταν η βάση για το μεγαλύτερο μέρος της τεχνητής νοημοσύνης στην επιχείρηση και δεν πρόκειται να εξαφανιστούν. Είναι αυτό που ο CTO της Amazon Werner Vogels ανέφερε ως «παλιομοδίτικη τεχνητή νοημοσύνη» στην κεντρική του ομιλία αυτή την εβδομάδα, και κατά την άποψή του, είναι το είδος της τεχνητής νοημοσύνης που εξακολουθεί να λύνει πολλά προβλήματα του πραγματικού κόσμου.
Ο Atul Deo, γενικός διευθυντής του Amazon Bedrock, το προϊόν που παρουσιάστηκε νωρίτερα φέτος ως ένας τρόπος σύνδεσης σε μια ποικιλία μεγάλων μοντέλων γλώσσας μέσω API, πιστεύει επίσης ότι τα μοντέλα εργασιών δεν πρόκειται απλώς να εξαφανιστούν. Αντίθετα, έχουν γίνει ένα άλλο εργαλείο AI στο οπλοστάσιο.
«Πριν από την έλευση των μεγάλων γλωσσικών μοντέλων, βρισκόμασταν κυρίως σε έναν κόσμο ειδικά για εργασίες. Και η ιδέα υπήρχε ότι θα εκπαιδεύατε ένα
μοντέλο
από την αρχή για μια συγκεκριμένη εργασία», είπε ο Deo στο TechCrunch. Λέει ότι η κύρια διαφορά μεταξύ του μοντέλου εργασιών και του LLM είναι ότι ο ένας είναι εκπαιδευμένος για τη συγκεκριμένη εργασία, ενώ ο άλλος μπορεί να χειριστεί πράγματα έξω από τα όρια του μοντέλου.
Ο Jon Turow, συνεργάτης στην επενδυτική εταιρεία Madrona, ο οποίος στο παρελθόν πέρασε σχεδόν μια δεκαετία στην AWS, λέει ότι η βιομηχανία έχει μιλήσει για αναδυόμενες δυνατότητες σε μεγάλα γλωσσικά μοντέλα, όπως η λογική και η ευρωστία εκτός τομέα. «Αυτά σας επιτρέπουν να μπορείτε να επεκταθείτε πέρα από έναν στενό ορισμό του τι αναμενόταν αρχικά να κάνει το μοντέλο», είπε. Όμως, πρόσθεσε, είναι ακόμα πολύ αντικείμενο συζήτησης πόσο μακριά μπορούν να φτάσουν αυτές οι δυνατότητες.
Όπως και ο Deo, ο Turow λέει ότι τα μοντέλα εργασιών δεν πρόκειται απλώς να εξαφανιστούν ξαφνικά. «Υπάρχει σαφώς ακόμα ρόλος για μοντέλα που αφορούν συγκεκριμένες εργασίες, επειδή μπορεί να είναι μικρότερα, μπορεί να είναι πιο γρήγορα, μπορεί να είναι φθηνότερα και μπορεί σε ορισμένες περιπτώσεις να είναι ακόμη πιο αποτελεσματικά επειδή έχουν σχεδιαστεί για μια συγκεκριμένη εργασία», είπε. .
Αλλά το δέλεαρ ενός μοντέλου για όλες τις χρήσεις είναι δύσκολο να αγνοηθεί. “Όταν εξετάζετε ένα συνολικό επίπεδο σε μια εταιρεία, όταν υπάρχουν εκατοντάδες μοντέλα μηχανικής μάθησης που εκπαιδεύονται ξεχωριστά, αυτό δεν έχει κανένα νόημα”, είπε ο Deo. “Ενώ αν ακολουθήσετε ένα πιο ικανό μοντέλο μεγάλης γλώσσας, θα έχετε το πλεονέκτημα επαναχρησιμοποίησης αμέσως, ενώ σας επιτρέπει να χρησιμοποιήσετε ένα μόνο μοντέλο για να αντιμετωπίσετε μια δέσμη διαφορετικών περιπτώσεων χρήσης.”
Για την Amazon, το SageMaker, η πλατφόρμα λειτουργιών μηχανικής μάθησης της εταιρείας, παραμένει ένα βασικό προϊόν, ένα προϊόν που απευθύνεται σε
επιστήμονες
δεδομένων αντί για
προγραμματιστές
, όπως είναι το Bedrock.
Αναφέρει
δεκάδες χιλιάδες πελάτες κατασκευάζουν εκατομμύρια μοντέλα. Θα ήταν ανόητο να το εγκαταλείψουμε, και ειλικρινά μόνο και μόνο επειδή τα LLM είναι η
γεύση
της στιγμής δεν σημαίνει ότι η τεχνολογία που προέκυψε δεν θα παραμείνει σχετική για αρκετό καιρό ακόμη.
Ειδικά το εταιρικό λογισμικό δεν λειτουργεί με αυτόν τον τρόπο. Κανείς δεν πετάει απλώς τη σημαντική επένδυσή του επειδή ήρθε ένα νέο πράγμα, ακόμη και ένα τόσο ισχυρό όσο η τρέχουσα παραγωγή μεγάλων γλωσσικών μοντέλων. Αξίζει να σημειωθεί ότι η Amazon ανακοίνωσε αναβαθμίσεις στο SageMaker αυτή την εβδομάδα, με στόχο τη διαχείριση μεγάλων μοντέλων γλώσσας.
Πριν από αυτά τα πιο ικανά μοντέλα μεγάλων γλωσσών, το μοντέλο εργασιών ήταν πραγματικά η μόνη επιλογή, και έτσι το προσέγγισαν οι εταιρείες, δημιουργώντας μια ομάδα επιστημόνων δεδομένων για να βοηθήσουν στην ανάπτυξη αυτών των μοντέλων. Ποιος είναι ο ρόλος του επιστήμονα δεδομένων στην εποχή των μεγάλων γλωσσικών μοντέλων όπου τα εργαλεία απευθύνονται σε προγραμματιστές; Η Turow πιστεύει ότι έχουν ακόμα μια βασική δουλειά να κάνουν, ακόμη και σε εταιρείες που επικεντρώνονται σε LLM.
«Θα σκέφτονται κριτικά για τα δεδομένα, και αυτός είναι στην πραγματικότητα ένας ρόλος που αυξάνεται, δεν συρρικνώνεται», είπε. Ανεξάρτητα από το μοντέλο, ο Turow πιστεύει ότι οι επιστήμονες δεδομένων θα βοηθήσουν τους ανθρώπους να κατανοήσουν τη σχέση μεταξύ AI και δεδομένων μέσα σε μεγάλες εταιρείες.
«Νομίζω ότι ο καθένας από εμάς πρέπει πραγματικά να σκεφτεί κριτικά για το τι είναι και τι δεν είναι ικανό η τεχνητή νοημοσύνη και τι σημαίνουν και τι δεν σημαίνουν τα δεδομένα», είπε. Και αυτό ισχύει ανεξάρτητα από το αν δημιουργείτε ένα πιο γενικευμένο μοντέλο μεγάλης γλώσσας ή ένα μοντέλο εργασίας.
Αυτός είναι ο λόγος για τον οποίο αυτές οι δύο προσεγγίσεις θα συνεχίσουν να λειτουργούν ταυτόχρονα για κάποιο χρονικό διάστημα, επειδή μερικές φορές το μεγαλύτερο είναι καλύτερο και μερικές φορές όχι.
VIA:
techcrunch.com
