Τα νέα μοντέλα της Anthropic θεωρούνται υπερηχητικά από το GPT-4

By

Marizas Dimitris

On

Μαρ 4, 2024

Η startup τεχνητής νοημοσύνης Anthropic, με την υποστήριξη εκατοντάδων εκατομμυρίων κεφαλαίων επιχειρηματικού κινδύνου (και ίσως σύντομα

εκατοντάδες εκατομμύρια ακόμη

), σήμερα

ανακοινώθηκε

την τελευταία έκδοση της τεχνολογίας GenAI, Claude. Και η εταιρεία ισχυρίζεται ότι ανταγωνίζεται το GPT-4 του OpenAI όσον αφορά την απόδοση.

Το Claude 3, όπως ονομάζεται το νέο GenAI της Anthropic, είναι μια οικογένεια μοντέλων — Claude 3 Haiku, Claude 3 Sonnet και Claude 3 Opus, με το Opus να είναι το πιο ισχυρό. Όλα δείχνουν «αυξημένες δυνατότητες» στην ανάλυση και την πρόβλεψη, αξιώσεις Anthropic, καθώς και βελτιωμένη απόδοση σε συγκεκριμένα σημεία αναφοράς έναντι μοντέλων όπως το GPT-4 (αλλά όχι το GPT-4 Turbo) και το Gemini 1.0 Ultra της Google (αλλά όχι το Gemini 1.5 Pro).

Συγκεκριμένα, το Claude 3 είναι το πρώτο πολυτροπικό GenAI της Anthropic, που σημαίνει ότι μπορεί να αναλύει κείμενο καθώς και εικόνες — παρόμοια με ορισμένες γεύσεις του GPT-4 και του Gemini. Το Claude 3 μπορεί να επεξεργάζεται φωτογραφίες, γραφήματα, γραφήματα και τεχνικά διαγράμματα, να σχεδιάζει από αρχεία PDF, προβολές διαφανειών και άλλους τύπους εγγράφων.

Σε ένα βήμα ένα καλύτερο από ορισμένους αντιπάλους GenAI, ο Claude 3 μπορεί να αναλύσει πολλές εικόνες σε ένα μόνο αίτημα (έως 20 το πολύ). Αυτό του επιτρέπει να συγκρίνει και να κάνει αντίθεση εικόνων, σημειώνει η Anthropic.

Αλλά υπάρχουν όρια στην επεξεργασία εικόνας του Claude 3.

Η Anthropic έχει απενεργοποιήσει τα μοντέλα από το να αναγνωρίζουν άτομα — χωρίς αμφιβολία επιφυλακτική για τις ηθικές και νομικές επιπτώσεις. Και η εταιρεία παραδέχεται ότι ο Claude 3 είναι επιρρεπής σε λάθη με εικόνες “χαμηλής ποιότητας” (κάτω από 200 pixel) και παλεύει με εργασίες που περιλαμβάνουν χωρική λογική (π.χ. ανάγνωση μιας όψης αναλογικού ρολογιού) και μέτρηση αντικειμένων (ο Claude 3 δεν μπορεί να δώσει ακριβή μετρήσεις αντικειμένων σε εικόνες).

Συντελεστές εικόνας:

Ανθρωπικό

Ο Claude 3 επίσης δεν θα το κάνει

παράγω

έργο τέχνης. Τα μοντέλα αναλύουν αυστηρά την εικόνα — τουλάχιστον προς το παρόν.

Είτε τοποθετεί κείμενο είτε εικόνες, η Anthropic λέει ότι οι πελάτες μπορούν γενικά να περιμένουν από τον Claude 3 να ακολουθεί καλύτερα οδηγίες πολλαπλών βημάτων, να παράγει δομημένη έξοδο σε μορφές όπως

JSON

και να συνομιλούν σε άλλες γλώσσες εκτός από τα αγγλικά σε σύγκριση με τους προκατόχους του,. Ο Claude 3 θα πρέπει επίσης να αρνηθεί να απαντήσει σε ερωτήσεις λιγότερο συχνά χάρη σε μια «πιο λεπτή κατανόηση των αιτημάτων», λέει ο Anthropic. Και σύντομα, το Claude 3 θα αναφέρει την πηγή των απαντήσεών του σε ερωτήσεις, ώστε οι χρήστες να μπορούν να τις επαληθεύσουν.

«Ο Claude 3 τείνει να δημιουργεί πιο εκφραστικές και ελκυστικές απαντήσεις», γράφει ο Anthropic σε ένα άρθρο υποστήριξης. “[It’s] πιο εύκολο στην προτροπή και την καθοδήγηση σε σύγκριση με τα παλαιού τύπου μοντέλα μας. Οι χρήστες θα πρέπει να ανακαλύψουν ότι μπορούν να επιτύχουν τα επιθυμητά αποτελέσματα με συντομότερες και πιο συνοπτικές προτροπές.”

Μερικές από αυτές τις βελτιώσεις προέρχονται από το διευρυμένο πλαίσιο του Claude 3.

Το πλαίσιο ενός μοντέλου, ή το παράθυρο περιβάλλοντος, αναφέρεται σε δεδομένα εισόδου (π.χ. κείμενο) που εξετάζει το μοντέλο πριν από τη δημιουργία εξόδου. Τα μοντέλα με μικρά παράθυρα περιβάλλοντος τείνουν να «ξεχνούν» το περιεχόμενο ακόμη και πολύ πρόσφατων συνομιλιών, οδηγώντας τα να ξεφεύγουν από το θέμα — συχνά με προβληματικούς τρόπους. Ως πρόσθετο πλεονέκτημα, τα μοντέλα μεγάλου πλαισίου μπορούν να κατανοήσουν καλύτερα την αφηγηματική ροή δεδομένων που λαμβάνουν και να παράγουν πιο πλούσιες από τα συμφραζόμενα απαντήσεις (υποθετικά, τουλάχιστον).

Η Anthropic λέει ότι ο Claude 3 θα υποστηρίξει αρχικά ένα παράθυρο περιβάλλοντος 200.000 διακριτικών, που ισοδυναμεί με περίπου 150.000 λέξεις, με επιλεγμένους πελάτες να λαμβάνουν ένα παράθυρο περιβάλλοντος 1 εκατομμυρίου (~ 700.000 λέξεις). Αυτό είναι στο ίδιο επίπεδο με το νεότερο μοντέλο GenAI της Google, το προαναφερθέν Gemini 1.5 Pro, το οποίο προσφέρει επίσης ένα παράθυρο περιβάλλοντος έως και 1 εκατομμυρίου.

Τώρα, μόνο και μόνο επειδή το Claude 3 είναι μια αναβάθμιση σε σχέση με αυτό που προηγήθηκε, δεν σημαίνει ότι είναι τέλειο.

Σε μια τεχνική

λευκό χαρτί

, ο Anthropic παραδέχεται ότι ο Claude 3 δεν είναι άτρωτος από τα ζητήματα που μαστίζουν άλλα μοντέλα GenAI, δηλαδή τις μεροληψίες και τις παραισθήσεις (δηλαδή, φτιάχνοντας πράγματα). Σε αντίθεση με ορισμένα μοντέλα GenAI, το Claude 3 δεν μπορεί να κάνει αναζήτηση στο διαδίκτυο. τα μοντέλα μπορούν να απαντήσουν σε ερωτήσεις μόνο χρησιμοποιώντας δεδομένα πριν από τον Αύγουστο του 2023. Και ενώ ο Claude είναι πολύγλωσσος, δεν μιλάει τόσο άπταιστα σε ορισμένες γλώσσες «χαμηλών πόρων» σε σχέση με τα αγγλικά.

Αλλά οι υποσχόμενες συχνές ενημερώσεις του Anthropic στο Claude 3 τους επόμενους μήνες.

«Δεν πιστεύουμε ότι η ευφυΐα των μοντέλων είναι κοντά στα όριά της και σκοπεύουμε να κυκλοφορήσουμε [enhancements] στην οικογένεια μοντέλων Claude 3 τους επόμενους μήνες», γράφει η εταιρεία σε μια ανάρτηση στο blog.

Το Opus και το Sonnet είναι τώρα διαθέσιμα στον Ιστό και μέσω της κονσόλας προγραμματιστών και του API της Anthropic, της πλατφόρμας Bedrock της Amazon και του Vertex AI της Google. Το χαϊκού θα ακολουθήσει αργότερα φέτος.

Ακολουθεί η ανάλυση των τιμών:

Opus: 15 $ ανά εκατομμύριο μάρκες εισόδου, 75 $ ανά εκατομμύριο μάρκες εξόδου
Σονέτο: 3 $ ανά εκατομμύριο μάρκες εισόδου, 15 $ ανά εκατομμύριο μάρκες εξόδου
Χαϊκού: 0,25 $ ανά εκατομμύριο μάρκες εισόδου, 1,25 $ ανά εκατομμύριο μάρκες εξόδου

Αυτό είναι λοιπόν ο Claude 3. Ποια είναι όμως η θέα των 30.000 ποδιών;

Λοιπόν, όπως έχουμε

έχουν αναφερθεί

Προηγουμένως, η φιλοδοξία της Anthropic είναι να δημιουργήσει έναν «αλγόριθμο επόμενης γενιάς για αυτοδιδασκαλία της τεχνητής νοημοσύνης». Ένας τέτοιος αλγόριθμος θα μπορούσε να χρησιμοποιηθεί για τη δημιουργία εικονικών βοηθών που μπορούν να απαντούν σε μηνύματα ηλεκτρονικού ταχυδρομείου, να διεξάγουν έρευνα και να δημιουργούν έργα τέχνης, βιβλία και πολλά άλλα — μερικά από τα οποία έχουμε ήδη πάρει μια γεύση με

GPT-4

και άλλα μεγάλα γλωσσικά μοντέλα.

Η Anthropic υπονοεί αυτό στην προαναφερθείσα ανάρτηση ιστολογίου, λέγοντας ότι σχεδιάζει να προσθέσει δυνατότητες στο Claude 3 που ενισχύουν τις out-of-the-gate δυνατότητές του, συμπεριλαμβανομένης της δυνατότητας στον Claude 3 να αλληλεπιδρά με άλλα συστήματα, διαδραστική κωδικοποίηση και «πιο προηγμένες δυνατότητες αντιπροσώπων .»

Αυτό το τελευταίο κομμάτι θυμίζει το OpenAI

έχουν αναφερθεί

φιλοδοξίες για τη δημιουργία μιας μορφής πράκτορα λογισμικού για την αυτοματοποίηση σύνθετων εργασιών, όπως η μεταφορά δεδομένων από ένα έγγραφο σε ένα υπολογιστικό φύλλο για ανάλυση ή η αυτόματη συμπλήρωση αναφορών δαπανών και η εισαγωγή τους σε λογιστικό λογισμικό. Το OpenAI προσφέρει ήδη ένα API που επιτρέπει στους προγραμματιστές να δημιουργήσουν «εμπειρίες τύπου πράκτορα» στις εφαρμογές τους και η Anthropic, φαίνεται, σκοπεύει να προσφέρει συγκρίσιμες λειτουργίες.

Θα μπορούσαμε να δούμε μια γεννήτρια εικόνας από την Anthropic στη συνέχεια; Θα με εξέπληξε, ειλικρινά. Οι γεννήτριες εικόνων αποτελούν αντικείμενο μεγάλης διαμάχης αυτές τις μέρες — κυρίως για λόγους που σχετίζονται με πνευματικά δικαιώματα και μεροληψία. Η Google αναγκάστηκε πρόσφατα να απενεργοποιήσει το πρόγραμμα δημιουργίας εικόνων της, αφού εισήγαγε ποικιλομορφία στις εικόνες με μια φαρσική περιφρόνηση του ιστορικού πλαισίου και αρκετοί προμηθευτές δημιουργίας εικόνων βρίσκονται σε νομικές μάχες με καλλιτέχνες που τους κατηγορούν ότι επωφελούνται από το έργο τους εκπαιδεύοντας την GenAI σε αυτήν χωρίς την παροχή πίστωσης ή αποζημίωσης.

Είμαι περίεργος να δω την εξέλιξη της τεχνικής της Anthropic για την εκπαίδευση του GenAI, τη «συνταγματική τεχνητή νοημοσύνη», την οποία η εταιρεία ισχυρίζεται ότι κάνει τη συμπεριφορά των μοντέλων της πιο κατανοητή και πιο απλή στην προσαρμογή ανάλογα με τις ανάγκες. Η συνταγματική τεχνητή νοημοσύνη επιδιώκει να προσφέρει έναν τρόπο

ευθυγράμμιση της τεχνητής νοημοσύνης με τις ανθρώπινες προθέσεις

, έχοντας τα μοντέλα να απαντούν σε ερωτήσεις και να εκτελούν εργασίες χρησιμοποιώντας ένα απλό σύνολο κατευθυντήριων αρχών. Για παράδειγμα, για το Claude 3, η Anthropic είπε ότι πρόσθεσε μια συνταγματική αρχή —που ενημερώθηκε από τα σχόλια των πελατών— που καθοδηγεί τα μοντέλα να είναι κατανοητά και προσβάσιμα σε άτομα με αναπηρία.

Όποιο κι αν είναι το τελικό παιχνίδι του Anthropic, είναι μέσα σε αυτό για μεγάλο χρονικό διάστημα. Σύμφωνα με ένα pitch deck που διέρρευσε τον Μάιο του περασμένου έτους, η εταιρεία στοχεύει να συγκεντρώσει έως και 5 δισεκατομμύρια δολάρια τους επόμενους 12 μήνες περίπου – που μπορεί να είναι απλώς η βασική γραμμή που χρειάζεται για να παραμείνει ανταγωνιστική με το OpenAI. (Τα μοντέλα εκπαίδευσης δεν είναι φθηνά, τελικά.) Είναι σε καλό δρόμο, με δεσμευμένο κεφάλαιο 2 και 4 δισεκατομμυρίων δολαρίων και δεσμεύσεις από την Google και την Amazon, αντίστοιχα.

VIA:

techcrunch.com

AI

Anthropic

apps

Generative AI

startups

ανθρωπικός

Γενάι

Όλα συμπεριλαμβάνονται

Τα νέα μοντέλα της Anthropic θεωρούνται υπερηχητικά από το GPT-4

Απάντηση Ακύρωση απάντησης

Απάντηση

Ακύρωση απάντησης