Το τελευταίο AI της Alibaba ξεπέρασε το GPT-3.5, ο Claude σε πολλαπλές δοκιμές συγκριτικής αξιολόγησης

By

Marizas Dimitris

On

Φεβ 6, 2024

Αυτή δεν είναι επενδυτική συμβουλή. Ο συγγραφέας δεν έχει θέση σε καμία από τις μετοχές που αναφέρονται. Το Wccftech.com έχει πολιτική αποκάλυψης και δεοντολογίας.

Με το 2024 να σηματοδοτεί ένα δυνατό ξεκίνημα στον παγκόσμιο αγώνα τεχνητής νοημοσύνης, ο κινεζικός τεχνολογικός κολοσσός

Alibaba

Group ανακοίνωσε επίσης την τελευταία επανάληψη του

μοντέλο

υ τεχνητής νοημοσύνης Qwen. Εκτός από το ChatGPT του OpenAI, το οποίο είναι το πιο γνωστό chatbot AI στον κόσμο, άλλα μοντέλα όπως το Meta’s Llama και ο συνεργάτης της Amazon, Anthropic’s Claude είναι πολλές επιλογές που έχουν οι καταναλωτές και οι

επιχειρήσεις

όταν επιλέγουν μια πλατφόρμα AI για τις ανάγκες τους.

Η τελευταία έκδοση Qwen της Alibaba είναι το Qwen 1.5 και σύμφωνα με τα σημεία αναφοράς που κοινοποιούνται στην πλατφόρμα κοινωνικής δικτύωσης X, το μοντέλο ξεπερνά τόσο το ChatGPT όσο και τον Claude σε ορισμένες βαθμολογίες αναφοράς.

Το Qwen 1.5 της Alibaba Beats Claude και το ChatGPT σε πολλαπλά σημεία αναφοράς που δοκιμάζουν την εκπαιδευτική ρευστότητα

Ακριβώς όπως τα λειτουργικά συστήματα που τρέχουν σε υπολογιστές ή smartphone, ένα μοντέλο τεχνητής νοημοσύνης είναι επίσης ένα κομμάτι λογισμικού. Αυτό επιτρέπει στους μηχανικούς λογισμικού και τους αναλυτές να αξιολογήσουν την απόδοσή του και όταν πρόκειται για το τελευταίο Qwen 1.5 της Alibaba, ορισμένες βαθμολογίες δείχνουν ότι υπερτερεί του Claude του Anthropic και του ChatGPT του OpenAI.

Τα σημεία αναφοράς που δοκιμάζουν τα λειτουργικά συστήματα αξιολογούν την ικανότητά τους να επεξεργάζονται οδηγίες και να εκτελούν εφαρμογές, και αυτά για μοντέλα τεχνητής νοημοσύνης συνήθως περιστρέφονται γύρω από αυτά δοκιμάζοντας την ικανότητα των μοντέλων να δημιουργούν εξόδους.

Δύο τέτοια σημεία αναφοράς είναι το MT-bench και το Alapaca-Eval και οι βαθμολογίες που μοιράζονται στο X δείχνουν ότι μια παραλλαγή του Qwen 1.5 της Alibaba έχει ξεπεράσει το ChatGPT και τον Claude σε αυτά. Το MT-bench δοκιμάζει την ικανότητα ενός μοντέλου να απαντά σε ένα σύνολο προκαθορισμένων ερωτήσεων που όχι μόνο επιδιώκουν να το διαφοροποιήσουν από το chatbot, αλλά επίσης προσπαθούν να προσδιορίσουν εάν το μοντέλο μπορεί να «κρατήσει τη θέση του» σε ένα σκληρό περιβάλλον συνομιλίας που περιλαμβάνει δύο μέρη που εμπλέκονται γρήγορα ο ένας με τον άλλο.

Οι βαθμολογίες αναφοράς δείχνουν ότι το Qwen ήταν ο τέταρτος υψηλότερος σκόρερ στον πάγκο MT και υστερούσε μόνο πίσω από το GPT-4 Turbo και τις δύο πρώτες εκδόσεις GPT-4, δηλαδή τις εκδόσεις 0613 και 0314.

Η Alibaba κυκλοφορεί το Qwen 1.5

διαδήλωση:

https://t.co/goMcWMsIzT

Το μεγαλύτερο Qwen1.5-72B-Chat ανοιχτού κώδικα, παρουσιάζει ανώτερη απόδοση, ξεπερνώντας τα Claude-2.1, GPT-3.5-Turbo-0613, τόσο στο MT-Bench όσο και στο Alpaca-Eval v2

pic.twitter.com/50dNuUpEBx

— AK (@_akhaliq)

5 Φεβρουαρίου 2024

Το Alapaca-Eval είναι ένα σημείο αναφοράς που χρησιμοποιεί ένα μοντέλο αναφοράς για να μιμηθεί τις ανθρώπινες αλληλεπιδράσεις και να καθορίσει τον βαθμό στον οποίο ένα μοντέλο τεχνητής νοημοσύνης που δοκιμάζεται αποδίδει αποτελέσματα σύμφωνα με τη βασική γραμμή. Παρέχει επίσης στους χρήστες ένα leaderboard για να παρακολουθούν τις δοκιμές τους και τα σημερινά σημεία αναφοράς δείχνουν ότι η απόδοση Alapaca-Eval του Qwen 1.5 υστερεί μόνο σε σχέση με το GPT-4 Turbo και το Yi-34B της HuggingFace με βάση τη Νέα Υόρκη.

Το Qwen1.5 είναι ένα από τα μεγαλύτερα μοντέλα ανοιχτού κώδικα του είδους του και υποστηρίζεται από τους τεράστιους υπολογιστικούς πόρους της Alibaba. Μια τεχνητή νοημοσύνη ανοιχτού κώδικα, όπως το λογισμικό ανοιχτού κώδικα, καθιστά τον κώδικά του διαθέσιμο σε χρήστες και προγραμματιστές, ώστε να μπορούν να κατανοήσουν το μοντέλο και να δημιουργήσουν τις δικές τους παραλλαγές. Το Llama του Meta, επίσης παρόν στις σημερινές παρτιτούρες, είναι επίσης ένα μοντέλο ανοιχτού κώδικα.

Στις αρχές του 2024, η Wall Street και οι εταιρείες επικεντρώθηκαν στη διάσημη εστίαση της AI. Αναφορές AI Earnings ότι οι κολοσσοί τεχνολογίας mega cap, όπως η Meta, η Microsoft και η Alphabet, έχουν επικεντρωθεί στο στόχο του επικεφαλής της AI Meta, Mark Zuckerberg, να αγοράσει εκατοντάδες χιλιάδες GPU φέτος στην εξουσία. επάνω Llama, και στην κλήση των κερδών της εταιρείας, το στέλεχος εξήγησε ότι η απόφασή του να ενισχύσει την υπολογιστική ικανότητα στη Meta ακολουθεί προηγούμενες παραλείψεις που οδήγησαν στην υπολειτουργία της εταιρείας.

Ομοίως, τα κέρδη από τους κατασκευαστές chip και τους σχεδιαστές

TSMC

και AMD έχουν επίσης δει τις διοικήσεις τους να εκφράζουν αισιοδοξία για το

μέλλον

της AI Η διοίκηση της TSMC είναι πεπεισμένη ότι η εταιρεία έχει σταθερή βάση για να καλύψει οποιαδήποτε ζήτηση τεχνητής νοημοσύνης, ενώ η AMD είναι της άποψης ότι η τεχνητή νοημοσύνη μπορεί να καταλήξει αξίας εκατοντάδων δισεκατομμυρίων δολαρίων μέχρι το τέλος της δεκαετίας.

VIA:

wccftech.com

Alibaba

Finance

news