Η Microsoft Research κυκλοφόρησε το Orca 2 LLM, το οποίο μπορεί να ταιριάζει με την απόδοση μεγαλύτερων μοντέλων





Η Microsoft μπορεί να έχει συνεργαστεί με τα μοντέλα μεγάλων γλωσσών OpenAI και GPT για να βοηθήσει στη δημιουργία παραγωγικών υπηρεσιών AI όπως το Copilot (παλαιότερα γνωστό ως

Chat). Ωστόσο, η εταιρεία εργάζεται και σε δικά της LM. Αυτή την εβδομάδα, η Microsoft Research ανακοίνωσε την κυκλοφορία του Orca 2, μιας δεύτερης έκδοσης της γλώσσας Orca

Σε

μια ανάρτηση ιστολογίου

, η Microsoft δήλωσε ότι το Orca 2 σχεδιάστηκε ειδικά για να είναι ένα μικρότερο LM, αλλά μπορεί ακόμα να χρησιμοποιηθεί για να απαντήσει σε περίπλοκες ερωτήσεις όπως τα LLM. Το Orca 2 διατίθεται σε δύο μεγέθη (7 δισεκατομμύρια και 13 δισεκατομμύρια παραμέτρους) και κατασκευάστηκαν εν μέρει χρησιμοποιώντας το Llama 2 LLM που βοήθησε να κυκλοφορήσει με το Meta νωρίτερα φέτος. Η εταιρεία βελτίωσε το

που βασίζεται στο Llama 2 «σε προσαρμοσμένα, υψηλής ποιότητας συνθετικά δεδομένα».

Η Microsoft δήλωσε ότι αυτό επέτρεψε στα μοντέλα Orca 2 να χειριστούν προβλήματα που ταίριαζαν με την απόδοση άλλων μοντέλων γλώσσας “5-10 φορές μεγαλύτερης”, δήλωσε:

Το Orca 2 εκπαιδεύεται με ένα διευρυμένο, εξαιρετικά προσαρμοσμένο συνθετικό σύνολο δεδομένων. Τα δεδομένα εκπαίδευσης δημιουργήθηκαν έτσι ώστε να διδάσκουν στην Orca 2 διάφορες τεχνικές συλλογιστικής, όπως μεθόδους επεξ

ς βήμα-βήμα, ανάκληση και στη συνέχεια δημιουργία, ανάκληση-λόγος-δημιουργία, εξ

-δημιουργία και μεθόδους άμεσης απάντησης, ενώ παράλληλα του διδάσκει να επιλέγει διαφορετικές στρατηγικές λύσης για διαφορετικές εργασίες.


Η Microsoft Research κυκλοφόρησε το Orca 2 LLM, το οποίο μπορεί να ταιριάζει με την απόδοση μεγαλύτερων μοντέλων, Η Microsoft Research κυκλοφόρησε το Orca 2 LLM, το οποίο μπορεί να ταιριάζει με την απόδοση μεγαλύτερων μοντέλων, TechWar.gr

Τα μοντέλα Orca 2 αντιμετώπισαν έναν αριθμό μεγαλύτερων γλωσσικών μοντέλων όπως το Llama 2 και το WizardLM με μια σειρά σημείων αναφοράς που κάλυπταν θέματα όπως “κατανόηση γλώσσας, συλλογισμός κοινής λογικής, συλλογισμός πολλαπλών βημάτων, επίλυση μαθηματικών προβλημάτων, κατανόηση ανάγνωσης” και περισσότερο. Το blog ανέφερε:

Τα προκαταρκτικά μας

δείχνουν ότι η απόδοση του Orca 2 ξεπερνά σημαντικά τα μοντέλα παρόμοιου μεγέθους. Επίσης, επιτυγχάνει επίπεδα απόδοσης παρόμοια ή καλύτερα από εκείνα μοντέλων τουλάχιστον 10 φορές μεγαλύτερων, αναδεικνύοντας τη δυνατότητα εξοπλισμού μικρότερων μοντέλων με καλύτερες συλλογιστικές δυνατότητες.

Ενώ η Microsoft παραδέχτηκε ότι το Orca 2 έχει περιορισμούς, οι δοκιμές μέχρι στιγμής δείχνουν “δυνατότητες για μελλοντικές εξελίξεις”. Η Microsoft κυκλοφορεί το Orca 2 ως έργο ανοιχτού κώδικα, ώστε να μπορούν να εργαστούν και άλλοι σε αυτό.


VIA:

NeoWin.net


Leave A Reply



Cancel Reply

Your email address will not be published.