Η Apple φημολογείται εδώ και καιρό ότι έχει σχέδια για μια μεγάλη ώθηση της τεχνητής νοημοσύνης εντός και μετά το 2024, και τώρα η νέα έρευνα μπορεί να βοηθήσει πολύ στο να γίνει αυτό πραγματικότητα, ενώ θα είναι σε θέση να διατηρήσει τη ζήτηση της Apple για ασφάλεια και απόρρητο.
Μέχρι σήμερα, μεγάλα μοντέλα γλώσσας (LLM) όπως αυτά στα οποία βασίζεται το ChatGPT τροφοδοτούνται από υπολογιστές που βρίσκονται σε κέντρα δεδομένων και έχουν πρόσβαση μέσω μιας ιστοσελίδας ή μιας εφαρμογής για
iPhone
. Είναι τεράστια κομ
μάτια
λογισμικού που απαιτούν εξίσου τεράστιες ποσότητες πόρων για να λειτουργήσουν σωστά, γεγονός που καθιστά προβληματική την προσπάθεια να εκτελεστούν τοπικά σε τηλέφωνα όπως το επερχόμενο iPhone 16. Αλλά με την εκτέλεση LLM σε κέντρα δεδομένων υπάρχει ανησυχία για το απόρρητο να εξετάσει, και με την Apple να εργάζεται ήδη για να διατηρήσει όσο το δυνατόν περισσότερα αιτήματα Siri στη συσκευή, δεν αποτελεί έκπληξη το γεγονός ότι η Apple μπορεί να θέλει να κάνει το ίδιο με οποιαδήποτε εφαρμογή LLM στην οποία εργάζεται.
Τώρα, μια ερευνητική εργασία μπορεί να έχει την απάντηση και θα μπορούσε να ανοίξει την πόρτα στο εσωτερικό Apple GPT της Apple που θα κάνει το ντεμπούτο της έξω από το Apple Park. Αλλά αν το Siri πρόκειται να λάβει πραγματικά μια μεγάλη αναβάθμιση, θα μπορούσαν τα iPhone του 2024 να έρθουν πολύ σύντομα;
Επεξεργασία στη συσκευή
ο
ερευνητική εργασία
, με τίτλο “LLM in a flash: Efficient Large Language Model Inference with Limited Memory”, είναι συγγραφέας πολλών μηχανικών της Apple και συζητά πώς ένα LLM θα μπορούσε να χρησιμοποιηθεί σε συσκευές με περιορισμένη RAM (ή
DRAM
), όπως τα iPhone. Το χαρτί θα ήταν επίσης χρήσιμο για την αναβάθμιση του Siri σε παρόμοιες συσκευές με περιορισμό RAM, όπως τα MacBook και το iPad χαμηλής ποιότητας, για να μην αναφέρουμε το Apple Watch.
«Τα μεγάλα γλωσσικά μοντέλα (LLM) είναι κεντρικά για τη σύγχρονη επεξεργασία φυσικής γλώσσας, παρέχοντας εξαιρετική απόδοση σε διάφορες εργασίες», ξεκινά η εργασία. “Ωστόσο, οι έντονες υπολογιστικές και μνήμης απαιτήσεις τους παρουσιάζουν προ
κλήσεις
, ειδικά για συσκευές με περιορισμένη χωρητικότητα DRAM. Αυτό το έγγραφο αντιμετωπίζει την πρόκληση της αποτελεσματικής λειτουργίας LLM που υπερβαίνει τη διαθέσιμη χωρητικότητα DRAM αποθηκεύοντας τις παραμέτρους του μοντέλου στη μνήμη flash αλλά φέρνοντάς τις κατόπιν ζήτησης σε DRAM .”
Ο χώρος αποθήκευσης Flash, ή ο αποθηκευτικός χώρος που επιλέγετε όταν αγοράζετε το iPhone σας, είναι πολύ πιο άφθονος και μπορεί να σχεδιαστεί για την αποθήκευση των δεδομένων LLM. Η εργασία εξετάζει διαφορετικούς τρόπους χρήσης της αποθήκευσης flash μιας συσκευής στη θέση της DRAM. Υπάρχουν δύο βασικοί τρόποι που συζητούνται, συμπεριλαμβανομένου του “παραθύρου” και του “ομαδοποίησης γραμμής-στήλης”.
Η εργασία εξηγεί ότι «αυτές οι μέθοδοι συλλογικά επιτρέπουν σε μοντέλα που τρέχουν έως και το διπλάσιο του μεγέθους της διαθέσιμης DRAM, με 4-5x και 20-25x αύξηση στην ταχύτητα συμπερασμάτων σε σύγκριση με τις απλές προσεγγίσεις φόρτωσης σε CPU και GPU, αντίστοιχα».
Προφανή οφέλη
Τα οφέλη μιας τέτοιας προσέγγισης είναι προφανή. Η αποθήκευση ενός LLM σε ένα iPhone όχι μόνο θα ήταν ευεργετική όσον αφορά την άρση της ανάγκης αποθήκευσης σε ένα απομακρυσμένο κέντρο δεδομένων και τη βελτίωση του απορρήτου, αλλά θα ήταν επίσης πολύ πιο γρήγορη. Η κατάργηση του λανθάνοντος χρόνου που δημιουργείται από κακές συνδέσεις δεδομένων είναι ένα πράγμα, αλλά η αύξηση της ταχύτητας υπερβαίνει αυτό και θα μπορούσε να κάνει το Siri να ανταποκρίνεται με μεγαλύτερη ακρίβεια και ταχύτητα από ποτέ.
Η Apple φημολογείται ήδη ότι εργάζεται για να φέρει βελτιωμένα μικρόφωνα στη σειρά iPhone 16, πιθανότατα σε μια προσπάθεια να διασφαλίσει ότι η Siri ακούει τι ζητούν οι άνθρωποι από αυτήν με μεγαλύτερη σαφήνεια. Σε συνδυασμό με τη δυνατότητα για μια σημαντική ανακάλυψη στο LLM και τα iPhone του 2024 θα μπορούσαν να έχουν κάποιες σοβαρές αλλαγές στην
τεχνητή νοημοσύνη
.
Περισσότερα από το iMore
window.reliableConsentGiven.then(function(){
!function(f,b,e,v,n,t,s){if(f.fbq)return;n=f.fbq=function()
{n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)}
;if(!f._fbq)f._fbq=n;
n.push=n;n.loaded=!0;n.version=’2.0′;n.queue=[];t=b.createElement(e);t.async=!0;
t.src=v;s=b.getElementsByTagName(e)[0];s.parentNode.insertBefore(t,s)}(window,
document,’script’,’https://connect.facebook.net/en_US/fbevents.js’);
fbq(‘init’, ‘1765793593738454′);
fbq(‘track’, ‘PageView’);
})
VIA:
iMore.com

