«Για πολλές εφαρμογές τεχνητής νοημοσύνης, οι GPU είναι υπολογιστικές υπερβολές, καταναλώνοντας πολύ περισσότερη ισχύ και χρήματα από όσα χρειάζονται»: Πώς η Ampere Computing σχεδιάζει να οδηγήσει το κύμα AI
Ampere Computing
είναι μια startup που κάνει κύματα στον κλάδο της τεχνολογίας αμφισβητώντας την κυριαρχία τεχνολογικών κολοσσών όπως η AMD, η
Nvidia
και η Intel. Με την άνοδο της τεχνητής νοημοσύνης, η ζήτηση για υπολογισ
τι
κή ισχύ έχει εκτοξευθεί στα ύψη, μαζί με το ενεργειακό κόστος και τη ζήτηση στα δίκτυα ισχύος. Το Ampere στοχεύει να το αντιμετωπίσει με μια λύση χαμηλής ισχύος και υψηλής απόδοσης.
Παρά το γεγονός ότι είναι το αουτσάιντερ, η προσφορά του Ampere έχει υιοθετηθεί από σχεδόν όλους τους μεγάλους υπερκλιμάκωτους παγκοσμίως. Έχει σπάσει τον τοίχο κλιμάκωσης πολλές φορές με τις CPU του και η εταιρεία σχεδιάζει να συνεχίσει την κλιμάκωση με τρόπους που δεν μπορούν οι αρχιτεκτονικές παλαιού τύπου. Μιλήσαμε με τον CPO της Ampere Jeff Wittich για την επιτυχία της εταιρείας του και τα μελλοντικά σχέδια.
Νιώθω μερικές φορές ότι οι νεοσύστατες εταιρείες αμφισβητήσεων, όπως η Ampere Computing, είναι κολλημένες μεταξύ ενός βράχου και ενός σκληρού τόπου. Από τη μια πλευρά, έχετε εταιρείες πολλών δισεκατομμυρίων δολαρίων όπως η AMD, η Nvidia και η Intel και από την άλλη πλευρά, υπερκλιμακωτές όπως η Microsoft, η Google και η Amazon που έχουν τις δικές τους προσφορές. Πώς νιώθεις να είσαι το μικρό θηλαστικό στη χώρα των δεινοσαύρων;
Είναι πραγματικά μια συναρπαστική στιγμή για το Ampere. Μπορεί να είμαστε μόλις έξι ετών, αλλά όπως είχαμε προβλέψει όταν ξεκινήσαμε την εταιρεία, η ανάγκη για μια νέα υπολογιστική λύση για το cloud δεν ήταν ποτέ πιο έντονη. Η βιομηχανία δεν χρειάζεται περισσότερους δεινόσαυρους – χρειάζεται κάτι νέο.
Οι ανάγκες του cloud έχουν αλλάξει. Η ποσότητα της υπολογιστικής ισχύος που απαιτείται για τον σημερινό συνδεδεμένο κόσμο είναι πολύ μεγαλύτερη από ό,τι θα μπορούσε ποτέ να φανταστεί κανείς και θα αυξηθεί μόνο με την άνοδο της τεχνητής νοημοσύνης. Ταυτόχρονα, το κόστος ενέργειας έχει εκτοξευθεί στα ύψη, η ζήτηση στα δίκτυα ηλεκτρικής ενέργειας του κόσμου ξεπερνά την προσφορά και οι νέες κατασκευές κέντρων δεδομένων σταματούν για διάφορους λόγους. Η σύγκλιση αυτών των παραγόντων έχει δημιουργήσει την τέλεια ευκαιρία για την Ampere να παρέχει μια τόσο αναγκαία λύση χαμηλής κατανάλωσης και υψηλής απόδοσης που δεν έχει παραδοθεί από μεγάλους, παλαιού τύπου παίκτες.
Λόγω της ικανότητάς μας να το παρέχουμε αυτό, έχουμε αναπτυχθεί γρήγορα και έχουμε υιοθετηθεί από σχεδόν όλους τους μεγάλους υπερκλιμακωτές σε όλο τον κόσμο. Βλέπουμε επίσης αυξημένη υιοθέτηση στην επιχείρηση, καθώς οι εταιρείες προσπαθούν να αξιοποιήσουν στο έπακρο το υπάρχον αποτύπωμα του κέντρου δεδομένων τους. Η αυξημένη ζήτηση που συνεχίζουμε να βλέπουμε για τα προϊόντα Ampere μας κάνει να είμαστε σίγουροι ότι ο κλάδος βλέπει την αξία μας.
Η Ampere είναι ο ηγέτης στον υψηλό αριθμό πυρήνων στην αγορά CPU διακομιστών
εδώ
και μερικά χρόνια. Ωστόσο, άλλες – η AMD και η Intel – έχουν φτάσει. Δεδομένων των αμετάβλητων νόμων της φυσικής, πότε προβλέπετε ότι θα χτυπήσετε έναν τοίχο όσον αφορά τους φυσικούς πυρήνες και πώς σκοπεύετε να τον σπάσετε;
Όπως αναφέρατε, το Ampere ήταν ο ηγέτης στον υψηλό αριθμό πυρήνων, τον πυκνό και αποτελεσματικό υπολογισμό τα τελευταία χρόνια. Από νωρίς, εντοπίσαμε πού θα προκύψουν οι βασικές προκλήσεις για την ανάπτυξη του cloud και αντιμετωπίζουμε αυτές ακριβώς τις προκλήσεις σήμερα με τους επεξεργαστές Ampere. Οι επεξεργαστές Ampere μας είναι ιδανικοί για περιπτώσεις χρήσης cloud όλων των ειδών και σε ένα ευρύ φάσμα φόρτων εργασίας.
Τώρα έχουμε σπάσει τον τοίχο κλιμάκωσης αρκετές φορές τώρα, όντας οι πρώτοι με 128 πυρήνες και τώρα 192 πυρήνες. Η καινοτομία όπως αυτή απαιτεί μια νέα προσέγγιση που σπάει τους κληροδοτημένους περιορισμούς. Η νέα προσέγγιση της Ampere στο σχεδιασμό της CPU, από τη μικροαρχιτεκτονική έως το σύνολο χαρακτηριστικών, θα μας επιτρέψει να συνεχίσουμε την κλιμάκωση με τρόπους που δεν μπορούν οι αρχιτεκτονικές παλαιού τύπου.
Μια άλλη αξιόπιστη
απε
ιλή που διαφαίνεται στον ορίζοντα είναι η άνοδος του RISC-V με την Κίνα να βάζει το βάρος της στη μικροαρχιτεκτονική. Ποιες είναι οι προσωπικές σας απόψεις σε αυτό το μέτωπο; Θα μπορούσε η Ampere να ενταχθεί στην ομάδα RISC μια μέρα;
Η βασική στρατηγική της Ampere είναι η ανάπτυξη βιώσιμων επεξεργαστών που θα τροφοδοτούν τον υπολογισμό τόσο σήμερα όσο και στο μέλλον. Θα κατασκευάσουμε τις CPU μας χρησιμοποιώντας τις καλύτερες διαθέσιμες τεχνολογίες για να προσφέρουμε ηγετική απόδοση, αποτελεσματικότητα και επεκτασιμότητα, εφόσον αυτές οι τεχνολογίες μπορούν να χρησιμοποιηθούν εύκολα από τους πελάτες μας για την εκτέλεση των επιθυμητών λειτουργικών συστημάτων, λογισμικού υποδομής και εφαρμογών χρηστών.
Τι μπορείτε να μας πείτε για τη συνέχεια του Ampere One; Θα ακολουθήσει την ίδια τροχιά με το Altra > One; Περισσότεροι πυρήνες; Ίδια συχνότητα, περισσότερη μνήμη cache L2 ανά πυρήνα; Θα λέγεται Ampere 2 και θα εξακολουθεί να είναι μονόκλωστο;
Τα επόμενα χρόνια, θα συνεχίσουμε να επικεντρωνόμαστε στην κυκλοφορία CPU που είναι πιο αποδοτικές και που παρέχουν υψηλότερο αριθμό πυρήνων, καθώς και περισσότερο εύρος ζώνης μνήμης και δυνατότητες IO. Αυτό θα μας δώσει όλο και περισσότερη απόδοση για όλο και πιο σημαντικούς φόρτους εργασίας, όπως η εξαγωγή συμπερασμάτων AI, ενώ θα ανταποκρίνεται μοναδικά στους στόχους βιωσιμότητας των παρόχων και των χρηστών του cloud.
Τα προϊόντα μας θα συνεχίσουν επίσης να επικεντρώνονται στην παροχή προβλέψιμων επιδόσεων στους χρήστες cloud, εξαλείφοντας τα θορυβώδη προβλήματα γειτόνων και επιτρέποντας στους παρόχους να εκτελούν CPU Ampere σε υψηλή χρήση. Θα εισαγάγουμε πρόσθετες λειτουργίες που παρέχουν μεγαλύτερο βαθμό ευελιξίας στους παρόχους cloud ώστε να ανταποκρίνονται στο ποικίλο σύνολο εφαρμογών πελατών. Αυτά είναι κρίσιμα για την απόδοση του φόρτου εργασίας του Cloud Native τώρα και στο μέλλον.
Δεδομένης της εστιασμένης προσέγγισης του Ampere Computing, μπορείτε να μας δώσετε μια σύντομη περιγραφή του μέσου πελάτη σας και τι είδους φόρτους εργασίας συνήθως χειρίζονται;
Επειδή οι CPU μας είναι γενικής χρήσης, εξυπηρετούν ένα ευρύ φάσμα εφαρμογών. Κατασκευάσαμε τις CPU μας από την αρχή ως Cloud Native Processors, ώστε να αποδίδουν πραγματικά καλά σε όλους σχεδόν τους φόρτους εργασίας στο cloud – τα συμπεράσματα AI, οι υπηρεσίες web, οι βάσεις δεδομένων και η επεξεργασία βίντεο είναι μερικά μόνο παραδείγματα. Σε πολλές περιπτώσεις, μπορούμε να προσφέρουμε διπλάσια απόδοση για αυτούς τους φόρτους εργασίας με τη μισή ισχύ από τους παλαιούς επεξεργαστές x86.
Όσον αφορά τους πελάτες, συνεργαζόμαστε σχεδόν με όλους τους μεγάλους υπερκλιμάκωτους στις ΗΠΑ, την
Ευρώπη
και την Κίνα. Στις ΗΠΑ, για παράδειγμα, μπορείτε να βρείτε παρουσίες Ampere στο Oracle Cloud, στο Google Cloud, στο Microsoft Azure και άλλα. Οι επεξεργαστές Ampere είναι επίσης διαθέσιμοι σε όλη την Ευρώπη σε διάφορους παρόχους cloud.
Πέρα από τους μεγάλους παρόχους cloud, βλέπουμε μεγάλη έλξη στην επιχείρηση μέσω των προσφορών μας με OEM όπως η HPE και η Supermicro. Αυτό οφείλεται σε μεγάλο βαθμό στην αυξημένη απόδοση και την πυκνότητα rack που μπορούν να επιτύχουν αυτές οι εταιρείες με την ανάπτυξη διακομιστών Ampere. Οι επιχειρήσεις θέλουν να εξοικονομήσουν ενέργεια και δεν θέλουν να δημιουργήσουν πρόσθετα κέντρα δεδομένων που δεν είναι ο πυρήνας της επιχείρησής τους.
Με την άνοδο της τεχνητής νοημοσύνης, οι κάποτε «απλές» συσκευές γίνονται όλο και πιο έξυπνες, οδηγώντας σε μεγαλύτερη ζήτηση για υπολογιστικό νέφος σε υπερτοπικές περιοχές. Αυτές οι αναπτύξεις άκρων έχουν αυστηρές απαιτήσεις χώρου και ισχύος και λόγω της ικανότητας του Ampere να παρέχει τόσο μεγάλο αριθμό πυρήνων σε ένα φάκελο χαμηλής ισχύος, βλέπουμε επίσης μεγάλη ζήτηση για αυτούς τους φόρτους εργασίας.
Η τεχνητή νοημοσύνη έχει γίνει το κύριο θέμα συζήτησης φέτος στη βιομηχανία ημιαγωγών και όχι μόνο. Θα αλλάξει αυτό το 2024, κατά τη γνώμη σας; Πώς βλέπετε αυτή την αγορά;
Πιστεύουμε ακράδαντα η τεχνητή νοημοσύνη θα συνεχίσει να είναι το κύριο θέμα της συζήτησης. Αλλά πιστεύουμε ότι η συζήτηση θα αλλάξει – και έχει ήδη αρχίσει.
Το 2024, πολλές εταιρείες που εργάζονται σε λύσεις τεχνητής νοημοσύνης θα περάσουν από την αρχική εκπαίδευση των νευρωνικών δικτύων στην ανάπτυξή τους, γνωστή και ως συμπέρασμα AI. Επειδή το συμπέρασμα τεχνητής νοημοσύνης μπορεί να απαιτεί 10 φορές περισσότερη συνολική υπολογιστική ισχύ από την εκπαίδευση, η ικανότητα ανάπτυξης τεχνητής νοημοσύνης σε κλίμακα θα γίνεται όλο και πιο σημαντική. Η επίτευξη αυτής της απαιτούμενης κλίμακας θα περιοριστεί από την απόδοση, το κόστος και τη διαθεσιμότητα, επομένως οι οργανισμοί θα αναζητήσουν εναλλακτικές λύσεις για τις GPU καθώς εισέρχονται στην επόμενη φάση. Οι CPU, και ιδιαίτερα οι επεξεργαστές χαμηλής κατανάλωσης, υψηλής απόδοσης όπως το Ampere, θα γίνουν μια ολοένα και πιο ελκυστική επιλογή δεδομένης της ικανότητάς τους να επιτρέπουν πιο αποτελεσματική και οικονομικά αποδοτική εκτέλεση μοντέλων συμπερασμάτων AI. Οι GPU θα εξακολουθούν να είναι σημαντικές για ορισμένες πτυχές της τεχνητής νοημοσύνης, αλλά αναμένουμε να δούμε τη διαφημιστική εκστρατεία να αρχίζει να καταλαγιάζει.
Δεύτερον, η βιωσιμότητα και η ενεργειακή απόδοση θα γίνουν ακόμη πιο σημαντικές το επόμενο έτος στο πλαίσιο της τεχνητής νοημοσύνης. Σήμερα, τα κέντρα δεδομένων συχνά αγωνίζονται να καλύψουν τις ενεργειακές τους ανάγκες. Η αυξημένη χρήση τεχνητής νοημοσύνης θα οδηγήσει σε ακόμη μεγαλύτερη ζήτηση για υπολογιστική ισχύ το 2024 και για ορισμένους φόρτους εργασίας τεχνητής νοημοσύνης, που μπορεί να απαιτούν έως και 20 φορές περισσότερη ισχύ. Εξαιτίας αυτού, η βιωσιμότητα και η αποτελεσματικότητα θα γίνουν προκλήσεις για την επέκταση. Οι φορείς εκμετάλλευσης κέντρων δεδομένων θα δώσουν μεγάλη προτεραιότητα στην αποτελεσματικότητα το νέο έτος για να αποφύγουν να θέσουν σε κίνδυνο την ανάπτυξη.
Πώς αντιμετωπίζει η Ampere αυτή τη νέα ευκαιρία στην αγορά τεχνητής νοημοσύνης με τα προϊόντα της;
Για πολλές εφαρμογές τεχνητής νοημοσύνης, οι GPU είναι υπολογιστικές υπερβολές, καταναλώνοντας πολύ περισσότερη ενέργεια και χρήματα από όσα χρειάζονται. Αυτό ισχύει ιδιαίτερα για τα περισσότερα συμπεράσματα, ειδικά όταν εκτελείτε φόρτους εργασίας AI σε συνδυασμό με άλλους φόρτους εργασίας, όπως βάσεις δεδομένων ή υπηρεσίες web. Σε αυτές τις περιπτώσεις, η αντικατάσταση της GPU με μια CPU εξοικονομεί ενέργεια, χώρο και κόστος.
Βλέπουμε ήδη αυτό να ζωντανεύει για πραγματικούς φόρτους εργασίας και το όφελος από τη χρήση επεξεργαστών Ampere είναι ισχυρό. Για παράδειγμα, εάν εκτελείτε το δημοφιλές μοντέλο παραγωγής τεχνητής νοημοσύνης Whisper στον 128-πύρηνο επεξεργαστή Altra έναντι της κάρτας GPU A10 της Nvidia, καταναλώνουμε 3,6 φορές λιγότερη ενέργεια ανά συμπέρασμα. Σε σύγκριση με τις κάρτες Nvidia Tesla T4, καταναλώνουμε 5,6 φορές λιγότερο.
Εξαιτίας αυτού, παρατηρούμε μια σημαντική αύξηση στη ζήτηση για επεξεργαστές Ampere για εξαγωγή συμπερασμάτων τεχνητής νοημοσύνης και αναμένουμε ότι αυτό θα γίνει μια τεράστια αγορά για τα προϊόντα μας. Μόλις πριν από λίγες εβδομάδες, η Scaleway – ένας από τους κορυφαίους παρόχους cloud στην Ευρώπη – ανακοίνωσε την επερχόμενη γενική διαθεσιμότητα νέων περιπτώσεων συμπερασμάτων τεχνητής νοημοσύνης που υποστηρίζονται από την Ampere. Επιπλέον, κατά τους τελευταίους έξι μήνες, έχουμε δει επταπλάσια αύξηση χρήσης στη βιβλιοθήκη λογισμικού AI. Όλα αυτά μιλούν για την αυξανόμενη υιοθέτηση των προϊόντων μας ως εναλλακτική λύση υψηλής απόδοσης και χαμηλής ισχύος για εξαγωγή συμπερασμάτων AI.
VIA:
TechRadar.com/

