Το CDNA 3 & το Zen 4 έρχονται μαζί σε ένα προηγμένο θαύμα συσκευασίας
Το AMD
Instinct
MI300X έχει σχεδιαστεί για φόρτους εργασίας AI με επιτάχυνση GPU, ενώ το MI300A αντιμετωπίζει το HPC με το πιο τεχνικά προηγμένο πακέτο APU
Στις 6 Δεκεμβρίου, η AMD θα φιλοξενήσει την κεντρική ομιλία της «Advancing AI», όπου μία από τις κύριες ατζέντες είναι η πλήρης
αποκάλυψη
της οικογένειας επιταχυντών επόμενης γενιάς Instinct με την κωδική ονομασία MI300. Αυτή η νέα οικογένεια με επιτάχυνση GPU και CPU θα είναι το κύριο προϊόν του τμήματος AI, το οποίο είναι το Νο. 1 της AMD και η πιο σημαντική στρατηγική προτεραιότητα αυτή τη στιγμή, καθώς τελικά κυκλοφορεί ένα προϊόν που όχι μόνο είναι προηγμένο, αλλά έχει σχεδιαστεί για να ανταποκρίνεται στις κρίσιμες Απαίτηση AI στον κλάδο. Η κατηγορία επιταχυντών τεχνητής νοημοσύνης MI300 θα είναι μια άλλη μονάδα παρ
αγωγή
ς ισχύος chiplet, που θα χρησιμοποιεί προηγμένες τεχνολογίες συσκευασίας από την TSMC, οπότε ας δούμε τι υπάρχει κάτω από την κουκούλα αυτών των τεράτων της τεχνητής νοημοσύνης.
AMD Instinct MI300X – Προκαλώντας την υπεροχή της τεχνητής νοημοσύνης της NVIDIA με CDNA 3 και τεράστια μνήμη
Το AMD Instinct MI300X είναι σίγουρα το τσιπ που θα τονιστεί περισσότερο, καθώς στοχεύει ξεκάθαρα στους επιταχυντές Hopper της NVIDIA και στους επιταχυντές Gaudi της Intel στο τμήμα AI. Αυτό το τσιπ έχει σχεδιαστεί αποκλειστικά στην αρχιτεκτονική CDNA 3 και υπάρχουν πολλά πράγματα που συμβαίνουν. Το τσιπ πρόκειται να φιλοξενήσει ένα μείγμα 5nm και 6nm IP, όλα συνδυαζόμενα για να προσφέρουν έως και 153 δισεκατομμύρια τρανζίστορ (MI300X).
Ξεκινώντας με το σχέδιο, ο κύριος παρεμβολέας τοποθετείται με μια παθητική μήτρα που στεγάζει το στρώμα διασύνδεσης χρησιμοποιώντας μια λύση Infinity Fabric επόμενης γενιάς. Το interposer περιλαμβάνει συνολικά 28 μήτρες που περιλαμβάνουν οκτώ πακέτα HBM3, 16 εικονικές μήτρες μεταξύ των πακέτων HBM και τέσσερις ενεργές μήτρες και κάθε μία από αυτές τις ενεργές μήτρες λαμβάνει δύο υπολογιστικές μήτρες.
Η μνήμη είναι ένας άλλος τομέας όπου θα δείτε μια τεράστια αναβάθμιση με το MI300X να διαθέτει 50% περισσότερη χωρητικότητα HBM3 από τον προκάτοχό του, το MI250X (128 GB). Για να πετύχει μια δεξαμενή μνήμης 192 GB, η AMD εξοπλίζει το MI300X με 8 στοίβες HBM3 και κάθε στοίβα είναι 12-Hi, ενώ ενσωματώνει IC 16 Gb που μας δίνουν χωρητικότητα 2 GB ανά IC ή 24 GB ανά στοίβα.
Η μνήμη θα προσφέρει έως και 5,2 TB/s εύρους ζώνης και 896 GB/s Infinity Fabric Bandwidth. Για σύγκριση, ο επερχόμενος επιταχυντής AI H200 της NVIDIA προσφέρει χωρητικότητα 141 GB, ενώ ο Gaudi 3 από την Intel θα προσφέρει χωρητικότητα 144 GB. Οι μεγάλες δεξαμενές μνήμης έχουν μεγάλη σημασία στα LLM, τα οποία είναι ως επί το πλείστον δεσμευμένα με μνήμη και η AMD μπορεί σίγουρα να δείξει την ικανότητά της στην τεχνητή νοημοσύνη, πρωτοστατώντας στο τμήμα μνήμης. Για συγκρίσεις:
-
Instinct MI300X –
192 GB HBM3 -
Γκαουντί 3 –
144 GB HBM3 -
H200 –
141 GB HBM3e -
MI300A –
128 GB HBM3 -
MI250X –
128 GB HBM2e -
H100 –
96 GB HBM3 -
Γκαουντί 2 –
96 GB HBM2e
Όσον αφορά την κατανάλωση ενέργειας, το AMD Instinct MI300X βαθμολογείται στα 750W που είναι 50% αύξηση σε σχέση με τα 500W του Instinct MI250X και 50W περισσότερο από το NVIDIA H200.
AMD Instinct MI300A – APU με πυκνή συσκευασία Exascale τώρα μια πραγματικότητα
Περιμέναμε χρόνια την AMD να υλοποιήσει επιτέλους την υπόσχεση για μια APU κλάσης Exascale και η μέρα πλησιάζει καθώς πλησιάζουμε στην κυκλοφορία του Instinct MI300A. Η συσκευασία του MI300A μοιάζει πολύ με το MI300X, εκτός από το ότι χρησιμοποιεί χωρητικότητες μνήμης βελτιστοποιημένες για TCO και πυρήνες Zen 4.
Ένα από τα ενεργά καλούπια έχει δύο CDNA 3 GCD κομμένα και αντικαταστάθηκαν με τρία CCD Zen 4 που προσφέρουν τη δική τους ξεχωριστή δεξαμενή μνήμης cache και IP πυρήνα. Λαμβάνετε 8 πυρήνες και 16 νήματα ανά CCD, έτσι ώστε να είναι συνολικά 24 πυρήνες και 48 νήματα στο ενεργό καλούπι. Υπάρχει επίσης 24 MB προσωρινής μνήμης L2 (1 MB ανά πυρήνα) και μια ξεχωριστή δεξαμενή μνήμης cache (32 MB ανά CCD). Θα πρέπει να θυμόμαστε ότι τα CDNA 3 GCD έχουν επίσης ξεχωριστή τη μνήμη cache L2.
Στρογγυλεύοντας ορισμένα από τα επισημασμένα χαρακτηριστικά των επιταχυντών AMD Instinct MI300, έχουμε:
- Πρώτο ενσωματωμένο πακέτο CPU+GPU
- Στοχεύοντας Exascale Supercomputer Market
- AMD MI300A (ενσωματωμένη CPU + GPU)
- AMD MI300X (Μόνο GPU)
- 153 δισεκατομμύρια τρανζίστορ
- Έως 24 Zen 4 πυρήνες
- Αρχιτεκτονική CDNA 3 GPU
- Έως 192 GB Μνήμη HBM3
- Έως 8 Chiplets + 8 Στοίβες μνήμης (διαδικασία 5nm + 6nm)
Συνδυάζοντας όλα αυτά, η AMD θα συνεργαστεί με τους μηχανισμούς οικοσυστήματος και τους συνεργάτες της για να προσφέρει επιταχυντές AI MI300 σε διαμορφώσεις 8 κατευθύνσεων που διαθέτουν σχέδια SXM που συνδέονται με την κύρια πλακέτα με υποδοχές mezzanine. Θα είναι ενδιαφέρον να δούμε τι είδους διαμορφώσεις θα προσφέρονται μέσα σε αυτές και ενώ οι πλακέτες SXM είναι δεδομένες, μπορούμε επίσης να περιμένουμε μερικές παραλλαγές στους παράγοντες μορφής PCI-E.
Προς το παρόν, η AMD θα πρέπει να γνωρίζει ότι οι ανταγωνιστές της προχωρούν επίσης στην τρέλα της τεχνητής νοημοσύνης, με τη NVIDIA να έχει ήδη πειράξει μερικά τεράστια νούμερα για τις GPU Blackwell του 2024 και την Intel να προετοιμάζει τις GPU της Guadi 3 και
Falcon
Shores για κυκλοφορία και τα επόμενα χρόνια. Ένα πράγμα είναι σίγουρο αυτή τη στιγμή, οι πελάτες τεχνητής νοημοσύνης θα καταβροχθίσουν σχεδόν οτιδήποτε μπορούν να πάρουν και όλοι θα το εκμεταλλευτούν. Αλλά η AMD έχει μια πολύ τρομερή λύση που δεν στοχεύει απλώς να είναι μια εναλλακτική λύση για τη NVIDIA, αλλά ηγέτης στον τομέα της τεχνητής νοημοσύνης και ελπίζουμε ότι το MI300 μπορεί να τη βοηθήσει να επιτύχει αυτή την επιτυχία.
AMD Radeon
Instinct Accelerators
| Όνομα επιταχυντή | AMD Instinct MI400 | AMD Instinct MI300 | AMD Instinct MI250X | AMD Instinct MI250 | AMD Instinct MI210 | AMD Instinct MI100 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI6 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Αρχιτεκτονική CPU | Zen 5 (APU Exascale) | Zen 4 (APU Exascale) | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A |
| Αρχιτεκτονική GPU | CDNA 4 | Aqua Vanjaram (CDNA 3) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Arcturus (CDNA 1) | Vega 20 | Vega 20 | Vega 10 | Φίτζι XT | Polaris 10 |
| Κόμβος διεργασίας GPU | 4 nm | 5nm+6nm | 6 nm | 6 nm | 6 nm | 7nm FinFET | 7nm FinFET | 7nm FinFET | 14nm FinFET | 28 nm | 14nm FinFET |
| GPU Chiplets | TBD | 8 (MCM) |
2 (MCM) 1 (Per Die) |
2 (MCM) 1 (Per Die) |
2 (MCM) 1 (Per Die) |
1 (Μονολιθικό) | 1 (Μονολιθικό) | 1 (Μονολιθικό) | 1 (Μονολιθικό) | 1 (Μονολιθικό) | 1 (Μονολιθικό) |
| Πυρήνες GPU | TBD | Έως 19.456 | 14.080 | 13.312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
| Ταχύτητα ρολογιού GPU | TBD | TBA | 1700 MHz | 1700 MHz | 1700 MHz | 1500 MHz | 1800 MHz | 1725 MHz | 1500 MHz | 1000 MHz | 1237 MHz |
| FP16 Υπολογισμός | TBD | TBA | 383 ΚΟΡΥΦΑΙΕΣ | 362 ΤΟΠ | 181 ΤΟΠ | 185 TFLOP | 29,5 TFLOP | 26,5 TFLOP | 24,6 TFLOP | 8,2 TFLOP | 5,7 TFLOP |
| FP32 Υπολογισμός | TBD | TBA | 95,7 TFLOP | 90,5 TFLOP | 45,3 TFLOP | 23,1 TFLOP | 14,7 TFLOP | 13,3 TFLOP | 12,3 TFLOP | 8,2 TFLOP | 5,7 TFLOP |
| FP64 Υπολογισμός | TBD | TBA | 47,9 TFLOP | 45,3 TFLOP | 22,6 TFLOP | 11,5 TFLOP | 7,4 TFLOP | 6,6 TFLOP | 768 GFLOP | 512 GFLOP | 384 GFLOP |
| VRAM | TBD | 192 GB HBM3 | 128 GB HBM2e | 128 GB HBM2e | 64 GB HBM2e | 32 GB HBM2 | 32 GB HBM2 | 16 GB HBM2 | 16 GB HBM2 | 4 GB HBM1 | 16 GB GDDR5 |
| Ρολόι μνήμης | TBD | 5,2 Gbps | 3,2 Gbps | 3,2 Gbps | 3,2 Gbps | 1200 MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750 MHz |
| Λεωφορείο μνήμης | TBD | 8192-bit | 8192-bit | 8192-bit | 4096-bit | Δίαυλος 4096-bit | Δίαυλος 4096-bit | Δίαυλος 4096-bit | Δίαυλος 2048-bit | Δίαυλος 4096-bit | Δίαυλος 256 bit |
| Εύρος ζώνης μνήμης | TBD | 5,2 TB/s | 3,2 TB/s | 3,2 TB/s | 1,6 TB/s | 1,23 TB/s | 1 TB/s | 1 TB/s | 484 GB/s | 512 GB/s | 224 GB/s |
| Form Factor | TBD | ΕΙΜΑΙ | ΕΙΜΑΙ | ΕΙΜΑΙ | Κάρτα διπλής υποδοχής | Διπλή υποδοχή, σε όλο το μήκος | Διπλή υποδοχή, σε όλο το μήκος | Διπλή υποδοχή, σε όλο το μήκος | Διπλή υποδοχή, σε όλο το μήκος | Διπλή υποδοχή, μισό μήκος | Ενιαία υποδοχή, σε όλο το μήκος |
| Ψύξη | TBD | Παθητική Ψύξη | Παθητική Ψύξη | Παθητική Ψύξη | Παθητική Ψύξη | Παθητική Ψύξη | Παθητική Ψύξη | Παθητική Ψύξη | Παθητική Ψύξη | Παθητική Ψύξη | Παθητική Ψύξη |
| TDP (Μέγ.) | TBD | 750 W | 560 W | 500W | 300W | 300W | 300W | 300W | 300W | 175 W | 150W |
VIA:
wccftech.com

