νέα

τελείωσαν οι καλές μέρες των gpu της nvidia;

2024-10-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

θα τελειώσει το "gpu festival" της nvidia;

από την κυκλοφορία του chatgpt από την open ai στις ηνωμένες πολιτείες στις 30 νοεμβρίου 2022, η γενετική τεχνητή νοημοσύνη (τεχνητή νοημοσύνη) έχει γίνει μια μεγάλη τρέλα και οι gpu της nvidia έχουν γίνει δημοφιλείς ως ημιαγωγοί ai. ωστόσο, στην παραγωγή των gpu, υπάρχουν δύο σημεία συμφόρησης: η διαδικασία μεσαίου εύρους της tsmc και η μνήμη υψηλού εύρους ζώνης (hbm) στοιβαγμένες με dram, που οδηγούν σε παγκόσμια έλλειψη gpu tsmc;»

μεταξύ αυτών των gpu, το "h100" είχε ιδιαίτερα υψηλή ζήτηση, με την τιμή του να εκτοξεύεται στα 40.000 $, πυροδοτώντας το λεγόμενο "φεστιβάλ gpu" της nvidia.

υπό αυτές τις συνθήκες, η tsmc διπλασίασε την παραγωγική της ικανότητα παρεμβολής ενδιάμεσης διαδικασίας και οι κατασκευαστές dram όπως η sk hynix αύξησαν την παραγωγή hbm, με αποτέλεσμα ο χρόνος παράδοσης "h100" να μειωθεί από 52 εβδομάδες σε 20 εβδομάδες.

λοιπόν, θα τελειώσει το "gpu festival" της nvidia;

έτσι, σε αυτό το άρθρο, θα συζητήσουμε εάν η "ημέρα gpu" της nvidia πλησιάζει στο τέλος της. ας μιλήσουμε πρώτα για το συμπέρασμα αναμένεται ότι ακόμη και το 2024, θα αποσταλεί μόνο το 3,9% των διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας (ο ορισμός θα εξηγηθεί αργότερα) που απαιτούνται για την ανάπτυξη και λειτουργία τεχνητής νοημοσύνης σε επίπεδο chatgpt. επομένως, φαίνεται ότι οι ανάγκες των παρόχων υπηρεσιών cloud (csp) όπως η google, η amazon και η microsoft δεν μπορούν να καλυφθούν καθόλου. εν ολίγοις, μέχρι στιγμής, το "gpu festival" της nvidia είναι μόνο η αρχή και έρχεται μια ολοκληρωμένη έκρηξη τεχνητής νοημοσύνης.

στη συνέχεια, ας εξετάσουμε εν συντομία τα δύο σημαντικά σημεία συμφόρησης της nvidia gpu.

δύο σημεία συμφόρησης nvidia gpu

στην παραγωγή των gpu της nvidia, το χυτήριο tsmc είναι υπεύθυνο για όλες τις μπροστινές, μεσαίες και πίσω διεργασίες. εδώ, η ενδιάμεση διαδικασία αναφέρεται στη διαδικασία παραγωγής gpu, cpu, hbm και άλλων τσιπ χωριστά και τοποθέτησής τους σε ένα τετράγωνο υπόστρωμα κομμένο από μια γκοφρέτα σιλικόνης 12 ιντσών. αυτό το υπόστρωμα ονομάζεται παρεμβολή πυριτίου (εικόνα 1).

εικόνα 1 ενδιάμεσες διεργασίες που αναδύονται από 2.5d σε 3d, όπως η gpu nvidia (πηγή: tadashi kamewada)

επιπλέον, το πακέτο nvidia gpu που αναπτύχθηκε από την tsmc ονομάζεται cowos (chip on wafer on substrate), αλλά τα δύο σημεία συμφόρησης είναι η χωρητικότητα interposer πυριτίου και το hbm (εικόνα 2). η κατάσταση έχει ως εξής.

εικόνα 2 δομή cowos και δύο σημεία συμφόρησης στη gpu nvidia (πηγή: wikichip)

το cowos αναπτύχθηκε το 2011, αλλά από τότε, καθώς η απόδοση της gpu έχει βελτιωθεί, το μέγεθος των τσιπ gpu συνέχισε να αυξάνεται και ο αριθμός των hbm που είναι εγκατεστημένοι στη gpu έχει επίσης αυξηθεί (εικόνα 3). ως αποτέλεσμα, οι παρεμβολείς πυριτίου μεγαλώνουν κάθε χρόνο, ενώ ο αριθμός των διαθέσιμων παρεμβολών σε ένα μεμονωμένο γκοφρέτα μειώνεται αντιστρόφως.

σχήμα 3 η περιοχή interposer και ο αριθμός hbm αυξάνονται με κάθε γενιά (πηγή: kc yee (tsmc))

επιπλέον, ο αριθμός των εγκατεστημένων hbm στη gpu αυξάνεται και ο αριθμός των τσιπ dram που στοιβάζονται μέσα στο hbm αυξάνεται επίσης. επιπλέον, η dram μικροποιείται κάθε δύο χρόνια και το πρότυπο hbm ενημερώνεται κάθε δύο χρόνια για βελτίωση της απόδοσης. ως εκ τούτου, το hbm αιχμής είναι σε έλλειψη.

σύμφωνα με αυτό το σενάριο, η tsmc θα διπλασιάσει την ικανότητα παραγωγής παρεμβολέων πυριτίου από 15.000 γκοφρέτες το μήνα γύρω στο καλοκαίρι του 2023 σε περισσότερες από 30.000 γκοφρέτες ανά μήνα γύρω στο καλοκαίρι του τρέχοντος έτους. επιπλέον, η samsung electronics και η micron technology έχουν λάβει πιστοποίηση nvidia και άρχισαν να προμηθεύουν hbm αιχμής, στην οποία κυριαρχούσε προηγουμένως η sk hynix.

επηρεασμένος από τα παραπάνω, ο χρόνος παράδοσης του nvidia h100, που έχει τη μεγαλύτερη ζήτηση, έχει μειωθεί σημαντικά από 52 εβδομάδες σε 20 εβδομάδες. λοιπόν, πόσο έχουν αυξηθεί ως αποτέλεσμα οι αποστολές διακομιστών ai;

ορισμός δύο τύπων διακομιστών ai

σύμφωνα με το "global annual server shipments, 2023-2024" (servers report database, 2024) που κυκλοφόρησε από την digitimes research, υπάρχουν δύο τύποι διακομιστών ai:

τα συστήματα που είναι εξοπλισμένα με δύο ή περισσότερους επιταχυντές ai αλλά όχι με hbm ονομάζονται «καθολικοί διακομιστές ai».

τα συστήματα που είναι εξοπλισμένα με τουλάχιστον τέσσερις επιταχυντές τεχνητής νοημοσύνης που λειτουργούν με hbm ονομάζονται «διακομιστές τεχνητής νοημοσύνης υψηλής τεχνολογίας».

ο επιταχυντής τεχνητής νοημοσύνης εδώ αναφέρεται σε ειδικό υλικό που έχει σχεδιαστεί για την επιτάχυνση εφαρμογών τεχνητής νοημοσύνης, ειδικά των νευρωνικών δικτύων και της μηχανικής εκμάθησης χαρακτηριστικό παράδειγμα είναι η gpu της nvidia. επιπλέον, η ανάπτυξη και η λειτουργία της γενετικής τεχνητής νοημοσύνης σε επίπεδο chatgpt απαιτεί μεγάλο αριθμό διακομιστών τεχνητής νοημοσύνης υψηλών προδιαγραφών και όχι διακομιστών τεχνητής νοημοσύνης γενικής χρήσης.

λοιπόν, ποιοι είναι οι όγκοι αποστολών των γενικών διακομιστών τεχνητής νοημοσύνης και των διακομιστών τεχνητής νοημοσύνης υψηλής ποιότητας;

γενικός διακομιστής ai και αποστολές διακομιστών τεχνητής νοημοσύνης υψηλής ποιότητας

το σχήμα 4 δείχνει τις αποστολές γενικών διακομιστών τεχνητής νοημοσύνης και διακομιστών τεχνητής νοημοσύνης προηγμένης τεχνολογίας από το 2022 έως το 2023. οι γενικές αποστολές διακομιστών ai αναμένεται να είναι 344.000 μονάδες το 2022, 470.000 μονάδες το 2023 και 725.000 μονάδες το 2024.

εικόνα 4 γενικές αποστολές διακομιστή ai και διακομιστών τεχνητής νοημοσύνης υψηλής ποιότητας (2022-2024) (πηγή: digitimes research)

ταυτόχρονα, οι διακομιστές τεχνητής νοημοσύνης υψηλών προδιαγραφών που απαιτούνται για την ανάπτυξη και τη λειτουργία του generative ai σε επίπεδο chatgpt αναμένεται να στείλουν 34.000 μονάδες το 2022, 200.000 μονάδες το 2023 και 564.000 μονάδες το 2024.

λοιπόν, μπορούν οι αποστολές διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας να καλύψουν τις ανάγκες των csp των ηπα;

το σχήμα 5 δείχνει τους αριθμούς αποστολής διακομιστών, γενικών διακομιστών τεχνητής νοημοσύνης και διακομιστών τεχνητής νοημοσύνης προηγμένης τεχνολογίας. όταν σχεδίασα αυτό το διάγραμμα και το κοίταξα, έμεινα έκπληκτος και αναρωτήθηκα "είναι πόσοι διακομιστές τεχνητής νοημοσύνης υψηλών προδιαγραφών αποστέλλονται επειδή, κοιτάζοντας τους διακομιστές στο σύνολό τους, αν είναι διακομιστές τεχνητής νοημοσύνης γενικής χρήσης; εξακολουθεί να είναι ένας προηγμένος διακομιστής τεχνητής νοημοσύνης και οι αποστολές είναι πολύ μικρές.

εικόνα 5 αποστολές διακομιστών, γενικών διακομιστών τεχνητής νοημοσύνης και διακομιστών τεχνητής νοημοσύνης προηγμένης τεχνολογίας

πηγή: συγγραφέας με βάση το mic και το digitimes

απογοητεύτηκα ακόμη περισσότερο όταν εξέτασα πόσοι διακομιστές τεχνητής νοημοσύνης υψηλών προδιαγραφών θα χρειαζόντουσαν για την ανάπτυξη και την εκτέλεση της γενετικής τεχνητής νοημοσύνης σε επίπεδο chatgpt.

απαιτείται διακομιστής τεχνητής νοημοσύνης υψηλού επιπέδου για τη δημιουργία ai σε επίπεδο chatgpt

αναφέρεται ότι η ανάπτυξη και η λειτουργία του chatgpt απαιτεί 30.000 διακομιστές τεχνητής νοημοσύνης υψηλής τεχνολογίας nvidia dgx h100 (εικόνα 6). όταν είδα αυτόν τον αριθμό των τριάντα χιλιάδων μονάδων, ένιωσα ζάλη.

εικόνα 6 πόσοι διακομιστές τεχνητής νοημοσύνης υψηλής τεχνολογίας χρειάζονται για την εκτέλεση του chatgpt; (πηγή: ιστοσελίδα hpc)

παρεμπιπτόντως, το "nvidia dgx h100" είναι εξοπλισμένο με οκτώ τσιπ "h100" και η τιμή κάθε τσιπ έχει εκτιναχθεί στα 40.000 δολάρια, ανεβάζοντας τη συνολική τιμή του συστήματος στα 460.000 δολάρια. με άλλα λόγια, η δημιουργία τεχνητής νοημοσύνης σε επίπεδο chatgpt απαιτεί επένδυση 30.000 μονάδων x 460.000 $ = 13,8 δισεκατομμύρια δολάρια (περίπου 2 τρισεκατομμύρια γιεν με βάση το 1 $ = 145 γιεν!).

νομίζω ότι ο κόσμος είναι γεμάτος από παραγωγικά συστήματα τεχνητής νοημοσύνης, αλλά πόσα τεχνητή νοημοσύνης που μοιάζουν με chatgpt έχουν δημιουργηθεί στην πραγματικότητα (ή θα δημιουργηθούν); (εικόνα 7)

εικόνα 7 αποστολές διακομιστών, αποστολές διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας και ο αριθμός των συστημάτων τεχνητής νοημοσύνης που δημιουργούνται σε επίπεδο chatgpt (πηγή: mic και digitimes)

δεδομένου ότι ο όγκος αποστολής διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας το 2022 θα είναι 34.000 μονάδες, μπορεί να κατασκευαστεί μόνο ένα σύστημα ai επιπέδου chatgpt (αυτό είναι το chatgpt). το επόμενο έτος, το 2023, οι αποστολές διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας θα φτάσουν τις 200.000 μονάδες, επομένως μπορούν να κατασκευαστούν 6 έως 7 συστήματα τεχνητής νοημοσύνης επιπέδου chatgpt. εφόσον αναμένεται να αποσταλούν 564.000 διακομιστές τεχνητής νοημοσύνης υψηλής τεχνολογίας το 2024, θα είναι δυνατή η κατασκευή 18 έως 19 συστημάτων τεχνητής νοημοσύνης επιπέδου chatgpt.

ωστόσο, η παραπάνω εκτίμηση προϋποθέτει ότι η τεχνητή νοημοσύνη επιπέδου chatgpt μπορεί να κατασκευαστεί με 30.000 διακομιστές τεχνητής νοημοσύνης υψηλής τεχνολογίας "nvidia dgx h100".ωστόσο, καθώς μια γενιά τεχνητής νοημοσύνης είναι πιθανό να γίνει πιο περίπλοκη, σε αυτήν την περίπτωση μπορεί να χρειαστούν περισσότερα από 30.000 nvidia dgx h100. λαμβάνοντας υπόψη όλα τα πράγματα, οι πάροχοι υπηρεσιών επικοινωνιών των ηπα είναι απίθανο να είναι ικανοποιημένοι με τις τρέχουσες αποστολές διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας.

τώρα, ας δούμε πόσους διακομιστές τεχνητής νοημοσύνης υψηλών προδιαγραφών έχει κάθε τελικός χρήστης (όπως ένας csp στις ηνωμένες πολιτείες).

αριθμός διακομιστών υψηλής τεχνολογίας ai για τελικούς χρήστες

το σχήμα 8 δείχνει τον αριθμό των διακομιστών τεχνητής νοημοσύνης υψηλής ποιότητας ανά τελικούς χρήστες. το 2023, η microsoft, η οποία κατέχει το openai, έχει τον μεγαλύτερο αριθμό διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας με 63.000 μονάδες, αλλά μέχρι το 2024, η google θα ξεπεράσει τη microsoft και θα έχει τον μεγαλύτερο αριθμό διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας.

εικόνα 8 διακομιστές τεχνητής νοημοσύνης προηγμένης τεχνολογίας ανά τελικό χρήστη (2023-2024) (πηγή: digitimes research)

η πρώτη πεντάδα το 2024 είναι η google, στην πρώτη θέση με 162.000 μονάδες (5 συστήματα), η microsoft στη δεύτερη θέση με 90.000 μονάδες (3 συστήματα), η super micro στην τρίτη θέση με 68.000 μονάδες (2 συστήματα) και η amazon (67.000 μονάδες) στην τέταρτη θέση. 2 συστήματα), ακολουθούμενο από το meta στην πέμπτη θέση με 46.000 μονάδες (1 σύστημα) (ο αριθμός σε παρενθέσεις είναι ο αριθμός των συστημάτων που μπορεί να δημιουργήσει το ai της γενιάς της κατηγορίας chatgpt). μπορεί να φανεί ότι οι πέντε κορυφαίες εταιρείες παραγωγής ηλιακής θερμικής ενέργειας στις ηνωμένες πολιτείες μονοπωλούν περίπου το 80% του μεριδίου.

στη συνέχεια, ας δούμε τις αποστολές διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας των επιταχυντών τεχνητής νοημοσύνης (εικόνα 9), όπως αναμενόταν, οι gpu της nvidia είναι οι πιο χρησιμοποιούμενες για επιταχυντές τεχνητής νοημοσύνης, φτάνοντας τις 336.000 μονάδες το 2024. ωστόσο, παραδόξως, η δεύτερη πιο δημοφιλής εταιρεία δεν είναι η amd, αλλά η google.

εικόνα 9 διακομιστές τεχνητής νοημοσύνης υψηλών προδιαγραφών από επιταχυντή ai (2023-2024) (πηγή: digitimes research)

η google ανέπτυξε τη δική της μονάδα επεξεργασίας τανυστών (tpu) ως επιταχυντής τεχνητής νοημοσύνης. μέχρι το 2024, ο αριθμός των διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας που θα είναι εξοπλισμένοι με αυτήν την tpu θα φτάσει τους 138.000. εδώ, από το σχήμα 8 γνωρίζουμε ότι η google θα έχει 162.000 διακομιστές τεχνητής νοημοσύνης υψηλής τεχνολογίας έως το 2024. ως εκ τούτου, 138.000 μονάδες αναμένεται να είναι εξοπλισμένες με τη δική τους tpu της google και οι υπόλοιπες 24.000 μονάδες είναι εξοπλισμένες με gpu της nvidia. με άλλα λόγια, για τη nvidia, η google είναι ταυτόχρονα πελάτης και τρομερός εχθρός.

επιπλέον, αν δούμε τις αποστολές το 2024, η amd, που βρίσκεται στην τρίτη θέση, έχει 45.000 μονάδες και ακολουθεί η amazon, η οποία βρίσκεται στην τέταρτη θέση, με 40.000 μονάδες. η amazon αναπτύσσει επίσης το aws trainium ως επιταχυντή τεχνητής νοημοσύνης. αν περιμένει περισσότερο, η amd μπορεί να ξεπεραστεί από την amazon.

συνοψίζοντας, η nvidia έχει επί του παρόντος τις μεγαλύτερες αποστολές επιταχυντών τεχνητής νοημοσύνης, αλλά η google και η amazon γίνονται ισχυροί ανταγωνιστές της. ο ανταγωνιστής της nvidia δεν είναι ο κατασκευαστής επεξεργαστών amd (σίγουρα όχι η υπό εξαφάνιση intel), αλλά οι csp των ηπα google και amazon.

έρχεται μια πλήρους κλίμακας παραγωγική έκρηξη ai

ας συνοψίσουμε τα πάντα μέχρι τώρα. σύμφωνα με μια έκθεση της digitimes research, οι αποστολές διακομιστών τεχνητής νοημοσύνης υψηλού επιπέδου που είναι ικανοί να αναπτύξουν και να εκτελούν γενετική τεχνητή νοημοσύνη σε επίπεδο chatgpt αναμένεται να αντιπροσωπεύουν μόνο το 3,9% όλων των διακομιστών έως το 2024. πιστεύεται ότι αυτός ο όγκος αποστολής απλά δεν μπορεί να καλύψει τις ανάγκες των csp.

με άλλα λόγια, το "gpu festival" της nvidia από το 2023 έως το 2024 είναι μόνο η αρχή. ως αποτέλεσμα, είναι πιθανό να έρθει μια πλήρης έκρηξη της τεχνητής νοημοσύνης. ας δείξουμε τα βασικά παρακάτω.

το σχήμα 10 δείχνει την αγορά ημιαγωγών ανά εφαρμογή και τις μελλοντικές της προβλέψεις που δημοσιεύονται από την ένωση βιομηχανίας ημιαγωγών (sia). σύμφωνα με τις προβλέψεις της sia, η παγκόσμια αγορά ημιαγωγών θα ξεπεράσει το 1 τρισεκατομμύριο δολάρια ηπα το 2030.

εικόνα 10 πρόβλεψη αποστολής ημιαγωγών ανά εφαρμογή (πηγή: sia blog)

μέχρι το 2030, οι μεγαλύτερες αγορές θα είναι η πληροφορική και η αποθήκευση δεδομένων. αυτό περιλαμβάνει υπολογιστές και διακομιστές (και φυσικά διακομιστές τεχνητής νοημοσύνης υψηλής ποιότητας), αλλά επειδή οι αποστολές υπολογιστών είναι απίθανο να αυξηθούν σημαντικά, οι διακομιστές πιθανότατα θα αποτελούν την πλειοψηφία.

οι ενσύρματες επικοινωνίες αναφέρονται σε ημιαγωγούς που χρησιμοποιούνται σε κέντρα δεδομένων. αυτό σημαίνει ότι μέχρι το 2030, οι υπολογιστές και η αποθήκευση δεδομένων (330 δισεκατομμύρια δολάρια) + οι ενσύρματες επικοινωνίες (60 δισεκατομμύρια δολάρια) = συνολικά 390 δισεκατομμύρια δολάρια θα γίνουν ημιαγωγοί για κέντρα δεδομένων (συμπεριλαμβανομένων των υπολογιστών), καθιστώντας τη μεγαλύτερη αγορά στον κόσμο.

ένα άλλο πράγμα που πρέπει να παρακολουθήσετε είναι η αγορά των data center και οι προοπτικές της,όπως φαίνεται στο σχήμα 11. μετά την κυκλοφορία του chatgpt το 2022, η αγορά των κέντρων δεδομένων αναμένεται να αναπτύσσεται σταθερά. τα κέντρα δεδομένων αποτελούνται από τρία στοιχεία: υποδομή δικτύου, διακομιστές και χώρο αποθήκευσης και οι διακομιστές και η αποθήκευση αναμένεται να διπλασιαστούν περίπου από το 2023 έως το 2029.

σχήμα 11 προοπτικές αγοράς του κέντρου δεδομένων (η ολοκληρωμένη έκρηξη της τεχνητής νοημοσύνης δεν έχει φτάσει ακόμη) (πηγή: συγγραφέας βάσει δεδομένων statista market insights)

με αυτόν τον τρόπο, οι ημιαγωγοί διακομιστών (συμπεριλαμβανομένων των διακομιστών τεχνητής νοημοσύνης υψηλής τεχνολογίας) θα καταλάβουν το μεγαλύτερο μερίδιο της παγκόσμιας αγοράς, ενώ η αγορά των κέντρων δεδομένων θα επεκταθεί επίσης.

επαναλάβετε μια τελευταία φορά.μέχρι στιγμής, το "gpu festival" της nvidia είναι απλώς μια εκδήλωση πριν από τις διακοπές. έρχεται μια πλήρης έκρηξη παραγωγής ai.