Νέα

Η Nvidia στο πεδίο των βομβαρδισμών «εξερράγη» μόνη της;

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Ο συγγραφέας είναι η Leslie Wu, πρώην εμπειρογνώμονας κατασκευής εργοστασίων TSMC (δημόσιος λογαριασμός: Zihao Tanxin)

Συντάκτης Su Yang

Η NVIDIA, η οποία βομβαρδίζει συχνά την αγορά, δεν κατάφερε να διατηρήσει την αγοραία αξία των 3 τρισεκατομμυρίων δολαρίων.

Στις 19 Ιουνίου, ώρα Πεκίνου, η χρηματιστηριακή αξία της Nvidia έφτασε τα 3,335 τρισεκατομμύρια δολάρια ΗΠΑ, ξεπερνώντας τη Microsoft και την Apple με μια πτώση και έγινε η νούμερο ένα στον κόσμο. Αφού βίωσε αυτή τη στιγμή, η αγοραία αξία της Nvidia άρχισε να μειώνεται Από το κλείσιμο των συναλλαγών στις 2 Αυγούστου, η αγοραία αξία της Nvidia συρρικνώθηκε κατά 26%.

Πριν από αυτό, ορισμένοι αναλυτές είχαν καλέσει τους επενδυτές να «πατήσουν φρένο». Η Daily Economic News επικαλέστηκε τον αναλυτή της επενδυτικής τράπεζας DA Davidson, Gil Luria, ότι η απόδοση ρεκόρ της Nvidia έφτασε τα 26 δισεκατομμύρια δολάρια, λόγω των δαπανών των κορυφαίων πελατών για τα προϊόντα GPU της. Πιστεύει ότι αυτή η τάση θα κλονιστεί στο μέλλον και η τιμή της μετοχής της Nvidia Μια διψήφια πτώση θα σημειωθεί εντός 18 μηνών.

Σύμφωνα με αναλυτές όπως ο Gil Luria,Οι κορυφαίοι πελάτες έκαναν δεύτερες σκέψεις και τα «λάθη» της Nvidia έδωσαν επίσης στους πελάτες μια ευκαιρία να αλλάξουν γνώμη και οι ανταγωνιστές τους να τους κόψουν. Βασικά ζητήματα όπως η εγκατάλειψη του B100 SKU, οι καθυστερήσεις αποστολής του B200 και η εκ νέου εξαγωγή

Κρίνοντας από όσα μάθαμε εσωτερικά στο TSMC,Η είδηση ​​ότι το τσιπ Blackwell της Nvidia επανακυκλοφορεί είναι πράγματι αλήθεια, αλλά αφορά κυρίως τα βασικά τσιπ της σειράς B100.Το πρόβλημα βρίσκεται στο υποκείμενο Τυπικό κελί (τυπικό κελί)——Είναι μια προσχεδιασμένη τυπική μονάδα κυκλώματος με συγκεκριμένες λειτουργίες και μεγέθη Εάν ο σχεδιασμός του τσιπ γίνει κατανοητός ως δομικά στοιχεία, η τυπική μονάδα είναι η μικρότερη μονάδα των δομικών στοιχείων——.Σε περιβάλλοντα υψηλής πίεσης μπορεί να προκύψουν μη φυσιολογικές συνθήκες εργασίας, τα προβλήματα έχουν ανακαλυφθεί μέχρι στιγμής και η μάσκα πρέπει να ανοίξει ξανά.

Ωστόσο, ο συνολικός χρόνος παραγωγής γκοφρέτας δεν μπορεί να μειωθεί για αποστολή μικρών παρτίδων Από την προσωπική μου εμπειρία, δεν είναι δύσκολο για την TSMC να ανακτήσει την πρόοδο.

01 Το ποσοστό απόδοσης που αναλαμβάνει την ευθύνη για τις καθυστερημένες αποστολές

Η εγκατάλειψη του B100 και η καθυστερημένη αποστολή του B200 και η εκ νέου σειρά αποτελούν μια μονόπλευρη κατανόηση του "ατυχήματος αναπήδησης" του τσιπ Blackwell, το οποίο σχετίζεται με την περίπλοκη ονομασία της Nvidia.

Η σειρά τσιπ Blackwell περιλαμβάνει δύο βασικά τσιπ, B100 και B102, αυτά τα SKU, συμπεριλαμβανομένου του B200GB200, χρησιμοποιούν λύσεις chiplet που βασίζονται στη σειρά B100 και το B200A βασίζεται στο B102.

Για να διευκολύνουμε την κατανόηση, έχουμε συντάξει έναν πίνακα για όλους. Μπορείτε να συγκρίνετε τις βασικές μάρκες B102 και B100, καθώς και οι αντίστοιχοι διακομιστές SKU για διαφορετικές εφαρμογές μπορούν επίσης να συνδυαστούν σε περισσότερα στυλ, όπως το HGX B200A / HGX. B200/ NVL36/ Το 72 είναι ακόμη και μια αερόψυκτη έκδοση του NVL8 ή του GB210A.

Η ονομασία των τσιπ Blackwell και των διαφόρων SKU προκαλεί σύγχυση για τους ξένους να την κατανοήσουν, κάτι που είναι κατανοητό, αλλά"Το ποσοστό απόδοσης του CoWoS είναι μόνο 66%, και μόνο 10 καλές μήτρες μπορούν να κοπούν από μία γκοφρέτα."

Μπορούμε να μιλήσουμε εν συντομία για την έννοια της «απόδοσης» από το μπροστινό και το πίσω στάδιο της κατασκευής γκοφρέτας.

Για τον μπροστινό δίσκο GPU, όπως η Apple, η Qualcomm και η AMD, η Nvidia χρησιμοποιεί τη διαδικασία N4P αυτή τη φορά, η οποία είναι πολύ ώριμη, επομένως δεν χρειάζεται να ανησυχείτε για το ποσοστό απόδοσης.

Η συσκευασία του back-end, ειδικά το τμήμα "oS" του CoWoS, δεν περιλαμβάνει μόνο το καλούπι GPU, αλλά και τη μνήμη HBM, και το κόστος των 8 HBM είναι πολύ υψηλό Εάν η μήτρα GPU αποτύχει, ολόκληρο το πακέτο θα γίνει χαμένο κομμάτι.Επομένως, είναι αδύνατο να προγραμματιστεί η παραγωγή εάν το ποσοστό απόδοσης είναι χαμηλότερο από 80%, διαφορετικά το κόστος θα μεγεθύνεται απείρως και το μικτό κέρδος δεν μπορεί να είναι εγγυημένο εάν το ποσοστό απόδοσης είναι 66%, η παραγωγή δεν θα προγραμματιστεί καθόλου.

Όσον αφορά την αντιμετώπιση του κινδύνου μη φυσιολογικής απόδοσης στη διαδικασία κατασκευής, ως εργοστάσιο Fabless, ούτε η NVIDIA ούτε η Apple μπορούν να στοιχηματίσουν όλα τα προϊόντα σε νέες λύσεις Αυτό Ο κίνδυνος είναι πολύ μεγάλος, επομένως κατά την υποβολή μιας παραγγελίας, πρέπει να υπάρχουν εναλλακτικές λύσεις ταυτόχρονα. Με άλλα λόγια, ακόμα κι αν υπάρχει πρόβλημα με την απόδοση του CoWoS-L, δεν θα επηρεάσει την αποστολή των τσιπ Blackwell.

Επιτρέψτε μου να σας δώσω ένα παράδειγμα, εάν η Apple θέλει να χρησιμοποιήσει τη νέα διαδικασία 2nm της TSMC για το τσιπ A18 της επόμενης χρονιάς, θα αναπτύξει σίγουρα μια λύση διαδικασίας N3P την ίδια στιγμή για να διασφαλίσει ότι "δεν θα χαθεί τίποτα". ίδιο.

Σύμφωνα με τα δεδομένα που λάβαμε, η Blackwell χρησιμοποιεί συσκευασία CoWoS-L και η τρέχουσα απόδοση είναι περίπου 90%. Και εξακολουθεί να ανεβαίνει, κάτι που είναι σύμφωνο με την ομάδα Nomura, η οποία έχει την πιο ενδελεχή έρευνα για το CoWoS στον κλάδο. Επιπλέον, η προσδοκία της TSMC για το ποσοστό απόδοσης του CoWoS-L στην αρχή του έτους ήταν 95%. νέα διαδικασία, ελάχιστα αποδεκτή.

Επομένως, το τρέχον ποσοστό απόδοσης του CoWoS-L δεν είναι πράγματι τόσο καλό όσο αναμενόταν, αλλάΤο μπροστινό καλούπι GPU πρέπει να επανασχεδιάσει τη μάσκα λόγω τυπικών προβλημάτων μονάδας, με αποτέλεσμα το τσιπ Blackwell να μην μπορεί να παραχθεί ομαλά, γεγονός που οδηγεί έμμεσα στον τερματισμό της παραγωγικής ικανότητας CoWoS-L στο back-end , υπάρχουν μεγάλες ανωμαλίες στο ποσοστό απόδοσης του CoWoS-L Είναι αντίθετο με τα γεγονότα και την κοινή λογική του κλάδου να υποστηρίζουμε ότι τα τσιπ Backwell δεν μπορούν να αποσταλούν ομαλά.

Στην πραγματικότητα, πριν από το βασικό πρόβλημα επαναπυριτίου της σειράς B100, η ​​Nvidia είχε ήδη κάνει προσαρμογές λόγω του προβλήματος του ποσοστού απόδοσης CoWoS-L να είναι μικρότερο από 95%. S Για τη συσκευασία, το αρχικό σχέδιο ήταν να μοιραστεί η πίεση της παραγωγικής ικανότητας του CoWoS-L και να διασφαλιστεί η παραγωγή περισσότερων τσιπ Blackwell το 2025. Τώρα αυτή η προσαρμογή μπορεί επίσης να βοηθήσει τη Nvidia να λύσει το πρόβλημα καθυστέρησης χρονοδιαγράμματος που προκαλείται από ζητήματα σχεδιασμού καλουπιών GPU και μπορεί Βοηθήστε επίσης να αυξηθούν οι συνολικές αποστολές τσιπ Blackwell το 2025.

02 Ποιος τσιμπάει τον «λαιμό» της Nvidia;

Υπήρξαν πολλές συζητήσεις στο παρελθόν ότι η NVIDIA έχει κολλήσει στο λαιμό της υπολογιστικής ισχύος, αλλά ο «λαιμός» της NVIDIA έχει κολλήσει από περισσότερες εταιρείες upstream όπως η HBM Memory.

Θα πρέπει να ειπωθεί ότι η παροχή μονάδων γρήγορης σύνδεσης HBM και υγρόψυκτου QCD είναι επί του παρόντος σχετικά περιορισμένη, αλλάΗ στενή προσφορά δεν θα καθυστερήσει τις αποστολές, αλλά το πολύ θα οδηγήσει σε μείωση των αποστολών, και η τεχνολογία αυτών των ανταλλακτικών που υπάρχουν σε αυτό το στάδιο εξακολουθεί να είναι εγγυημένη. Για παράδειγμα, η Samsung αποφάσισε να συμμετάσχει στο σύστημα προμηθευτών HBM της NVIDIA.

Αυτό που θα επηρεάσει πραγματικά την αποστολή των τσιπ Blackwell είναι η επακόλουθη παραγωγή διαφόρων διακομιστών.

Σύμφωνα με νέα από τη βιομηχανική αλυσίδα, όχι μόνο τα τσιπ μπαίνουν αυτή τη στιγμή στο στάδιο της παραγωγής, αλλά και εξαρτήματα πλακέτας, εξοπλισμός μεταγωγής, ράφια, λύσεις ψύξης κ.λπ.

Κατά την επέκταση από ένα ντουλάπι 8 καρτών σε ένα ντουλάπι 72 καρτών, πρέπει να ληφθούν υπόψη πολλά ζητήματα, συμπεριλαμβανομένης της σύγκλισης εύρους ζώνης δικτύου και των βέλτιστων συνθηκών εργασίας διαφόρων παράλληλων στρατηγικών (τμηματοποίηση δεδομένων μοντέλου, τμηματοποιημένοι υπολογισμοί, αντιγραφή και αναδιοργάνωση) σε ολόκληρο το ντουλάπι κλπ. Επιπλέον, καθώς υπάρχουν περισσότερες παλέτες, η πυκνότητα είναι υψηλότερη και πιο συμπαγής, πολύπλοκα ζητήματα όπως ο αριθμός των εσωτερικών καλωδίων, η εναλλαγή υψηλής ταχύτητας και η απαγωγή θερμότητας σημαίνουν ότι το ράφι πρέπει επίσης να επανασχεδιαστεί και θα πρέπει όλα να δοκιμαστούν τώρα.

Δεδομένου ότι ο διακομιστής NVL36/72 είναι μια ολοκαίνουργια τεχνική λύση, η τελειότητα όλων των υποσυστημάτων και η ενοποίηση είναι επίσης ένας από τους κινδύνους του συνόλου του συστήματος είναι επίσης η βάση για την ποιότητα αυτής της γενιάς προϊόντων.

Για τη σειρά GB200 που χρησιμοποιεί υδρόψυξη για απαγωγή θερμότητας, πρέπει επίσης να ληφθεί υπόψη το πρόβλημα της διαρροής υγρού, το οποίο περιλαμβάνει κυρίως τρία εξαρτήματα: πλάκα ψύξης νερού, σωλήνα διακλάδωσης, μονάδα διανομής υγρής ψύξης CDU και γρήγορη σύνδεση QCD , οι γρήγοροι σύνδεσμοι είναι πιο επιρρεπείς σε διαρροές, επομένως η διαρροή Είναι επίσης το πιο ενοχλητικό ζήτημα για τους κατασκευαστές διακομιστών Η ποιότητά του είναι το πιο κρίσιμο και συνεπάγεται άμεσα τον καταμερισμό των ευθυνών. Κανονικά,Εάν υπάρξει διαρροή, η Nvidia θα πληρώσει πρώτα αποζημίωση στον πελάτη και στη συνέχεια θα κάνει αξιώσεις από κατασκευαστές συστημάτων όπως η Hon Hai και η Quanta.

Κρίνοντας από τα νέα που λάβαμε, κατασκευαστές συστημάτων όπως οι Nvidia, Hon Hai και Quanta εξακολουθούν να δοκιμάζουν την απαγωγή θερμότητας με υδρόψυξη και δεν την έχουν παρουσιάσει ακόμη σε μεγάλες ποσότητες.

Όπως αναφέρθηκε προηγουμένως, ανεξάρτητα από το αν πρόκειται για εργοστάσιο τσιπ, εργοστάσιο συστημάτων ή εργοστάσιο απαγωγής θερμότητας, κανένας κατασκευαστής δεν είναι διατεθειμένος να αναλάβει αυτόν τον κίνδυνο εύκολα όταν αντιμετωπίζει εκατομμύρια δολάρια σε αποζημίωση. πειραματόζωο» πριν μπορέσουν να εφαρμοστούν σε μεγάλη κλίμακα.

03 Θα «αναποδογυρίσει» η Nvidia;

Αναφέραμε στην αρχή του άρθρου ότι η αγοραία αξία της Nvidia μειώθηκε από το ιστορικό υψηλό των 3,3 τρισεκατομμυρίων δολαρίων ΗΠΑ στα σημερινά 2,6 τρισεκατομμύρια δολάρια, μια πτώση μεγαλύτερη από 26%. Τα αναμενόμενα λειτουργικά αποτελέσματα δεύτερου τριμήνου συγκέντρωσε με σιγουριά 28 δισεκατομμύρια δολάρια και το σφάλμα ήταν εντός του εύρους ±2%.

Τώρα, λόγω προβλημάτων σχεδιασμού του καλουπιού GPU, το ποσοστό απόδοσης συσκευασίας CoWoS είναι μικρότερο από 95% και δεν έχουν ακόμη οριστικοποιηθεί διάφορες λύσεις τεχνολογίας διακομιστή, κάτι που θα επηρεάσει την ομαλή αποστολή των τσιπ Blackwell από 2 Μια λίστα με χρηματιστηριακή αξία τρισεκατομμυρίων;

Μπορούμε να πούμε ότι δεν θα υπάρξουν μεγάλα προβλήματα βραχυπρόθεσμα, το κλειδί είναι, Τα τσιπ Blackwell έχουν προγραμματιστεί για παραγωγή μικρής παρτίδας το τρίτο τρίμηνο και δεν θα αυξηθούν μέχρι το τέταρτο τρίμηνο, και αυτός είναι μόνο ο ρυθμός προγραμματισμού παραγωγής του TSMC Μετά την ολοκλήρωση της παραγωγής του καλουπιού GPU, το επόμενο βήμα είναι η επιστροφή -end CoWoS, και μετά το εργοστάσιο Bumping Τέλος, πήγαμε σε εργοστάσια συστημάτων όπως το Industrial Fii και το Wistron για συναρμολόγηση.και, στη συνέχεια, ολοκληρώστε τις αποστολές διακομιστή και την υλοποίηση της απόδοσης.

Με μια λέξη, οι αποστολές διακομιστή έχουν αντίκτυπο στα έσοδα της Nvidia, όχι οι αποστολές τσιπ της TSMC.

Σύμφωνα με τον τρέχοντα ρυθμό, η ταχύτερη μαζική παράδοση διακομιστών δεν θα γίνει μέχρι το πρώτο τρίμηνο του 2025. Με άλλα λόγια, η Nvidia δεν θα επιτύχει μεγάλη επιχειρηματική αύξηση στα τσιπ Blackwell μέχρι το πρώτο τρίμηνο του επόμενου έτους.Με άλλα λόγια, αυτό το τσιπ δεν θα συνεισφέρει σε μεγάλο ποσό εσόδων στη Nvidia μέχρι το επόμενο έτος.

Για την Nvidia, ο αντίστοιχος χρόνος για την ανακάλυψη σχεδιαστικών προβλημάτων στο τρίτο τρίμηνο, την εξεύρεση λύσεων και στη συνέχεια την εκτέλεση μιας σούπερ καυτής λειτουργίας στο TSMC είναι ακόμα στα μέσα έως τα τέλη του τέταρτου τριμήνου, πιθανώς μεταξύ Νοεμβρίου και Δεκεμβρίου Η ίδια η παραγωγική ικανότητα έχει προγραμματιστεί να ολοκληρωθεί και η παραγωγή μπορεί βασικά να συνεχίσει να προγραμματίζεται σε 3 μήνες. 120% για την αντιμετώπιση των ελαττωμάτων του σχεδιασμού Το πρόβλημα που προκάλεσε καθυστερήσεις στην αποστολή των μαρκών που ήταν αρχικά προγραμματισμένο να αποσταλούν σε μικρές παρτίδες το τρίτο τρίμηνο, με άλλα λόγια.Σε ετήσια βάση, αν και οι αποστολές της Blackwell θα είναι λιγότερες φέτος, δεν θα είναι πολύ λιγότερες.

Για τη NVIDIA και ολόκληρη την αλυσίδα της βιομηχανίας του επόμενου σταδίου, τα προβλήματα τσιπ έχουν πλέον εκτεθεί και διάφορα υποσυστήματα του διακομιστή πρέπει επίσης να ελέγχονται σε διάφορα πραγματικά περιβάλλοντα ταυτόχρονα. Αυτό που είναι πιο αισιόδοξο είναι ότι τα τσιπ που παράγονται αυτή τη στιγμή θα έχουν προβλήματα μόνο σε συγκεκριμένα περιβάλλοντα υψηλής τάσης παραμένει το ίδιο με πριν, υπάρχει ακόμη μισός χρόνος για να αποκτήσουν τα τσιπ για προσομοίωση δοκιμών σε διάφορα περιβάλλοντα και ο τελικός χρόνος αποστολής μεγάλης κλίμακας θα πέσει τον Φεβρουάριο-Μάρτιο του 2025.

Κρίνοντας από την τρέχουσα κατάσταση, το δεύτερο τρίμηνο, στο πλαίσιο των αποστολών πλημμύρας H200, η ​​απόδοση είναι πιθανό να είναι σύμφωνη με τις οδηγίες και να ξεπεράσει τις προσδοκίες , τα τσιπ Blackwell φέτος θα είναι σε μικρές παρτίδες Η κλίμακα των αποστολών θα μειωθεί από το αρχικό σχέδιο, σε περίπου 20.000 wafers (το CoWoS-L μειώνεται από 41K σε λιγότερο από 20K), το οποίο μεταφράζεται σε εκτιμώμενη απόδοση της NVIDIA περίπου στις ΗΠΑ. 8-9,5 δισεκατομμύρια δολάρια, αλλά η σειρά H θα αυξήσει τον αριθμό των γκοφρετών στην οικονομική έκθεση του τέταρτου τριμήνου, και σίγουρα θα υπάρξει αντίκτυπος στην τιμή της μετοχής.

Σε σύγκριση με το ίδιο το "rollover" του τσιπ Blackwell, ένα ζήτημα που αξίζει περισσότερης προσοχής είναι ότι η Nvidia λανσάρει νέες SKU, κάτι που απαιτεί πολλές καινοτόμες τεχνολογίες. Εάν δεν υπάρχει αρκετός χρόνος για τη βελτιστοποίηση και τη βελτίωση της αξιοπιστίας Υπάρχει πιθανότητα ένα συγκεκριμένο προϊόν να ανατραπεί εντελώς τα επόμενα χρόνια Αυτή είναι η λογική ανάπτυξης της Nvidia που πρέπει να επανεξετάσουμε και είναι επίσης μια ευκαιρία που περιμένουν οι ανταγωνιστές.

Από μια πιο μακροοικονομική άποψη, αν και δεν υπάρχει πρόβλημα με τη λογική ανάπτυξης της NVIDIA τα τελευταία δύο χρόνια, οι μακροπρόθεσμοι κίνδυνοι ανάπτυξης αυξάνονται.Αυτός ο κίνδυνος δεν αντανακλάται μόνο στις τρελές και ριζικές τεχνολογικές αλλαγές κάθε γενιάς, αλλά και στα ζητήματα εφαρμογής και στη συνέχεια ζήτησης Με απλά λόγια, είναι η γνωστή «φούσκα AI», ή αν θα υπάρξουν ισχυροί ανταγωνιστές με το νέο τεχνολογίες, όπως οι νέες τεχνολογίες, οι εταιρείες που έχουν προηγμένη τεχνολογία τσιπ ή έχουν κατακτήσει μεγάλα μοντέλα, έχουν ξεκινήσει την αυτο-έρευνα.

Πράγματι, έχω δει πολλές αναφορές τις τελευταίες δύο ημέρες, σχετικά με τους Κινέζους και τους Αμερικανούς γίγαντες, έχουν σταματήσει να κάνουν έρευνα μόνοι τους.OpenAIΤο αυτο-αναπτυγμένο έργο τσιπ βρίσκεται σχεδόν σε διαπραγμάτευση με την TSMC.