Νέα

Εκτέθηκε η ευνουχισμένη έκδοση του B200A της Nvidia!Η ισχυρότερη αρχιτεκτονική τσιπ είναι δύσκολο να παραχθεί: η παραγωγική ικανότητα δεν είναι αρκετή και μπορεί να κατασκευαστεί με δεξιότητες μαχαιριού

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Ο Mengchen προέρχεται από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

Το πιο ισχυρό τσιπ της NVIDIA, το B200, αναγκάστηκε να αναβληθεί για τρεις μήνες και οι φήμες πληθαίνουν.

Ακολουθεί το αντίμετρο του Lao Huang: η ευνουχισμένη έκδοση του τσιπB200Aέκθεση.

Αυτό είναι;«Η παραγωγική ικανότητα δεν είναι αρκετή, επομένως πρέπει να χρησιμοποιήσουμε δεξιότητες μαχαιριού για να το καλύψουμε».



Σωστά, σύμφωνα με την ανάλυση SemiAnalysis, το κύριο πρόβλημα που αντιμετωπίζει το B200 είναι ακριβώςΑνεπαρκής παραγωγική ικανότητα, πιο συγκεκριμέναΗ νέα διαδικασία συσκευασίας της TSMC CoWoS-L έχει ανεπαρκή παραγωγική ικανότητα

Η ευνουχισμένη έκδοση του B200A θα χρησιμοποιηθεί πρώτα για να καλύψει τις ανάγκες συστημάτων τεχνητής νοημοσύνης μεσαίου έως χαμηλού επιπέδου.

Ευνουχισμένη έκδοση του B200A, το εύρος ζώνης μνήμης συρρικνώνεται

Γιατί λέγεται ότι το B200A είναι ευνουχισμένη έκδοση;

Ο δείκτης αντανακλάται κυρίως στο εύρος ζώνης της μνήμης.4 TB/s, άμεσα σε σύγκριση με τα 8TB/s που προώθησε το B200 στη συνέντευξη Τύπου στις αρχές της χρονιάς.Συρρικνώθηκε κατά το ήμισυ



Πίσω από αυτό βρίσκεται η διαδικασία συσκευασίας από την CoWoS-LΕπέστρεψε το CoWoS-S, ακόμη και το B200A λέγεται ότι είναι συμβατό με άλλες τεχνολογίες συσκευασίας 2.5D που δεν είναι TSMC, όπως η Samsung.

Γενικά, η προηγμένη συσκευασία CoWoS έχει επί του παρόντος τρεις παραλλαγές, CoWoS-μικρό、CoWoS-Rκαι CoWoS-μεγάλο, η κύρια διαφορά έγκειται στη λύση παρεμβολής.

παρεμβαλλόμενοςΜεταξύ της πλακέτας τσιπ και της πλακέτας τυπωμένου κυκλώματος, πραγματοποιεί την ανταλλαγή πληροφοριών μεταξύ του τσιπ και του υποστρώματος συσκευασίας, ενώ παρέχει μηχανική υποστήριξη και δυνατότητες απαγωγής θερμότητας.

Το CoWoS-S έχει την απλούστερη δομή και η παρεμβολή είναι ισοδύναμη με μια πλάκα πυριτίου.



Χρησιμοποιείται CoWoS-RΤεχνολογία RDL(Στρώση ανακατανομής, στρώμα ανακατανομής), ο παρεμβολέας είναι ένα λεπτό μεταλλικό υλικό με πολυστρωματική δομή.



Το CoWoS-L είναι το πιο περίπλοκο, προσθέτοντας αΤσιπ LSI(Τοπική διασύνδεση πυριτίου, τοπική διασύνδεση πυριτίου), η οποία μπορεί να επιτύχει μεγαλύτερη πυκνότητα καλωδίωσης και μπορεί επίσης να κατασκευαστεί σε μεγαλύτερα μεγέθη.



Η TSMC κυκλοφόρησε το CoWoS-L επειδή η παλαιότερη τεχνολογία αντιμετώπισε δυσκολίες στη συνέχιση της ανάπτυξης σε μέγεθος και απόδοση.

Για παράδειγμα, στο τσιπ επιτάχυνσης AI MI300 της AMD, το επίπεδο παρεμβολής CoWoS-S έχει επεκταθεί σε 3,5 φορές το αρχικό πρότυπο, αλλά εξακολουθεί να είναι δύσκολο να καλύψει τις μελλοντικές ανάγκες αύξησης της απόδοσης του τσιπ AI.

Αλλά τώρα, υπάρχουν νέα ότι το CoWoS-L αντιμετώπισε κάποια προβλήματα κατά την αύξηση της παραγωγικής ικανότητας και μπορεί να υπάρχουν προβλήματα μεταξύ του πυριτίου, του παρεμβολέα και του υποστρώματος.Αναντιστοιχία συντελεστή θερμικής διαστολής, με αποτέλεσμα κάμψη, πρέπει να επανασχεδιαστεί.

Στο παρελθόν, η TSMC έχει δημιουργήσει μεγάλη χωρητικότητα παραγωγής CoWoS-S, με τη Nvidia να κατέχει το μεγαλύτερο μερίδιο. Τώρα η ζήτηση της Nvidia μπορεί γρήγορα να μετατοπιστεί στο CoWoS-L, αλλά θα χρειαστεί χρόνος για να μετατρέψει η TSMC την παραγωγική της ικανότητα στη νέα διαδικασία.

Επιπλέον, υπάρχουν νέα ότι ο πυρήνας του B200A (εσωτερικό μοντέλο B102) θα χρησιμοποιηθεί επίσης για την κατασκευή ειδικής έκδοσης B20 στο μέλλον.

Η εκπαίδευση μεγάλων μοντέλων B200 αντιμετωπίζει και άλλες προκλήσεις

Η κύρια προδιαγραφή που προωθείται από την Blackwell είναι "μια νέα γενιά υπολογιστικών μονάδων"GB200 NVL72, ένα ντουλάπι έχει 36 CPU + 72 GPU.

Η υπολογιστική ισχύς είναι πολύ καλή Η υπολογιστική ισχύς ενός ντουλαπιού με ακρίβεια FP8 είναι τόσο υψηλή όσο 720PFlops, που είναι κοντά σε αυτήν ενός συμπλέγματος υπερυπολογιστών DGX SuperPod (1000PFlops) στην εποχή H100.

Αλλά η κατανάλωση ενέργειας είναι επίσης πολύ καλή, σύμφωνα με τις εκτιμήσεις της Semianalysis.Πυκνότητα ισχύοςΠερίπου ανά ντουλάπι125 kW , άνευ προηγουμένου. Φέρνει προκλήσεις όσον αφορά την παροχή ρεύματος, την απαγωγή θερμότητας, τον σχεδιασμό δικτύου, τον παραλληλισμό, την αξιοπιστία κ.λπ.

Στην πραγματικότητα, η βιομηχανία δεν έχει ακόμη εξημερώσει πλήρως το σύμπλεγμα καρτών H1 εκατομμυρίου που έχει χρησιμοποιηθεί για εκπαίδευση μεγάλων μοντέλων.

Για παράδειγμα, η τεχνική έκθεση της σειράς Llama 3.1 επεσήμανε ότι μια μέση αποτυχία εμφανιζόταν μία φορά κάθε τρεις ώρες κατά τη διάρκεια της προπόνησης, εκ των οποίων το 58,7% προκλήθηκε από τη GPU.

Από τις συνολικά 419 βλάβες, οι 148 προκλήθηκαν από διάφορες βλάβες της GPU (συμπεριλαμβανομένων των αστοχιών NVLink) και οι 72 προκλήθηκαν συγκεκριμένα από βλάβες μνήμης HBM3.



Έτσι, σε γενικές γραμμές, ακόμα κι αν ο Lao Huang στείλει τελικά το B200, θα χρειαστεί ακόμα περισσότερος χρόνος για τον γίγαντα της τεχνητής νοημοσύνης να κατασκευάσει πραγματικά το σύμπλεγμα B200 και να επενδύσει στην εκπαίδευση μεγάλων μοντέλων.

Τα GPT-5, Claude 3.5 Opus, Llama 4, κ.λπ., τα οποία έχουν ήδη ξεκινήσει ή πλησιάζουν στην ολοκλήρωση, ενδέχεται να μην χρησιμοποιηθούν μέχρι την επόμενη γενιά μοντέλων.

Ακόμη ένα πράγμα

Σε απάντηση στις φήμες για αναβολή του B200, η ​​NVIDIA έδωσε επίσημη απάντηση:

Η ζήτηση για το Hopper είναι ισχυρή και οι δοκιμές δειγμάτων της Blackwell έχουν ξεκινήσει ευρέως,Η παραγωγή αναμένεται να αυξηθεί το δεύτερο εξάμηνο του έτους

Δεν θα δοθεί συγκεκριμένη απάντηση για το αν θα καθυστερήσει για τρεις μήνες.

Ωστόσο, η Morgan Stanley ήταν πιο αισιόδοξη στην τελευταία της έκθεση, πιστεύοντας ότι η παραγωγή θα διακοπεί μόνο για περίπου δύο εβδομάδες.

Σύνδεσμοι αναφοράς:
[1]https://x.com/dylan522p/status/1820200553512841239
[2]https://www.semianalysis.com/p/nvidias-blackwell-reworked-shipment
[3]https://3dfabric.tsmc.com/english/dedicatedFoundry/technology/cowos.htm
[4]https://www.trendforce.com/news/2024/03/21/news-blackwell-enters-the-scene-a-closer-look-at-tsmcs-cowos-branch/
[5]https://ieeexplore.ieee.org/document/9501649