νέα

ο ming-chi kuo είπε ότι η nvidia σταμάτησε να αναπτύσσει την έκδοση διπλού ντουλαπιού gb200 (nvl36*2) ai cabinet

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

σύμφωνα με τα νέα του it house στις 2 οκτωβρίου, η ming-chi kuo δημοσίευσε μια ενημέρωση για τις επενδύσεις της αγοράς χθες (1 οκτωβρίου) αναφέρθηκε ότι, ελλείψει απαιτήσεων προσαρμογής πελατών, η nvidia δεν παρέχει πλέον την έκδοση dual-cabinet του gb200 (2 nvl36). ), και παρέχει μόνο εκδόσεις ενός ντουλαπιού η έκδοση ντουλαπιού gb200 nvl72, ενώ η έκδοση ενός ντουλαπιού nvl36 εξακολουθεί να διατηρεί το αρχικό σχέδιο ανάπτυξης και αποστολής.

το it home επισυνάπτει τις πληροφορίες ενημέρωσης του ming-chi kuo ως εξής:

εν κατακλείδι:

αυτό το θέμα δεν θα επηρεάσει τη μακροπρόθεσμη θετική τάση της τεχνητής νοημοσύνης και της nvidia, αλλά βραχυπρόθεσμα μπορεί να προκαλέσει ορισμένους συμμετέχοντες στην αγορά να αμφισβητήσουν τις δυνατότητες εκτέλεσης της nvidia και της εφοδιαστικής αλυσίδας.

η nvidia αναθεώρησε συχνά το σχέδιο προϊόντος του διακομιστή ai της, νομίζω ότι αυτό συμβαίνει επειδή η nvidia θέλει να επιτύχει μια καλύτερη ισορροπία μεταξύ της εκτέλεσης της αλυσίδας εφοδιασμού, των ανταγωνιστικών πλεονεκτημάτων και των αναγκών των πελατών υπό περιορισμένους πόρους (η διακοπή της ανάπτυξης nvl36*2 είναι μόνο ένα παράδειγμα). αυτό είναι καλό και αντιπροσωπεύει την πιο ρεαλιστική προσέγγιση της nvidia στον προγραμματισμό προϊόντων, αλλά η διαδικασία αλλαγής μπορεί να προκαλέσει σύγχυση σε ορισμένους συμμετέχοντες στην αγορά σχετικά με το χάος της εφοδιαστικής αλυσίδας.

λόγω της τρέχουσας χαμηλής ορατότητας του μείγματος αποστολής προϊόντων των διακομιστών blackwell το 2025 (πριν από λίγους μήνες, η αγορά πίστευε γενικά ότι θα υπήρχαν μόνο nvl36, nvl72 και nvl36*2), η προοπτική για το 2025 ορισμένων προμηθευτών, όπως η συναρμολόγηση και η ψύξη, θα επηρεαστεί σε μεγάλο βαθμό.

σύγκριση δύο εκδόσεων 72gpu: λόγοι για την επιλογή του nvl72 και την ακύρωση του nvl36*2

οι πόροι ανάπτυξης είναι περιορισμένοι.το αρχικό σχέδιο ήταν ότι τρεις θήκες gb200 (nvl36, nvl72, nvl36*2) ήταν υπό ανάπτυξη ταυτόχρονα. αναμένεται ότι η έκδοση ανάπτυξης (development drop: devdrop) από τα μέσα νοεμβρίου θα συγκλίνει σε nvl72 και nvl36*2 (επειδή το nvl36 είναι «θεωρητικά» έτοιμο να μπει στο στάδιο μαζικής παραγωγής) και η τελική έκδοση των δύο έχει ολοκληρωθεί έως τα μέσα μαρτίου 2025. διασφάλιση ποιότητας (qa). ωστόσο, εξακολουθεί να υπάρχει αβεβαιότητα στην ανάπτυξη του nvl36, πόσο μάλλον στην ταυτόχρονη ανάπτυξη δύο εκδόσεων 72 gpu (nvl72 και nvl36*2).

το nvl72 εξοικονομεί χώρο στο κέντρο δεδομένων.εάν το nvl72 μπορεί να λύσει σωστά τις προκλήσεις σχεδιασμού απαγωγής θερμότητας του sidecar, θα χρειαστεί ένα ντουλάπι λιγότερο από το nvl36*2, βελτιώνοντας την απόδοση του χώρου του κέντρου δεδομένων.

η απόδοση συμπερασμάτων του nvl72 είναι καλύτερη.επωφελούμενοι από τον παραλληλοποιήσιμο σχεδιασμό του λογισμικού, υπάρχει μικρή διαφορά στα αποτελέσματα εκπαίδευσης ai llm μεταξύ nvl72 και nvl36*2. ωστόσο, στη διαδικασία συλλογιστικής που δεν είναι ή είναι δύσκολο να παραλληλιστεί ο σχεδιασμός (όπως τα αυτοπαλινδρομικά μοντέλα), η απόδοση του nvl72 είναι ευκολότερο να ξεπεράσει το nvl36*2.

βασικές προτιμήσεις πελατών.για παράδειγμα, η microsoft προτιμά το nvl72 παρά το nvl36*2.

τηρήστε τις δημόσιες υποσχέσεις. η εστίαση της δημοσιότητας της nvidia ήταν πάντα στην έκδοση ενός ντουλαπιού του nvl72 προκειμένου να εκπληρώσει τη δημόσια δέσμευσή της και με περιορισμένους πόρους, η προτεραιότητα ανάπτυξης του nvl72 είναι υψηλότερη από αυτή του nvl36*2.

η ανάπτυξη του nvl72 αντιμετωπίζει άνευ προηγουμένου τεχνικές προκλήσεις και η ορατότητα του τρέχοντος προγράμματος μαζικής παραγωγής εξακολουθεί να είναι χαμηλή

η μεγαλύτερη πρόκληση στην ανάπτυξη του nvl72 προέρχεται κυρίως από την απαίτηση tdp (θερμικό σημείο σχεδίασης) των 132 kw αυτός είναι ο διακομιστής με την υψηλότερη κατανάλωση ενέργειας στην ιστορία και η αλυσίδα εφοδιασμού χρειάζεται περισσότερο χρόνο για την επίλυση πρωτοφανών τεχνικών προβλημάτων.

θα πρέπει να σημειωθεί ότι το tdp αναφέρεται στη μέση κατανάλωση ενέργειας της συνεχούς λειτουργίας εάν η ακατάλληλη σχεδίαση έχει ως αποτέλεσμα η στιγμιαία μέγιστη κατανάλωση ενέργειας (που ονομάζεται edp (electrical design point) από την nvidia) να είναι υψηλότερη από την tdp, μπορεί να χρειαστούν περισσότερα από δύο sidecar. αν ναι, όχι μόνο αυτό αυξάνει την πολυπλοκότητα του σχεδιασμού απαγωγής θερμότητας και τη δυσκολία της μαζικής παραγωγής, και επίσης χάνει το πλεονέκτημα του nvl72 στην εξοικονόμηση χώρου στο κέντρο δεδομένων.

μια άλλη πρόκληση σχεδιασμού του πλαϊνού αυτοκινήτου είναι ο σταθερός έλεγχος της θερμοκρασίας που πλησιάζει στους 5–10°c εάν το πρότυπο είναι χαλαρό, μπορεί να επηρεαστεί η σταθερότητα του συστήματος.

θα πρέπει να σημειωθεί ότι η πρόκληση υψηλής κατανάλωσης ενέργειας που αναφέρθηκε παραπάνω αφορά όχι μόνο το sidecar, αλλά όλα τα εξαρτήματα και το σχεδιασμό του συστήματος.

η τελευταία μου έρευνα για την αλυσίδα εφοδιασμού επισημαίνει ότι το χρονοδιάγραμμα μαζικής παραγωγής του nvl72 μπορεί να είναι μόνο μετά το 2h25 (έναντι του αισιόδοξου στόχου της nvidia είναι το 1h25).