νέα

Η NVIDIA Blackwell λειτουργεί στο κέντρο δεδομένων: Το NVLINK αναβαθμίστηκε σε 1,4 TB/s, κυκλοφόρησε η πρώτη εικόνα FP4 GenAI

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Το IT House ανέφερε στις 24 Αυγούστου ότι η Nvidia κάλεσε ορισμένα μέσα ενημέρωσης να πραγματοποιήσουν μια ενημέρωση και παρουσίασε την πλατφόρμα Blackwell σε δημοσιογράφους τεχνολογίας για πρώτη φορά. Η NVIDIA θα παραστεί στην εκδήλωση Hot Chips 2024 που θα πραγματοποιηθεί από τις 25 έως τις 27 Αυγούστου για να επιδείξει τη χρήση της πλατφόρμας Blackwell σε κέντρα δεδομένων.

Διαψεύδει την είδηση ​​ότι η Blackwell καθυστερεί την εισαγωγή

Σε αυτήν την ενημέρωση, η Nvidia διέψευσε την είδηση ​​της καθυστερημένης εισαγωγής της Blackwell και μοιράστηκε περισσότερες πληροφορίες σχετικά με το κέντρο δεδομένων Goliath.

Η Nvidia έδειξε ότι η Blackwell λειτουργεί σε ένα από τα κέντρα δεδομένων της κατά τη διάρκεια της ενημέρωσης και τόνισε ότι η Blackwell προχωρά όπως είχε προγραμματιστεί και θα αποσταλεί στους πελάτες αργότερα μέσα στο έτος.

Υπάρχουν φήμες ότι η Blackwell έχει κάποιου είδους ελάττωμα ή πρόβλημα που το εμποδίζει να κυκλοφορήσει στην αγορά φέτος.

Εισαγωγή στο Blackwell

Η NVIDIA λέει ότι το Blackwell είναι κάτι περισσότερο από ένα τσιπ, είναι μια πλατφόρμα. Όπως το Hopper, η Blackwell περιλαμβάνει μεγάλο αριθμό σχεδίων για πελάτες κέντρο δεδομένων, υπολογιστικού νέφους και τεχνητής νοημοσύνης και κάθε προϊόν Blackwell αποτελείται από διαφορετικά τσιπ.

Τα τσιπ που περιλαμβάνονται στο IT Home είναι τα εξής:

GPU Blackwell

CPU Grace

Τσιπ διακόπτη NVLINK

Bluefield-3

ConnectX-7

ConnectX-8

Φάσμα-4

Quantum-3

Γέφυρα Blackwell

Η Nvidia μοιράστηκε επίσης νέες εικόνες από τις διάφορες γέφυρες της οικογένειας προϊόντων Blackwell. Αυτές είναι οι πρώτες εικόνες των δίσκων καλωδίων της Blackwell που κοινοποιούνται, απεικονίζοντας την εκτεταμένη μηχανική τεχνογνωσία που απαιτείται για το σχεδιασμό πλατφορμών κέντρων δεδομένων επόμενης γενιάς.

Στόχος τρισεκατομμυρίων παραμέτρων AI μοντέλο

Το Blackwell έχει σχεδιαστεί για να ανταποκρίνεται στις ανάγκες της σύγχρονης τεχνητής νοημοσύνης και να προσφέρει εξαιρετική απόδοση για μεγάλα γλωσσικά μοντέλα όπως το 405B Llama-3.1 της Meta. Καθώς τα LLM γίνονται μεγαλύτερα και έχουν περισσότερες παραμέτρους, τα κέντρα δεδομένων θα απαιτούν περισσότερους υπολογισμούς και χαμηλότερο λανθάνοντα χρόνο.

Μέθοδοι συμπερασμάτων πολλαπλών GPU

Η προσέγγιση συμπερασμάτων πολλαπλών GPU είναι η εκτέλεση υπολογισμών σε πολλαπλές GPU για την επίτευξη χαμηλής καθυστέρησης και υψηλής απόδοσης, αλλά η μετάβαση στη διαδρομή πολλών GPU έχει τις επιπλοκές της. Κάθε GPU σε περιβάλλον πολλαπλών GPU πρέπει να στέλνει αποτελέσματα υπολογισμού σε άλλες GPU σε κάθε επίπεδο, κάτι που απαιτεί επικοινωνία GPU προς GPU υψηλού εύρους ζώνης.

Η προσέγγιση συμπερασμάτων πολλαπλών GPU είναι η εκτέλεση υπολογισμών σε πολλαπλές GPU για την επίτευξη χαμηλής καθυστέρησης και υψηλής απόδοσης, αλλά η μετάβαση στη διαδρομή πολλών GPU έχει τις επιπλοκές της. Κάθε GPU σε περιβάλλον πολλαπλών GPU πρέπει να στέλνει αποτελέσματα υπολογισμού σε άλλες GPU σε κάθε επίπεδο, κάτι που απαιτεί επικοινωνία GPU προς GPU υψηλού εύρους ζώνης.

Γρηγορότεροι διακόπτες NVLINK

Με το Blackwell, η NVIDIA εισήγαγε ταχύτερους διακόπτες NVLINK που διπλασίασαν το εύρος ζώνης σε 1,8 TB/s. Ο ίδιος ο διακόπτης NVLINK βασίζεται στο τσιπ 4NP node 800mm2 της TSMC, το οποίο μπορεί να κλιμακώσει το NVLINK σε 72 GPU στο rack GB200 NVL72.

Το τσιπ παρέχει 7,2 TB/s αμφίδρομου εύρους ζώνης all-to-all μέσω 72 θυρών, με υπολογιστική ισχύ εντός δικτύου 3,6 TFLOPs. Ένας δίσκος μεταγωγέα NVLINK διαθέτει δύο από αυτούς τους διακόπτες, παρέχοντας συνολικό εύρος ζώνης έως και 14,4 TB/s.

Υδροψύξη

Η NVIDIA χρησιμοποιεί υδρόψυξη για να βελτιώσει την απόδοση και την αποδοτικότητα. Τα συστήματα GB200, Grace Blackwell GB200 και B200 θα διαθέτουν αυτές τις νέες λύσεις υγρής ψύξης, οι οποίες μπορούν να μειώσουν το κόστος ενέργειας για τις εγκαταστάσεις του κέντρου δεδομένων έως και 28%.

Η πρώτη εικόνα τεχνητής νοημοσύνης που δημιουργήθηκε χρησιμοποιώντας υπολογισμούς FP4

Η NVIDIA™ (NVIDIA®) μοιράστηκε επίσης την πρώτη εικόνα τεχνητής νοημοσύνης στον κόσμο που δημιουργήθηκε με χρήση υπολογιστών FP4. Το σχήμα δείχνει ότι το μοντέλο κβαντοποίησης FP4 παράγει εικόνες κουνελιού 4-bit που είναι πολύ παρόμοιες με το μοντέλο FP16, αλλά πιο γρήγορες.

Αυτή η εικόνα δημιουργήθηκε από την MLPerf χρησιμοποιώντας Blackwell σε σταθερή διάχυση. Τώρα, η πρόκληση με τη μείωση της ακρίβειας (από FP16 σε FP4) είναι ότι χάνετε κάποια ακρίβεια.