uutiset

NVIDIA Blackwell toimii palvelinkeskuksessa: NVLINK päivitetty 1,4 Tt/s, ensimmäinen FP4 GenAI -kuva julkaistu

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House raportoi 24. elokuuta, että Nvidia kutsui tiedotusvälineitä pitämään tiedotustilaisuuden ja esitteli Blackwell-alustaa teknologiatoimittajille ensimmäistä kertaa. NVIDIA osallistuu Hot Chips 2024 -tapahtumaan, joka järjestetään 25.-27. elokuuta ja esittelee Blackwell-alustan käyttöä datakeskuksissa.

Kiistää uutiset Blackwellin viivästymisestä listalle

Tässä tiedotustilaisuudessa Nvidia kiisti uutiset Blackwellin viivästymisestä listalle ja jakoi lisätietoja datakeskuksestaan ​​Goliathista.

Nvidia esitteli tiedotustilaisuuden aikana Blackwellin toimintaa yhdessä palvelinkeskuksistaan ​​ja korosti, että Blackwell etenee suunnitellusti ja toimitetaan asiakkaille myöhemmin tänä vuonna.

On huhuja, että Blackwellissä on jokin vika tai ongelma, joka estää sen julkaisemisen markkinoille tänä vuonna. Tämä ehdotus on kestämätön.

Johdatus Blackwelliin

NVIDIA sanoo, että Blackwell on enemmän kuin pelkkä siru, se on alusta. Kuten Hopper, myös Blackwell sisältää suuren määrän malleja datakeskus-, pilvilaskenta- ja tekoälyasiakkaille, ja jokainen Blackwell-tuote koostuu erilaisista siruista.

IT Homen mukana tulevat sirut ovat seuraavat:

Blackwell GPU

Grace CPU

NVLINK-kytkinsiru

Bluefield-3

ConnectX-7

ConnectX-8

Spektri-4

Kvantti-3

Blackwellin silta

Nvidia jakoi myös uusia kuvia eri Blackwell-tuoteperheen silloista. Nämä ovat ensimmäiset jaettavat kuvat Blackwellin kaapelihyllyistä, ja ne havainnollistavat seuraavan sukupolven datakeskusalustojen suunnittelussa tarvittavaa laajaa teknistä asiantuntemusta.

Tavoite biljoonaparametrinen AI-malli

Blackwell on suunniteltu vastaamaan nykyaikaisen tekoälyn tarpeisiin ja tarjoamaan erinomaisen suorituskyvyn suurille kielimalleille, kuten Metan 405B Llama-3.1. Kun LLM:t kasvavat ja niillä on enemmän parametreja, datakeskukset vaativat enemmän laskentaa ja pienemmän viiveen.

Usean GPU:n päättelymenetelmät

Usean GPU:n päättelytapa on suorittaa laskelmia useilla GPU:illa alhaisen viiveen ja suuren suorituskyvyn saavuttamiseksi, mutta usean grafiikkasuorittimen reittiä käyttämisessä on omat ongelmansa. Jokaisen usean näytönohjaimen ympäristössä olevan grafiikkasuorittimen on lähetettävä laskentatulokset kunkin kerroksen muille GPU:ille, mikä edellyttää suuren kaistanleveyden GPU:n ja GPU:n välistä tiedonsiirtoa.

Usean GPU:n päättelytapa on suorittaa laskelmia useilla GPU:illa alhaisen viiveen ja suuren suorituskyvyn saavuttamiseksi, mutta usean grafiikkasuorittimen reittiä käyttämisessä on omat ongelmansa. Jokaisen usean näytönohjaimen ympäristössä olevan grafiikkasuorittimen on lähetettävä laskentatulokset kunkin kerroksen muille GPU:ille, mikä edellyttää suuren kaistanleveyden GPU:n ja GPU:n välistä tiedonsiirtoa.

Nopeammat NVLINK-kytkimet

Blackwellin myötä NVIDIA esitteli nopeammat NVLINK-kytkimet, jotka kaksinkertaistivat kankaan kaistanleveyden 1,8 TB/s:iin. Itse NVLINK-kytkin perustuu TSMC:n 4NP-solmun 800 mm2 siruun, joka voi skaalata NVLINKin 72 grafiikkasuorittimeen GB200 NVL72 -telineessä.

Siru tarjoaa 7,2 TB/s kaksisuuntaista kaistanleveyttä 72 portin kautta ja verkon sisäisen laskentatehon ollessa 3,6 TFLOPs. NVLINK-kytkinalustassa on kaksi näistä kytkimistä, jotka tarjoavat jopa 14,4 TB/s kokonaiskaistanleveyden.

Vesijäähdytys

NVIDIA käyttää vesijäähdytystä parantaakseen suorituskykyä ja tehokkuutta. GB200-, Grace Blackwell GB200- ja B200-järjestelmissä on nämä uudet nestejäähdytysratkaisut, jotka voivat vähentää konesalien sähkökustannuksia jopa 28 %.

Ensimmäinen tekoälykuva, joka on luotu FP4-laskelmilla

NVIDIA™ (NVIDIA®) jakoi myös maailman ensimmäisen FP4-laskennan avulla luodun tekoälykuvan. Kuvasta näkyy, että FP4-kvantisointimalli tuottaa 4-bittisiä kanikuvia, jotka ovat hyvin samanlaisia ​​kuin FP16-malli, mutta nopeampia.

Tämän kuvan on tuottanut MLPerf käyttämällä Blackwelliä stabiilissa diffuusiossa. Nyt tarkkuuden vähentämisen (FP16:sta FP4:ään) haasteena on, että menetät jonkin verran tarkkuutta.