NVIDIAn "AI Box" päivittää ja julkaisee ohjelmistoja ja palveluita, ja Jen-Hsun Huang luo digitaalisen kopion fyysisestä maailmasta

2024-07-30

Teksti / Tencent Technology Li Haidan Toimittaja / Guo Xiaojing

Heinäkuun 30. päivänä Pekingin aikaa NVIDIA (tunnetaan myös nimellä NVIDIA) esitteli monia viimeisimmistä kehityksestään renderöinnin, simuloinnin ja generatiivisen tekoälyn aloilla SIGGRAPH 2024:ssä, huippuluokan tietokonegrafiikkakonferenssissa Denverissä, Yhdysvalloissa.

Viime vuoden SIGGRAPH-tapahtumassa NVIDIA julkaisi GH200:n, L40S-näytönohjaimet ja ChatUSD:n. Tämän vuoden päähenkilö on NVIDIA:n uusi valttikortti generatiivisen tekoälyn aikakaudella."Nvidia NIM" uusi päivitys, ja soveltaa generatiivista tekoälyä USD:hen (universal scene description) NIM:n kautta laajentaen tekoälyn mahdollisuuksia 3D-maailmassa.

Nvidia NIM -päivitys: sekä siunaus että haaste

Nvidia ilmoitti, että Nvidia NIM saavuttaa lisäoptimointia ja standardoi tekoälymallien monimutkaisen käyttöönoton. NIM on keskeinen osa NVIDIAn AI-asettelua. Huang Renxun on toistuvasti kehunut NIM:n tuomaa innovaatiota ja kutsunut sitä "AI-in-a-Box, pohjimmiltaan se on tekoälyä laatikossa。”

Tämä päivitys epäilemättä vahvistaa Nvidian johtavaa asemaa tekoälyn alalla ja siitä tulee tärkeä osa sen teknologiavalliamme.

CUDAa on pitkään pidetty keskeisenä tekijänä Nvidian johtajuudessa GPU-kentässä. CUDA:n tuella GPU on kehittynyt yhdestä grafiikkasuorittimesta yleiskäyttöiseksi rinnakkaislaskentalaitteeksi, mikä mahdollistaa tekoälyn kehittämisen. Vaikka NVIDIAn ohjelmistoekosysteemi on erittäin rikas, nämä pirstoutuneet järjestelmät ovat edelleen liian monimutkaisia ja vaikeita hallita perinteisille teollisuudenaloille, joilta puuttuu perustason tekoälykehityskyky.

Tämän ongelman ratkaisemiseksi Nvidia lanseerasi tämän vuoden maaliskuussa GTC-konferenssissa NIM (Nvidia Inference Microservices) -pilvipohjaiset mikropalvelut, jotka integroivat kaikki viime vuosina kehitetyt ohjelmistot tekoälysovellusten käyttöönoton yksinkertaistamiseksi ja nopeuttamiseksi. NIM voi käyttää malleja optimoituina "säiliöinä", jotka voidaan ottaa käyttöön pilvessä, datakeskuksessa tai työasemassa, jolloin kehittäjät voivat saada työn valmiiksi minuuteissa, kuten helposti rakentaa generatiivisia tekoälysovelluksia perämiehille, chatboteille jne. .

Tähän mennessä Nvidian NIM-ekosysteemi on tarjonnut sarjan valmiiksi koulutettuja tekoälymalleja.Nvidia ilmoitti, auttaa kehittäjiä nopeuttamaan sovellusten kehitystä ja käyttöönottoa useilla alueilla ja keskittymään eri alueisiin (kuten ymmärrykseen,digitaalinen mies, 3D-kehitys, robotiikka ja digitaalibiologia) saatavilla olevat tekoälymallit:

Ymmärtämisen suuntaan NIM voi käyttää Llama 3.1:tä ja NeMo Retrieveriä parantaakseen tekstidatan käsittelyominaisuuksia digitaalisten ihmisten suuntaan, se tarjoaa malleja, kuten Parakeet ASR ja FastPitch HiFiGAN, jotka tukevat korkealaatuista puhesynteesiä ja automaattista; puheentunnistus virtuaalisten avustajien ja digitaalisten ihmisten rakentamiseen Tarjoaa tehokkaita työkaluja.

3D-kehityksen osalta mallit, kuten USD Code ja USD Search, yksinkertaistavat 3D-kohtausten luomista ja käyttöä auttaen kehittäjiä rakentamaan digitaalisia kaksosia ja virtuaalisia maailmoja tehokkaammin.

Robotin suoritusmuodon suuntaan NVIDIA on tuonut markkinoille MimicGen- ja Robocasa-malleja. Nopeuta robotiikan kehitystä ja soveltamista luomalla synteettistä liiketietoa ja simulaatioympäristöjä. MimicGen NIM voi luoda synteettistä liiketietoa tilatietolaitteiden, kuten Apple Vision Pron, tallentamien etäkäyttötietojen perusteella. Robocasa NIM luo robottitehtäviä ja simulaatiovalmiita ympäristöjä OpenUSD:ssä, universaalissa kehyksessä 3D-maailman kehittämiseen ja yhteistyöhön.

Mallit, kuten DiffDock ja ESMFold digitaalisen biologian alalla, tarjoavat edistyneitä ratkaisuja lääkekehitykseen ja proteiinien laskostumisen ennustamiseen, edistäen biolääketieteellisen tutkimuksen edistymistä ja niin edelleen.

Lisäksi Nvidia ilmoitti, että Hugging Face Inference-as-a-service -alusta on myös Nvidia NIM:n tuottama ja toimii pilvessä.

Integroimalla nämä monipuoliset mallit Nvidian ekosysteemi ei ainoastaan tehosta tekoälykehitystä, vaan tarjoaa myös innovatiivisia työkaluja ja ratkaisuja. Vaikka Nvidia NIM:n monet päivitykset ovat todellakin "hyviä uutisia" teollisuudelle. Mutta toisaalta se tuo myös monia haasteita ohjelmoijille.

Nvidia NIM yksinkertaistaa huomattavasti tekoälymallien kehitystä ja käyttöönottoa tarjoamalla valmiiksi koulutettuja tekoälymalleja ja standardoituja sovellusliittymiä. Tämä on todellakin suuri siunaus kehittäjille, mutta tarkoittaako se myös työmahdollisuuksia tavallisille ohjelmoijille tulevaisuudessa? ?Yritykset voivat käyttää vähemmän teknistä henkilöstöä saman työn suorittamiseen, koska NIM on suorittanut nämä tehtävät etukäteen, eikä tavallisten ohjelmoijien tarvitse enää tehdä monimutkaista mallin koulutusta ja viritystä.

Opeta tekoäly ajattelemaan 3D:ssä ja rakentamaan virtuaalista fyysistä maailmaa

NVIDIA esitteli myös generatiivisen tekoälyn soveltamista avoimilla USD- ja Omniverse-alustoilla SIGGRAPH-konferenssissa.

Nvidia ilmoitti rakentaneensa maailman ensimmäisen generatiivisen tekoälymallin, joka pystyy ymmärtämään OpenUSD (Universal Scene Description) -kieltä, geometriaa, materiaaleja, fysiikkaa ja tilaa, ja pakannut nämä mallit Nvidia NIM -mikropalveluiksi.Tällä hetkellä Nvidia API -luettelossa on esikatseltavissa kolme NIM:ää: USD Code, joka vastaa avoimiin USD-tietokysymyksiin ja luo avoimen USD Python -koodin, jonka avulla kehittäjät voivat etsiä laajasta avoimesta USD 3D:stä luonnollisella kielellä tai kuvasyötteen avulla ja kuvatietokanta USD Validate, joka tarkistaa ladattujen tiedostojen yhteensopivuuden avoimien USD-julkaisujen kanssa ja luo täysin RTX-renderöityjä polkujäljitettyjä kuvia Omniverse Cloud API:n avulla.

Nvidia sanoi, että Nvidia NIM -mikropalveluiden OpenUSD:n parantamisen ja saavutettavuuden ansiosta kaikilla elämänaloilla voidaan rakentaa fysiikkaan perustuvia virtuaalimaailmoja ja digitaalisia kaksosia tulevaisuudessa. Nvidia Omniverse -alustalle rakennetun uuden generatiivisen tekoälyn avulla, joka perustuu avoimeen USD- ja Nvidian nopeutettuihin kehityskehikkoihin, useammat teollisuudenalat voivat nyt kehittää sovelluksia teollisen suunnittelun ja suunnitteluprojektien visualisointiin sekä simulointiympäristöihin fysiikan tekoälyn ja robottien seuraavan aallon rakentamiseen. . Lisäksi uusi USD-liitin yhdistää robotiikan ja teollisen simulaation dataformaatit ja kehittäjätyökalut, jolloin käyttäjät voivat suoratoistaa suuria, täysin Nvidia RTX -sädejäljittyjä tietojoukkoja Apple Vision Prohon.

Lyhyesti sanottuna USD:n käyttöönotto Nvidia NIM:n kautta, jonka avulla voimme paremmin ymmärtää fyysistä maailmaa ja rakentaa virtuaalisia maailmoja suurten mallien avulla, on erittäin arvokas voimavara.digitaalista omaisuutta . Esimerkiksi vuonna 2019 Notre Damen katedraali Pariisissa, Ranskassa, kärsi vakavasta tulipalosta, ja suuret alueet kirkosta tuhoutuivat. Onneksi Ubisoftin pelisuunnittelijat ovat vierailleet tässä rakennuksessa lukemattomia kertoja, tutkineet sen rakennetta, saaneet päätökseen Notre Damen digitaalisen restauroinnin ja luoneet Notre Damen uudelleen 3A-pelissä "Assassin's Creed: Unity". Kaikki yksityiskohdat ovat myös tuoneet paljon apua Notren entisöintiin. Dame de Paris. Tuolloin suunnittelijoiden ja historioitsijoiden kopiointi kesti kaksi vuotta, mutta tämän tekniikan käyttöönoton myötä voimme nopeuttaa digitaalisten kopioiden kopiointia suuressa mittakaavassa tulevaisuudessa ja käyttää tekoälyä fysiikan ymmärtämiseen ja toistamiseen hienostuneemmassa muodossa. tavalla.

Toisessa esimerkissä suunnittelijat rakentavat peruskolmiulotteisia kohtauksia Omniverseen ja käyttävät näitä kohtauksia generatiivisen tekoälyn säätämiseen hallittavan ja yhteistyöhön perustuvan sisällönluontiprosessin saavuttamiseksi. Esimerkiksi WPP ja The Coca-Cola Company ottivat ensimmäisenä käyttöön tämän työnkulun laajentaakseen maailmanlaajuisia mainoskampanjoitaan.

Nvidia ilmoitti myös useiden uusien NIM-mikropalveluiden, kuten USD Layoutin, USD Smart Materialin ja FDB Mesh Generationin, tulevasta lanseerauksesta kehittäjien sovellusominaisuuksien ja tehokkuuden parantamiseksi avoimella USD-alustalla.

Tällä kertaa NVIDIA Research osallistui konferenssiin yli 20 artikkelilla jakaen innovatiivisia tuloksia synteettisten datageneraattoreiden ja käänteisen renderöintityökalujen kehittämisen edistämisestä, joista kaksi voitti teknisen parhaan paperin palkinnon. Tänä vuonna julkaistu tutkimus osoittaa senTekoäly tekee simulointiominaisuuksista entistä parempia parantamalla kuvanlaatua ja avaamalla uusia tapoja 3D-esitystä varten ;Myös parannetut synteettiset datageneraattorit ja enemmän parantavat tekoälyn tasoa. Nämä tutkimukset esittelevät Nvidian uusimpia tekoälyn ja simuloinnin edistysaskeleita ja innovaatioita.

Nvidia sanoo, että suunnittelijoilla ja taiteilijoilla on nyt uusia tapoja parantaa tuottavuuttaan käyttämällä generatiivista tekoälyä, joka on koulutettu sallittujen tietojen perusteella. Esimerkiksi Shutterstock (amerikkalainen kuvatoimittaja) julkaisi kaupallisen beta-version generatiivisesta 3D-palvelustaan. Sen avulla tekijät voivat nopeasti prototyyppiä 3D-resursseja ja luoda 360 HDRi-taustat valaisemaan kohtauksia käyttämällä vain teksti- tai kuvakehotteita, ja Getty Images (Yhdysvaltalainen valokuvapörssiyhtiö) nopeuttaa luovaa tekoälypalveluaan nopeuttaakseen kuvien luomista. Nämä palvelut, jotka perustuvat Nvidia Edifyyn, multimodaaliseen generatiiviseen tekoälyarkkitehtuuriin, kaksinkertaistavat nopeuden uusilla malleilla, parantavat kuvanlaatua ja nopeaa tarkkuutta sekä antavat käyttäjille mahdollisuuden hallita kameran asetuksia, kuten syväterävyyttä tai tarkennusta. Käyttäjät voivat luoda neljä kuvaa noin kuudessa sekunnissa ja skaalata ne 4K-resoluutioon.

Johtopäätös

Kaikissa tärkeissä tilaisuuksissa, joissa Huang esiintyy, hän käyttää aina nahkatakkia ja kuvailee maailmalle tekoälyn tuomaa jännittävää tulevaisuutta.

Koemme myös NVIDIA:n kasvua ja näemme NVIDIAa askel askeleelta pelin GPU-jättinä AI-sirun yliherraksi, minkä jälkeen NVIDIA on täynnä kunnianhimoa ja toistuu nopeasti AI-teknologia-aallon kärjessä.

Ohjelmoitavasta varjostetusta GPU:sta, CUDA-kiihdytetystä tietojenkäsittelystä, Nvidia Omniversen ja generatiivisten AI NIM -mikropalvelujen lanseeraukseen, 3D-mallinnuksen, robottisimuloinnin ja digitaalisen kaksoisteknologian kehittämisen edistämiseen, se tarkoittaa myös, että tekoälyn uusi innovaatiokierros. teollisuus on tulossa.

Koska suurilla yrityksillä on kuitenkin enemmän resursseja, mukaan lukien pääomaa, teknologiaa ja työvoimaa, ne voivat ottaa käyttöön ja ottaa käyttöön kehittyneitä teknologioita, kuten Nvidia NIM:ää, nopeammin. Rajallisten resurssien vuoksi pienillä ja keskisuurilla yrityksillä voi olla vaikeuksia pysyä teknologian kehityksen tahdissa. Yhdessä kykyjen teknisen tason erojen kanssa, johtaako se lisää teknologista eriarvoisuutta tulevaisuudessa?

Ihmiskunnan ihanteellinen tekoäly on auttaa ihmisiä vapauttamaan kätensä ja työvoimansa ja tuomaan tuottavuutta lisäävän maailman. Mutta kun tuottavuutta ja tuotantovälineitä hallitsee pieni joukko ihmisiä, laukaiseeko se syvemmän kriisin? Nämä ovat kaikki kysymyksiä, joita meidän on mietittävä.

uutiset

NVIDIAn "AI Box" päivittää ja julkaisee ohjelmistoja ja palveluita, ja Jen-Hsun Huang luo digitaalisen kopion fyysisestä maailmasta

Nvidia NIM -päivitys: sekä siunaus että haaste

Opeta tekoäly ajattelemaan 3D:ssä ja rakentamaan virtuaalista fyysistä maailmaa

Johtopäätös

Johdanto

yhteystietoni