notizia

L'"AI Box" di NVIDIA aggiorna e rilascia software e servizi e Jen-Hsun Huang crea una copia digitale del mondo fisico

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Testo/Tencent Technology Li Haidan Editor/Guo Xiaojing

Il 30 luglio, ora di Pechino, NVIDIA (nota anche come NVIDIA) ha presentato molti dei suoi ultimi sviluppi nei campi del rendering, della simulazione e dell'intelligenza artificiale generativa al SIGGRAPH 2024, una conferenza di computer grafica tenutasi a Denver, negli Stati Uniti.

Al SIGGRAPH dello scorso anno, NVIDIA ha lanciato le schede grafiche GH200, L40S e ChatUSD. Il protagonista di quest’anno è la nuova carta vincente di NVIDIA nell’era dell’intelligenza artificiale generativa——Nuovo aggiornamento "Nvidia NIM".e applicare l’intelligenza artificiale generativa all’USD (descrizione universale della scena) tramite NIM, ampliando le possibilità dell’intelligenza artificiale nel mondo 3D.

Aggiornamento NIM di Nvidia: sia una benedizione che una sfida

Nvidia ha annunciato che Nvidia NIM raggiunge un'ulteriore ottimizzazione e standardizza la complessa implementazione dei modelli AI. NIM è una parte fondamentale del layout AI di NVIDIA. Huang Renxun ha più volte elogiato l'innovazione portata da NIM, definendola "AI-in-a-Box, essenzialmente è l'intelligenza artificiale in una scatola。”

Questo aggiornamento consolida senza dubbio la posizione di leadership di Nvidia nel campo dell'intelligenza artificiale e diventa una parte importante del suo fossato tecnologico.

CUDA è da tempo considerato un fattore chiave nella leadership di Nvidia nel campo delle GPU. Con il supporto di CUDA, la GPU si è trasformata da un singolo processore grafico in un dispositivo di calcolo parallelo per uso generale, rendendo possibile lo sviluppo dell'intelligenza artificiale. Tuttavia, sebbene l’ecosistema software di Nvidia sia molto ricco, questi sistemi frammentati sono ancora troppo complessi e difficili da padroneggiare per i settori tradizionali che non dispongono di capacità di sviluppo dell’intelligenza artificiale di base.

Per risolvere questo problema, nel marzo di quest'anno, Nvidia ha lanciato alla conferenza GTC i microservizi cloud-native NIM (Nvidia Inference Microservices), integrando tutto il software sviluppato negli ultimi anni per semplificare e accelerare l'implementazione delle applicazioni AI. NIM può utilizzare modelli come "contenitori" ottimizzati che possono essere distribuiti nel cloud, nel data center o nella workstation, consentendo agli sviluppatori di completare il lavoro in pochi minuti, ad esempio creando facilmente applicazioni di intelligenza artificiale generativa per copiloti, chatbot, ecc.

Fino ad ora, l'ecosistema NIM di Nvidia ha fornito una serie di modelli AI pre-addestrati.Lo ha annunciato Nvidia, aiutando gli sviluppatori ad accelerare lo sviluppo e la distribuzione delle applicazioni in più aree e concentrandosi su aree diverse (come la comprensione,uomo digitale, sviluppo 3D, robotica e biologia digitale) modelli di IA specifici disponibili:

Nella direzione della comprensione, NIM può utilizzare Llama 3.1 e NeMo Retriever per migliorare le capacità di elaborazione dei dati di testo; nella direzione degli esseri umani digitali, fornisce modelli come Parakeet ASR e FastPitch HiFiGAN, che supportano la sintesi vocale ad alta fedeltà e la sintesi vocale automatica. riconoscimento vocale per creare assistenti virtuali e esseri umani digitali Fornisce strumenti potenti;

In termini di sviluppo 3D, modelli come USD Code e USD Search semplificano la creazione e il funzionamento di scene 3D, aiutando gli sviluppatori a costruire gemelli digitali e mondi virtuali in modo più efficiente;

Nella direzione dell'incarnazione dei robot, NVIDIA ha lanciato i modelli MimicGen e Robocasa. Accelera lo sviluppo e l'applicazione della robotica generando dati di movimento sintetici e ambienti di simulazione. MimicGen NIM può generare dati di movimento sintetici basati su dati operativi remoti registrati da dispositivi di elaborazione spaziale come Apple Vision Pro. Robocasa NIM genera attività robotiche e ambienti pronti per la simulazione in OpenUSD, un framework universale per lo sviluppo e la collaborazione nel mondo 3D.

Modelli come DiffDock ed ESMFold nel campo della biologia digitale forniscono soluzioni avanzate nella scoperta di farmaci e nella previsione del ripiegamento delle proteine, promuovendo il progresso della ricerca biomedica e così via.

Inoltre, Nvidia ha annunciato che anche la piattaforma di inferenza come servizio Hugging Face è alimentata da Nvidia NIM e funziona nel cloud.

Integrando questi modelli versatili, l'ecosistema di Nvidia non solo migliora l'efficienza dello sviluppo dell'intelligenza artificiale, ma fornisce anche strumenti e soluzioni innovativi. Tuttavia, i numerosi aggiornamenti del NIM Nvidia rappresentano effettivamente una "buona notizia" per l'industria. Ma d’altro canto comporta anche molte sfide per i programmatori.

Nvidia NIM semplifica notevolmente il processo di sviluppo e implementazione dei modelli IA fornendo modelli IA pre-addestrati e API standardizzate. Questo è davvero un grande vantaggio per gli sviluppatori, ma significa anche opportunità di lavoro per i programmatori ordinari in futuro ?Dopotutto, le aziende possono utilizzare meno personale tecnico per completare lo stesso lavoro, poiché queste attività sono state completate in anticipo da NIM e i programmatori ordinari potrebbero non avere più bisogno di eseguire complessi lavori di formazione e ottimizzazione dei modelli.

Insegna all'intelligenza artificiale a pensare in 3D e a costruire un mondo fisico virtuale

NVIDIA ha inoltre dimostrato l'applicazione dell'intelligenza artificiale generativa sulle piattaforme aperte USD e Omniverse alla conferenza SIGGRAPH.

Nvidia ha annunciato di aver costruito il primo modello di intelligenza artificiale generativa al mondo in grado di comprendere il linguaggio, la geometria, i materiali, la fisica e lo spazio OpenUSD (Universal Scene Description) e di aver confezionato questi modelli come microservizi Nvidia NIM.Attualmente, sono disponibili tre NIM per l'anteprima nel catalogo API di Nvidia: USD Code, che risponde a domande aperte sulla conoscenza di USD e genera codice USD Python aperto, che consente agli sviluppatori di eseguire ricerche nel vasto ambiente aperto di USD 3D utilizzando il linguaggio naturale o l'input di immagini e database di immagini; USD Validate, che controlla la compatibilità dei file caricati con le versioni USD aperte e genera immagini con tracciamento del percorso completamente renderizzate RTX utilizzando l'API Omniverse Cloud.

Nvidia ha affermato che con il miglioramento e l’accessibilità di OpenUSD da parte dei microservizi NIM di Nvidia, tutti i ceti sociali potranno costruire in futuro mondi virtuali e gemelli digitali basati sulla fisica. Con la nuova intelligenza artificiale generativa basata su USD aperti e framework di sviluppo accelerato di Nvidia costruiti sulla piattaforma Nvidia Omniverse, più settori possono ora sviluppare applicazioni per la visualizzazione di progetti di progettazione industriale e ingegneria, nonché per ambienti di simulazione per costruire la prossima ondata di intelligenza artificiale fisica e robot . Inoltre, un nuovo connettore USD collega i formati di dati di robotica e simulazione industriale e gli strumenti di sviluppo, consentendo agli utenti di trasmettere in streaming set di dati su larga scala, completamente ray-tracing Nvidia RTX, ad Apple Vision Pro.

In breve, introdurre USD tramite Nvidia NIM per comprendere meglio il mondo fisico e costruire mondi virtuali attraverso modelli di grandi dimensioni è una risorsa molto preziosa.risorse digitali . Ad esempio, nel 2019, la cattedrale di Notre Dame a Parigi, in Francia, ha subito un grave incendio e vaste aree della chiesa sono state distrutte. Fortunatamente, i game designer di Ubisoft hanno visitato questo edificio innumerevoli volte, ne hanno studiato la struttura, hanno completato il restauro digitale di Notre Dame e hanno ricreato Notre Dame nel gioco 3A "Assassin's Creed: Unity". Tutti i dettagli hanno anche aiutato molto il restauro di Notre Signora di Parigi. A quel tempo, designer e storici impiegavano due anni per riprodurli, ma con l’introduzione di questa tecnologia, in futuro potremo accelerare la riproduzione di copie digitali su larga scala e utilizzare l’intelligenza artificiale per comprendere e riprodurre la fisica in un modo più modo raffinato.

Per fare un altro esempio, i designer costruiscono scene tridimensionali di base in Omniverse e utilizzano queste scene per regolare l'intelligenza artificiale generativa per ottenere un processo di creazione di contenuti controllabile e collaborativo. Ad esempio, WPP e The Coca-Cola Company sono stati i primi ad adottare questo flusso di lavoro per espandere le proprie campagne pubblicitarie globali.

Nvidia ha inoltre annunciato l'imminente lancio di numerosi nuovi microservizi NIM, tra cui USD Layout, USD Smart Material e FDB Mesh Generation, per migliorare ulteriormente le capacità e l'efficienza delle applicazioni degli sviluppatori sulla piattaforma aperta USD.

Questa volta NVIDIA Research ha partecipato alla conferenza con più di 20 articoli, condividendo risultati innovativi relativi alla promozione dello sviluppo di generatori di dati sintetici e strumenti di rendering inverso, due dei quali hanno vinto il Technical Best Paper Award. La ricerca presentata quest’anno lo dimostraL'intelligenza artificiale migliora ulteriormente le capacità di simulazione migliorando la qualità dell'immagine e sbloccando nuovi modi di rappresentazione 3D ;Inoltre, generatori di dati sintetici migliorati e altro ancora migliorano il livello di intelligenza artificiale. Questi studi mostrano gli ultimi progressi e innovazioni di Nvidia nell’intelligenza artificiale e nella simulazione.

Nvidia afferma che designer e artisti ora hanno nuovi modi per migliorare la propria produttività utilizzando l’intelligenza artificiale generativa addestrata su dati autorizzati. Ad esempio, Shutterstock (fornitore di immagini americano) ha lanciato una versione beta commerciale del suo servizio 3D generativo. Consente ai creatori di prototipare rapidamente risorse 3D e generare sfondi HDRi a 360° per illuminare le scene utilizzando solo suggerimenti di testo o immagini; e Getty Images (società statunitense di scambio di foto) ha accelerato il suo servizio di intelligenza artificiale generativa per rendere la generazione di immagini più veloce. Raddoppiato per migliorare la qualità dell'output. Basati su Nvidia Edify, l’architettura AI generativa multimodale, questi servizi raddoppiano la velocità con i nuovi modelli, migliorano la qualità dell’immagine e la precisione immediata e consentono agli utenti di controllare le impostazioni della fotocamera come profondità di campo o messa a fuoco. Gli utenti possono generare quattro immagini in circa sei secondi e convertirle alla risoluzione 4K.

Conclusione

In ogni occasione importante in cui Huang appare, indossa sempre una giacca di pelle e descrive al mondo l'entusiasmante futuro portato dall'intelligenza artificiale.

Stiamo anche sperimentando la crescita di NVIDIA, assistendo passo dopo passo a NVIDIA che si è trasformato da gigante delle GPU da gioco a signore dei chip AI, e poi in un layout full-stack di software e hardware AI verticale e orizzontale. NVIDIA è piena di ambizioni e itera rapidamente in prima linea nell’ondata tecnologica dell’intelligenza artificiale.

Dalla GPU di shading programmabile, al calcolo accelerato CUDA, al lancio di Nvidia Omniverse e dei microservizi NIM di intelligenza artificiale generativa, alla promozione dello sviluppo della modellazione 3D, della simulazione robot e della tecnologia dei gemelli digitali, significa anche che un nuovo ciclo di innovazione nell'intelligenza artificiale l'industria sta arrivando.

Tuttavia, poiché le grandi aziende dispongono di maggiori risorse, tra cui capitale, tecnologia e manodopera, sono in grado di adottare e implementare tecnologie avanzate come Nvidia NIM più rapidamente. A causa delle risorse limitate, le piccole e medie imprese potrebbero avere difficoltà a tenere il passo con il ritmo dello sviluppo tecnologico. Questo, unito alle differenze nei livelli tecnici dei talenti, porterà a una maggiore disuguaglianza tecnologica in futuro?

L’intelligenza artificiale ideale dell’umanità è aiutare gli esseri umani a liberare le proprie mani e il proprio lavoro e creare un mondo con una maggiore produttività. Ma quando la produttività e i mezzi di produzione saranno controllati da un piccolo numero di persone, si scatenerà una crisi più profonda? Queste sono tutte domande a cui dobbiamo pensare.