notizia

la nuova azione ecologica di nvidia punta sul binario industriale

2024-09-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

il profeta dell'anatra dell'impianto idraulico di spring river. le azioni attuali di nvidia stanno rivelando alcune nuove tendenze.

testo |. zhou luping e zhao yanqiu

editore |. niu hui

non molto tempo fa, nvidia ha lanciato un servizio di intelligenza artificiale generativa per la modellazione 3d, che ha attirato l’attenzione diffusa nel settore. se diciamo che la precedente intelligenza artificiale generativa riguardava più la generazione di contenuti nel mondo bidimensionale come testo, immagini e video. bene, questa volta nvidia sta utilizzando l’intelligenza artificiale generativa per aiutare le aziende a creare risorse 3d, accelerare lo sviluppo dei gemelli digitali e dei settori della simulazione e anche accelerare l’applicazione dell’intelligenza artificiale nel mondo fisico.

01

il termine “cuda native” si rivolge all’industria

il profeta dell'anatra dell'impianto idraulico di spring river. in qualità di leader mondiale nel calcolo accelerato, le azioni di nvidia stanno rivelando alcune nuove tendenze.

il fondatore e ceo di nvidia jensen huang, in due conversazioni al siggraph nel 2024, ha concentrato le sue ultime intuizioni sull'intelligenza artificiale su come l'intelligenza artificiale generativa e l'elaborazione accelerata possono cambiare la produzione e altri settori attraverso la visualizzazione. durante la conferenza nvidia ha inoltre lanciato una nuova serie di microservizi nim.

la conferenza siggraph è il luogo in cui discutere le ultime innovazioni nella computer grafica. nvidia ha rilasciato modelli di intelligenza artificiale generativa e microservizi nim adatti per openusd, geometria, fisica, materiali, ecc. openusd è un software open source per lo scambio interno di dati nelle scene 3d ed è gradualmente diventato uno standard in molti settori come la visione 3d, l'architettura, il design e la produzione.

con questi modelli e servizi, gli sviluppatori possono accelerare lo sviluppo di applicazioni nei settori manifatturiero, automobilistico, robotico e altri.

in due conversazioni davanti al caminetto, huang ha discusso dell'importanza di costruire gemelli digitali e mondi virtuali. ha affermato che l’industria sta migliorando l’efficienza e riducendo i costi costruendo gemelli digitali su larga scala su scala urbana. "ad esempio, l'intelligenza artificiale può essere addestrata in questo mondo virtuale prima di essere implementata sui robot umanoidi di prossima generazione."

perché jensen huang si concentra sulla visualizzazione industriale, sui mondi virtuali o sui gemelli digitali? perché nvidia ha lanciato proprio in questo momento un nuovo microservizio nim nell'ecosistema cuda?

immagine dal sito ufficiale nvidia

come ha affermato il rev. lebaredian, vicepresidente di omniverse e simulation technology di nvidia, l'ondata di intelligenza artificiale generativa nell'industria pesante è arrivata. digital intelligence frontier ha inoltre appreso che l’intelligenza artificiale generativa si sta spostando da alcuni scenari semplici a complessi collegamenti di produzione. l’ecologia tecnologica sopra menzionata può accelerare questo processo.

“fino a poco tempo fa, i principali utenti del mondo digitale erano le industrie creative; ora, con le funzionalità migliorate e l'accessibilità apportate a openusd dai microservizi nvidia nim, le industrie possono creare mondi virtuali basati sulla fisica e gemelli digitali. ondata di boom della tecnologia ia", ha affermato il reverendo lebaredian.

nel settore automobilistico, le case automobilistiche nazionali stanno “lanciando” i gemelli digitali. "tesla sta per rilasciare recentemente la versione fsd 12.5 e sta anche promuovendo attivamente l'implementazione della fsd in cina." un esperto di intelligenza artificiale di una grande azienda automobilistica cinese ha dichiarato a digital intelligence frontier: "tesla considera la simulazione un obiettivo strategico e noi lo stiamo facendo". costruisci anche un metaverso e risolvi il problema a circuito chiuso dei dati sulla guida autonoma. "in precedenza, era difficile e costoso per le case automobilistiche raccogliere dati "sonda fantasma". ora, le case automobilistiche possono risolvere l’addestramento degli scenari a coda lunga nell’ambiente di simulazione del metaverso.

nel settore dei robot, un'azienda di robot per l'ispezione energetica sta addestrando l'intelligenza artificiale attraverso un ambiente di simulazione in modo che il robot possa percepire l'ambiente complesso e lo spazio fisico nella centrale elettrica in tempo reale, pianificare il percorso di movimento e visualizzare migliaia di metri su dispositivi diversi lungo la strada.

la progettazione architettonica è un compito complesso e dispendioso in termini di tempo e i modelli 3d nella progettazione architettonica sono un risultato essenziale. per alcune forme geometriche complesse e strutture di forma speciale, la ricostruzione dei modelli 3d è più difficile. ora, alcune società di design stanno collaborando con aziende di intelligenza artificiale per provare a generare modelli solo con alcune immagini, schizzi e testo. si possono dare anche materiali diversi al progetto architettonico per migliorarne il design.

nell'industria siderurgica, l'analisi metallografica è un metodo che consente di osservare difetti e strutture all'interno di sezioni di materiale attraverso un microscopio per comprendere le prestazioni complessive del materiale di base. il lavoro manuale tradizionale è meno efficiente e fa molto affidamento sull’esperienza umana. ora, un appello comune a molte aziende siderurgiche è quello di utilizzare la base di conoscenze del passato per condurre un’analisi completa dei materiali formando l’intelligenza artificiale professionale.

attraverso i nuovi microservizi nim, nvidia consente alle aziende applicative di richiamare direttamente i servizi senza partire da zero, per poi combinarli con i propri dati per implementare rapidamente un'applicazione. pertanto, alcune aziende lo descrivono come "nativo cuda".

mentre l’ia generativa si sposta da scenari marginali a scenari più profondi, huang renxun ha affermato: “tutti avranno un assistente ai”. allo stesso tempo, l’integrazione dell’intelligenza artificiale e della tecnologia delle immagini si sta approfondendo. scene per la visualizzazione industriale", ha affermato huang. "l'intelligenza artificiale generativa rivoluzionerà anche il campo delle auto robotiche a guida autonoma".

02

quale immaginazione porta con sé il nuovo microservizio nim?

dietro le applicazioni industriali sopra menzionate, si basano tutte sull'applicazione della tecnologia di modellazione e simulazione 3d.

la costruzione di contenuti e scene 3d è sempre stata un grattacapo in passato. coinvolge catene e processi complessi, come modellazione, colorazione, animazione, illuminazione, rendering, ecc.

negli ultimi decenni, gli studi di animazione, di effetti visivi e di videogiochi hanno cercato di migliorare l'interoperabilità tra i vari strumenti nei loro progetti, ma con successo limitato. lo spostamento dei dati da una posizione a un'altra è complicato, quindi lo studio ha creato flussi di lavoro complessi per gestire l'interoperabilità dei dati.

inoltre, oltre alla separazione di sistemi e strumenti, il tradizionale processo di produzione 3d è una collaborazione lineare, che comporta la conversione e la modifica del formato da parte di più reparti e personale, il che richiede tempo e manodopera.

openusd è un framework universale per lo scambio di dati 3d open source. è stato fondato nel 2023 sotto la guida di nvidia, pixar, apple e altri produttori. può costruire mondi virtuali attraverso l'interoperabilità tra strumenti software e tipi di dati e ha un'interoperabilità e compatibilità estremamente elevate risolve molte sfide legate al flusso di lavoro e alla complessità durante la creazione di scene 3d.

openusd è anche il fondamento della piattaforma nvidia omniverse. in una conversazione con uno scrittore senior della rivista wired, huang renxun una volta disse: openusd è il primo formato a integrare l'espressione multimodale di quasi tutti gli strumenti. idealmente, nel tempo, è possibile inserirvi quasi tutti i formati, consentendo a tutti di collaborare e facendo durare il contenuto per sempre. l’intelligenza artificiale generativa aiuterà sicuramente omniverse a produrre risultati di simulazione migliori.

il microservizio nim lanciato da nvidia questa volta per lo sviluppo openusd è anche il primo modello di intelligenza artificiale generativa al mondo per lo sviluppo openusd. integra funzionalità di intelligenza artificiale generativa nel flusso di lavoro usd sotto forma di microservizi nim, abbassando significativamente la soglia per l'utilizzo di openusd da parte degli utenti. allo stesso tempo, nvidia ha anche rilasciato una serie di nuovi connettori usd adatti ai formati di dati dei robot e allo streaming apple vision pro.

immagine dal sito ufficiale nvidia

attualmente sono stati rilasciati tre microservizi nim: uno è il microservizio nim usd code, che può rispondere a domande openusd di buon senso e generare automaticamente codice python in base a istruzioni di testo.

il secondo è il microservizio usd search nim, che consente agli sviluppatori di utilizzare il linguaggio naturale o l’input di immagini per effettuare ricerche in enormi database openusd, 3d e di immagini, migliorando notevolmente la velocità di recupero dei processi aziendali e di elaborazione dei materiali.

il terzo è il microservizio usd validate nim, che può verificare la compatibilità dei file caricati con la versione di rilascio openusd e generare immagini di tracciamento del percorso di rendering rtx completamente guidate dall'api nvidia omniverse cloud.

oltre ai microservizi nim nativi forniti da nvidia, i partner dell'ecosistema stanno anche creando numerosi modelli di intelligenza artificiale popolari basati su questi microservizi per fornire agli utenti l'ottimizzazione dell'inferenza.

shutterstock, una piattaforma di contenuti creativi di fama mondiale, ha lanciato un nuovo servizio di conversione da testo a 3d basato sull'ultima versione del modello di generazione visiva edify di nvidia, che include la realizzazione di prototipi 3d o il riempimento di ambienti virtuali.

ad esempio, creare un’illuminazione accuratamente riflettente per le scene virtuali è un compito complesso. in passato, i creatori dovevano utilizzare costose attrezzature fotografiche a 360 gradi, recarsi sul luogo delle riprese per creare sfondi da zero o cercare contenuti simili in un enorme database.

ma ora, attraverso i servizi di generazione 3d, gli utenti devono solo descrivere l'ambiente specifico di cui hanno bisogno con testo o immagini e possono ottenere immagini panoramiche ad alta gamma dinamica (360 hdri) con una risoluzione massima di 16k. inoltre, queste scene e componenti possono essere cambiati rapidamente, ad esempio facendo apparire un'auto sportiva nel deserto, una spiaggia tropicale o una tortuosa strada di montagna.

oltre a creare l'illuminazione, i creatori possono anche aggiungere rapidamente vari materiali di rendering, come cemento, legno o pelle, per creare le proprie risorse 3d. inoltre, le risorse 3d generate con l'aiuto dell'intelligenza artificiale possono anche essere modificate in qualsiasi momento e fornite nei vari formati di file più diffusi.

il modello edify ai di nvidia aiuta inoltre getty images a consentire agli artisti di controllare a piacimento la composizione e lo stile delle immagini. come far galleggiare un pallone da spiaggia rosso sopra una foto perfetta della barriera corallina. inoltre, i creatori possono anche utilizzare i dati aziendali per mettere a punto il modello di base per generare immagini che si adattino allo stile creativo di un marchio specifico.

questi microservizi e strumenti modello stanno accelerando notevolmente la creazione di risorse 3d da parte dei marchi e renderanno lo sviluppo dei gemelli digitali più popolare e conveniente.

03

le aziende pioniere hanno iniziato a provare

man mano che la creazione di contenuti e risorse 3d diventa più comoda e accurata, settori come l’industria, la guida autonoma, l’ingegneria e la robotica stanno godendo dei dividendi tecnologici portati dall’intelligenza artificiale generativa. soprattutto nei settori creativo manifatturiero e pubblicitario, un gruppo di early adopter sta accelerando attivamente l'applicazione dei gemelli digitali e della simulazione attraverso la piattaforma nvidia omniverse.

coca-cola è il primo marchio a utilizzare l’intelligenza artificiale generativa fornita da omniverse e i microservizi nim negli scenari di marketing. in un video dimostrativo, semplicemente "costruiscimi un tavolo con tacos e salsa nella luce del mattino" viene semplicemente digitato nel sistema in linguaggio naturale.

presto, il microservizio nim usd search potrà cercare le risorse 3d corrispondenti nell'enorme libreria di risorse 3d e richiamarle rapidamente tramite l'api usd code nim può combinare questi modelli in scene e gli sviluppatori possono ottenerli inserendo istruzioni the python il codice utilizzato per creare nuovi mondi 3d migliora notevolmente le loro capacità creative. attraverso l’intelligenza artificiale generativa, coca-cola può personalizzare un’immagine personalizzata in più di 100 mercati in tutto il mondo per ottenere un marketing localizzato.

immagine dal sito ufficiale nvidia

in qualità di fornitore di servizi pubblicitari dietro coca-cola, wpp ha lanciato appositamente un sistema operativo di marketing intelligente. il sistema sfrutta la piattaforma di sviluppo omniverse e openusd per semplificare e automatizzare la creazione di testo, immagini e video multilingue, semplificando il processo di creazione di contenuti per inserzionisti e operatori di marketing. servendo i clienti attraverso l'intelligenza artificiale generativa, wpp trasforma in realtà idee folli.

come ha affermato il chief technology officer di wpp: “la bellezza di queste innovazioni è che sono altamente compatibili con il nostro modo di lavorare e sfruttano appieno gli standard aperti. ciò non solo accelera il lavoro futuro, ma ci consente anche di continuare a svilupparlo ed espandere i nostri precedenti investimenti in standard come openusd. utilizzando i microservizi nvidia nim con nvidia omniverse, siamo in grado di lanciare nuovi strumenti di produzione innovativi più velocemente che mai con aziende come the coca-cola company.

essendo il più grande oem di elettronica di consumo al mondo, foxconn ha costruito una fabbrica virtuale di gemelli digitali per un nuovo stabilimento in messico. gli ingegneri possono definire processi e addestrare i robot nell'ambiente virtuale, migliorando così il livello di automazione della fabbrica e l'efficienza produttiva e risparmiando tempo e costi ed energia.

foxconn ha inoltre utilizzato la piattaforma omniverse dietro le quinte per costruire il suo gemello digitale, integrando tutti gli elementi cad 3d nella stessa fabbrica virtuale e addestrando i robot utilizzando nvidia isaac sim, una piattaforma di simulazione robotica scalabile sviluppata su omniverse e openusd bring fisicamente accurata e una presentazione visiva realistica al suo gemello digitale.

oltre a foxconn, aziende manifatturiere elettroniche tra cui delta electronics, mediatek e pegatron utilizzano nvidia ai e omniverse per costruire gemelli digitali di fabbrica.

il modello monovolume xpeng x9 di xpeng motors ha utilizzato la piattaforma omniverse nel processo di progettazione introducendo il flusso di lavoro di sviluppo del modello nel mondo virtuale, xpeng motors può evitare i colli di bottiglia dei flussi di lavoro tradizionali durante la progettazione di nuove auto.

ad esempio, da un lato, la piattaforma omniverse ha una forte interoperabilità, in modo che file e dati utilizzati per la modellazione industriale, il rendering e gli effetti speciali 3d non necessitino più di complicate conversioni, accelerando la comunicazione e la collaborazione tra i team di progettazione di xpeng motors; d'altro canto, xpeng motors utilizza le funzioni di rendering in tempo reale e ray tracing di omniverse per realizzare la visualizzazione istantanea del colore dell'auto e dei cambiamenti interni, rendendo l'effetto virtuale più realistico, aiutando a soddisfare le esigenze degli utenti e migliorando così l'esperienza del prodotto.

negli ultimi due anni, l’esplosione dell’intelligenza artificiale generativa ha attirato maggiore attenzione dal mondo esterno verso alcune applicazioni nel campo del toc e dell’ufficio collaborativo, ma ora anche il mondo fisico introdurrà una nuova ondata di esplosioni e opportunità.