2024-09-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
prophète de canard de plomberie de spring river. les actions actuelles de nvidia révèlent de nouvelles tendances.
texte zhou luping et zhao yanqiu
editeur | niu hui
il n'y a pas si longtemps, nvidia a lancé un service d'ia générative pour la modélisation 3d, qui a attiré une large attention dans l'industrie. si nous disons que l’ia générative précédente visait davantage à générer du contenu dans le monde bidimensionnel tel que du texte, des images et des vidéos. eh bien, cette fois, nvidia utilise l'ia générative pour aider les entreprises à créer des actifs 3d, à accélérer le développement des jumeaux numériques et des industries de simulation, ainsi qu'à accélérer l'application de l'ia dans le monde physique.
01
le « cuda natif » cible l'industrie
prophète de canard de plomberie de spring river. en tant que leader mondial du calcul accéléré, les actions de nvidia révèlent de nouvelles tendances.
le fondateur et pdg de nvidia, jensen huang, lors de deux conversations au coin du feu au siggraph en 2024, a concentré ses dernières idées sur l'ia sur la façon dont l'ia générative et l'informatique accélérée peuvent changer des secteurs tels que la fabrication grâce à la visualisation. nvidia a également lancé un nouvel ensemble de microservices nim lors de la conférence.
la conférence siggraph est le lieu idéal pour discuter des dernières innovations en matière d'infographie. nvidia a publié des modèles d'ia génératifs et des microservices nim adaptés à openusd, à la géométrie, à la physique, aux matériaux, etc. openusd est un logiciel open source pour l'échange de données internes dans les scènes 3d et est progressivement devenu un standard dans de nombreux secteurs tels que la vision 3d, l'architecture, la conception et la fabrication.
grâce à ces modèles et services, les développeurs peuvent accélérer le développement d'applications dans les secteurs de la fabrication, de l'automobile, de la robotique et d'autres secteurs.
au cours de deux conversations au coin du feu, huang a discuté de l’importance de créer des jumeaux numériques et des mondes virtuels. il a déclaré que l’industrie améliore son efficacité et réduit ses coûts en construisant des jumeaux numériques à grande échelle à l’échelle des villes. "par exemple, l'ia peut être entraînée dans ce monde virtuel avant d'être déployée sur des robots humanoïdes de nouvelle génération."
pourquoi jensen huang se concentre-t-il sur la visualisation industrielle, les mondes virtuels ou les jumeaux numériques ? pourquoi nvidia a-t-il lancé un nouveau microservice nim dans l'écosystème cuda à ce moment-là ?
photo du site officiel de nvidia
comme l'a déclaré le révérend lebaredian, vice-président d'omniverse et de la technologie de simulation chez nvidia, la vague de l'ia générative dans l'industrie lourde est arrivée. digital intelligence frontier a également appris que l’ia générative passe de quelques scénarios simples à des liens de production complexes. l’écologie technologique mentionnée ci-dessus peut accélérer ce processus.
"jusqu'à récemment, les principaux utilisateurs du monde numérique étaient les industries créatives ; désormais, grâce aux capacités et à l'accessibilité améliorées que les microservices nvidia nim apportent à openusd, les industries peuvent créer des mondes virtuels basés sur la physique et des jumeaux numériques pour cela. préparez-vous à une nouvelle vague. du boom de la technologie de l'ia", a déclaré le révérend lebaredian.
dans l’industrie automobile, les constructeurs automobiles nationaux « font rouler » des jumeaux numériques. "tesla est sur le point de publier récemment la version fsd 12.5 et promeut également activement la mise en œuvre de fsd en chine." un responsable de l'intelligence artificielle d'un grand constructeur automobile chinois a déclaré à digital intelligence frontier : "tesla considère la simulation comme un objectif stratégique, et nous le sommes. construisez également un métaverse et résolvez le problème en boucle fermée des données de conduite autonome. « auparavant, il était difficile et coûteux pour les constructeurs automobiles de collecter des données de « sonde fantôme ». désormais, les constructeurs automobiles peuvent résoudre la formation de scénarios à longue traîne dans l’environnement de simulation métaverse.
dans l'industrie de la robotique, une entreprise de robots d'inspection de puissance forme l'ia via un environnement de simulation afin que le robot puisse percevoir l'environnement complexe et l'espace physique de la centrale électrique en temps réel, planifier son itinéraire de déplacement et visualiser des milliers de mètres sur différents appareils. en cours de route.
la conception architecturale est une tâche complexe et chronophage, et les modèles 3d dans la conception architecturale sont un livrable essentiel. pour certaines formes géométriques complexes et structures de forme particulière, la reconstruction de modèles 3d est plus difficile. désormais, certaines sociétés de conception travaillent avec des sociétés d’ia pour tenter de générer des modèles contenant uniquement quelques images, croquis et textes. différents matériaux peuvent également être utilisés dans la conception architecturale pour améliorer la conception.
dans l'industrie sidérurgique, l'analyse métallographique est une méthode permettant d'examiner les défauts et les structures à l'intérieur de tranches de matériau à l'aide d'un microscope afin de comprendre les performances globales du matériau de base. le travail manuel traditionnel est moins efficace et repose fortement sur l’expérience humaine. aujourd’hui, un attrait commun de nombreuses entreprises sidérurgiques est d’utiliser la base de connaissances antérieure pour effectuer une analyse complète des matériaux en formant une ia professionnelle.
grâce aux nouveaux microservices nim, nvidia permet aux éditeurs d'applications d'appeler directement des services sans repartir de zéro, puis de les combiner avec leurs propres données pour mettre en œuvre rapidement une application. par conséquent, certaines entreprises décrivent cela comme « cuda natif ».
avec la mise en œuvre de l'ia générative depuis certains scénarios de pointe vers des scénarios plus profonds, huang renxun a déclaré : « tout le monde aura un assistant ia ». dans le même temps, l’intégration de l’ia et de la technologie de l’image s’approfondit. « presque tous les secteurs seront touchés par cette technologie, qu’il s’agisse de l’informatique scientifique pour mieux prédire la météo avec moins d’énergie, ou de la collaboration avec les créateurs pour générer des images, ou encore de la création virtuelle. scènes pour la visualisation industrielle", a déclaré huang. "l'ia générative révolutionnera également le domaine des voitures robotisées autonomes."
02
quelle imagination le nouveau microservice nim apporte-t-il ?
derrière les applications industrielles mentionnées ci-dessus, elles reposent toutes sur l’application de technologies de modélisation et de simulation 3d.
la construction de contenus et de scènes 3d a toujours été un casse-tête dans le passé. elle implique des chaînes et des processus complexes, tels que la modélisation, la coloration, l'animation, l'éclairage, le rendu, etc.
au cours des dernières décennies, les studios d’animation, d’effets visuels et de jeux ont tenté d’améliorer l’interopérabilité entre les différents outils de leurs pipelines, mais avec un succès limité. déplacer des données d'un emplacement à un autre est délicat, c'est pourquoi le studio a créé des flux de travail complexes pour gérer l'interopérabilité des données.
de plus, outre la séparation des systèmes et des outils, le processus de production 3d traditionnel est une collaboration linéaire, impliquant la conversion et la modification de formats par plusieurs départements et personnels, ce qui prend du temps et demande beaucoup de main d'œuvre.
openusd est un cadre d'échange de données 3d universel open source. il a été créé en 2023 sous la direction de nvidia, pixar, apple et d'autres fabricants. il peut créer des mondes virtuels grâce à l'interopérabilité entre les outils logiciels et les types de données et présente une interopérabilité et une compatibilité extrêmement élevées. il résout de nombreux problèmes de flux de travail et de complexité lors de la création de scènes 3d.
openusd est également le fondement de la plateforme nvidia omniverse. lors d'une conversation avec un rédacteur principal du magazine wired, huang renxun a déclaré un jour : openusd est le premier format à intégrer l'expression multimodale de presque tous les outils. idéalement, au fil du temps, on peut y intégrer presque n'importe quel format, permettant à tout le monde de collaborer et de faire durer le contenu pour toujours. l'ia générative aidera certainement omniverse à produire de meilleurs résultats de simulation.
le microservice nim lancé cette fois par nvidia pour le développement d'openusd est également le premier modèle d'ia générative au monde pour le développement d'openusd. il intègre des capacités d'ia générative dans le flux de travail usd sous la forme de microservices nim, abaissant considérablement le seuil d'utilisation d'openusd par les utilisateurs. dans le même temps, nvidia a également publié un certain nombre de nouveaux connecteurs usd adaptés aux formats de données des robots et au streaming apple vision pro.
photo du site officiel de nvidia
actuellement, trois microservices nim ont été publiés : le premier est le microservice usd code nim, qui peut répondre aux questions de bon sens d'openusd et générer automatiquement du code python basé sur des invites textuelles.
le second est le microservice usd search nim, qui permet aux développeurs d'utiliser le langage naturel ou la saisie d'images pour effectuer des recherches dans d'énormes bases de données openusd, 3d et d'images, améliorant ainsi considérablement la vitesse de récupération des processus d'entreprise et de traitement des matériaux.
le troisième est le microservice usd validate nim, qui peut vérifier la compatibilité des fichiers téléchargés avec la version openusd et générer des images de traçage de chemin de rendu rtx entièrement pilotées par l'api nvidia omniverse cloud.
en plus des microservices nim natifs fournis par nvidia, les partenaires de l'écosystème créent également plusieurs modèles d'ia populaires basés sur ces microservices pour fournir aux utilisateurs une optimisation des inférences.
shutterstock, une plateforme de contenu créatif de renommée mondiale, a lancé un nouveau service de conversion de texte en 3d basé sur la dernière version du modèle de génération visuelle edify de nvidia, comprenant la création de prototypes 3d ou le remplissage d'environnements virtuels.
par exemple, créer un éclairage réfléchissant avec précision pour des scènes virtuelles est une tâche complexe. dans le passé, les créateurs devaient utiliser un équipement de caméra à 360 degrés coûteux, se rendre sur le site de tournage pour créer l'arrière-plan à partir de zéro ou rechercher un contenu similaire dans une énorme base de données.
mais désormais, grâce aux services de génération 3d, les utilisateurs n'ont qu'à décrire l'environnement spécifique dont ils ont besoin avec du texte ou des images, et ils peuvent obtenir des images panoramiques à plage dynamique élevée (360 hdri) avec une résolution maximale de 16k. de plus, ces scènes et composants peuvent être rapidement modifiés, par exemple pour faire apparaître une voiture de sport dans le désert, sur une plage tropicale ou sur une route de montagne sinueuse.
en plus de créer de l'éclairage, les créateurs peuvent également ajouter rapidement divers matériaux de rendu, tels que le béton, le bois ou le cuir, pour créer leurs propres ressources 3d. de plus, les ressources 3d générées à l’aide de l’ia peuvent également être modifiées à tout moment et fournies dans divers formats de fichiers courants.
le modèle edify ai de nvidia aide également getty images à permettre aux artistes de contrôler à volonté la composition et le style des images. c'est comme faire flotter un ballon de plage rouge sur une photo parfaite de récif de corail. de plus, les créateurs peuvent également utiliser les données de l'entreprise pour affiner le modèle de base afin de générer des images adaptées au style créatif d'une marque spécifique.
ces microservices et outils de modélisation accélèrent considérablement la création d'actifs 3d par les marques et rendront le développement de jumeaux numériques plus populaire et plus pratique.
03
les entreprises pionnières ont commencé à essayer
à mesure que la création de contenu et d’actifs 3d devient plus pratique et plus précise, des secteurs tels que l’industrie, la conduite autonome, l’ingénierie et la robotique profitent des dividendes technologiques apportés par l’ia générative. en particulier dans les secteurs de la fabrication et de la création publicitaire, un groupe d'adoptants précoces accélère activement l'application des jumeaux numériques et de la simulation via la plateforme nvidia omniverse.
coca-cola est la première marque à utiliser l'ia générative fournie par les microservices omniverse et nim dans des scénarios marketing. dans une vidéo de démonstration, il suffit de saisir « construis-moi une table avec des tacos et de la salsa à la lumière du matin » dans le système en langage naturel.
bientôt, le microservice usd search nim pourra rechercher les ressources 3d correspondantes dans l'immense bibliothèque de ressources 3d et les appeler rapidement via l'api. le code usd nim peut combiner ces modèles en scènes et les développeurs peuvent les obtenir en saisissant des invites. le code utilisé pour créer de nouveaux mondes 3d améliore considérablement leurs capacités créatives. grâce à l'ia générative, coca-cola peut personnaliser une image personnalisée sur plus de 100 marchés à travers le monde pour réaliser un marketing localisé.
photo du site officiel de nvidia
en tant que fournisseur de services publicitaires derrière coca-cola, wpp a spécialement lancé un système d'exploitation marketing intelligent. le système exploite la plateforme de développement omniverse et openusd pour rationaliser et automatiser la création de textes, d'images et de vidéos multilingues, simplifiant ainsi le processus de création de contenu pour les annonceurs et les spécialistes du marketing. en servant ses clients grâce à l’ia générative, wpp concrétise des idées folles.
comme l'a déclaré le directeur de la technologie de wpp : « la beauté de ces innovations réside dans le fait qu'elles sont hautement compatibles avec notre façon de travailler et qu'elles tirent pleinement parti des normes ouvertes. non seulement cela accélère les travaux futurs, mais cela nous permet également de continuer à bâtir sur cette base. et développons nos précédents investissements dans des normes telles qu'openusd. en utilisant les microservices nvidia nim avec nvidia omniverse, nous sommes en mesure de lancer de nouveaux outils de production innovants plus rapidement que jamais avec des sociétés comme the coca-cola company.
en tant que plus grand équipementier d'électronique grand public au monde, foxconn a construit une usine jumelle numérique virtuelle pour une nouvelle usine au mexique. les ingénieurs peuvent définir des processus et former des robots dans l'environnement virtuel, améliorant ainsi le niveau d'automatisation et l'efficacité de la production de l'usine et économisant du temps et des coûts. et de l'énergie.
foxconn a également utilisé la plate-forme omniverse en coulisses pour créer son jumeau numérique, intégrant tous les éléments de cao 3d dans la même usine virtuelle et y formant les robots à l'aide de nvidia isaac sim, une plate-forme de simulation de robot évolutive développée sur omniverse et openusd bring physiquement précise. et une présentation visuelle réaliste à son jumeau numérique.
outre foxconn, des sociétés de fabrication électronique, notamment delta electronics, mediatek et pegatron, utilisent nvidia ai et omniverse pour créer des jumeaux numériques en usine.
le modèle mpv xpeng x9 de xpeng motors a utilisé la plateforme omniverse dans le processus de conception. en introduisant le flux de développement de modèles dans le monde virtuel, xpeng motors peut éviter les goulots d'étranglement des flux de travail traditionnels lors de la conception de nouvelles voitures.
par exemple, d'une part, la plate-forme omniverse dispose d'une forte interopérabilité, de sorte que les fichiers et les données utilisés pour la modélisation industrielle, le rendu et les effets spéciaux 3d ne nécessitent plus de conversion compliquée, accélérant ainsi la communication et la collaboration entre les équipes de conception de xpeng motors ; d'autre part, xpeng motors utilise les fonctions de rendu en temps réel et de traçage de rayons d'omniverse pour réaliser une visualisation instantanée de la couleur de la voiture et des changements intérieurs, rendant l'effet virtuel plus réaliste, aidant à répondre aux besoins des utilisateurs et améliorant ainsi l'expérience produit. .
au cours des deux dernières années, l’explosion de l’ia générative a attiré davantage l’attention du monde extérieur sur certaines applications dans le domaine de la toc et du bureau collaboratif, mais désormais, le monde physique va également inaugurer une nouvelle vague d’explosions et d’opportunités.