noticias

la nueva acción ecológica de nvidia apunta al ámbito industrial

2024-09-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

profeta del pato de plomería de spring river. las acciones actuales de nvidia están revelando algunas tendencias nuevas.

texto | zhou luping y zhao yanqiu

editor |

no hace mucho, nvidia lanzó un servicio de ia generativa para modelado 3d, que atrajo una gran atención en la industria. si decimos que la ia generativa anterior se trataba más de generar contenido en el mundo bidimensional, como texto, imágenes y videos. bueno, esta vez nvidia está utilizando ia generativa para ayudar a las empresas a construir activos 3d, acelerar el desarrollo de gemelos digitales e industrias de simulación, y también acelerar la aplicación de la ia en el mundo físico.

01

el “nativo cuda” se dirige a la industria

profeta del pato de plomería de spring river. como líder mundial en computación acelerada, las acciones de nvidia están revelando algunas tendencias nuevas.

el fundador y director ejecutivo de nvidia, jensen huang, en dos conversaciones informales en siggraph en 2024, centró sus últimos conocimientos sobre la ia en cómo la ia generativa y la computación acelerada pueden cambiar industrias como la fabricación a través de la visualización. nvidia también lanzó un nuevo conjunto de microservicios nim durante la conferencia.

la conferencia siggraph es el lugar para discutir las últimas innovaciones en gráficos por computadora. nvidia ha lanzado modelos de ia generativa y microservicios nim adecuados para openusd, geometría, física, materiales, etc. openusd es un software de código abierto para el intercambio interno de datos en escenas 3d y gradualmente se ha convertido en un estándar en muchas industrias, como la visión 3d, la arquitectura, el diseño y la fabricación.

con estos modelos y servicios, los desarrolladores pueden acelerar el desarrollo de aplicaciones en las industrias de fabricación, automoción, robótica y otras.

en dos conversaciones informales, huang analizó la importancia de crear gemelos digitales y mundos virtuales. dijo que la industria está mejorando la eficiencia y reduciendo los costos mediante la construcción de gemelos digitales a gran escala a escala de ciudades. "por ejemplo, la ia se puede entrenar en este mundo virtual antes de implementarla en robots humanoides de próxima generación".

¿por qué jensen huang se centra en la visualización industrial, los mundos virtuales o los gemelos digitales? ¿por qué nvidia lanzó un nuevo microservicio nim en el ecosistema cuda en este momento?

imagen del sitio web oficial de nvidia

como dijo rev lebaredian, vicepresidente de omniverse y tecnología de simulación de nvidia: la ola generativa de ia en la industria pesada ha llegado. digital intelligence frontier también aprendió que la ia generativa está pasando de algunos escenarios simples a complejos vínculos de producción. la ecología tecnológica antes mencionada puede acelerar este proceso.

“hasta hace poco, los principales usuarios del mundo digital eran las industrias creativas. ahora, con las capacidades mejoradas y la accesibilidad que los microservicios nim de nvidia aportan a openusd, las industrias pueden crear mundos virtuales basados ​​en la física y gemelos digitales para estar preparados para una nueva ola; del auge de la tecnología de ia", afirmó el reverendo lebaredian.

en la industria automotriz, las empresas automotrices nacionales están “lanzando” gemelos digitales. "tesla está a punto de lanzar recientemente la versión fsd 12.5 y también está promoviendo activamente la implementación de fsd en china". un experto en inteligencia artificial de una gran empresa automovilística china dijo a digital intelligence frontier: "tesla considera la simulación como un objetivo estratégico, y nosotros lo somos". también cree un metaverso y resuelva el problema del circuito cerrado de los datos de conducción autónoma. "anteriormente, era difícil y costoso para las empresas automotrices recopilar datos de" sondas fantasma ". ahora, las empresas automotrices pueden resolver el entrenamiento de escenarios de cola larga en el entorno de simulación del metaverso.

en la industria de la robótica, una empresa de robots de inspección de energía está entrenando ia a través de un entorno de simulación para que el robot pueda percibir el entorno complejo y el espacio físico de la planta de energía en tiempo real, planificar su ruta de movimiento y ver miles de metros en diferentes dispositivos. a lo largo del camino.

el diseño arquitectónico es una tarea compleja y que requiere mucho tiempo, y los modelos 3d en diseño arquitectónico son un producto esencial. para algunas formas geométricas complejas y estructuras con formas especiales, la reconstrucción de modelos 3d es más difícil. ahora, algunas empresas de diseño están trabajando con empresas de inteligencia artificial para intentar generar modelos con sólo algunas imágenes, bocetos y texto. también se pueden dar diferentes materiales al diseño arquitectónico para mejorar el diseño.

en la industria del acero, el análisis metalográfico es un método para observar defectos y estructuras dentro de rodajas de material a través de un microscopio para comprender el rendimiento general del material base. el trabajo manual tradicional es menos eficiente y depende en gran medida de la experiencia humana. ahora, un atractivo común de muchas empresas siderúrgicas es utilizar la base de conocimientos del pasado para realizar un análisis exhaustivo de los materiales mediante la formación de ia profesional.

a través de los nuevos microservicios nim, nvidia permite a las empresas de aplicaciones llamar directamente a los servicios sin empezar desde cero y luego combinarlos con sus propios datos para implementar rápidamente una aplicación. por lo tanto, algunas empresas lo describen como "nativo cuda".

con la implementación de la ia generativa desde algunos escenarios periféricos hasta escenarios más profundos, huang renxun dijo: "todos tendrán un asistente de ia". al mismo tiempo, la integración de la ia y la tecnología de imágenes se está profundizando. “casi todas las industrias se verán afectadas por esta tecnología, ya sea la informática científica para predecir mejor el clima con menos energía, o trabajar con creadores para generar imágenes o crear imágenes virtuales. escenas para visualización industrial", dijo huang. "la ia generativa también revolucionará el campo de los vehículos robóticos autónomos".

02

¿qué imaginación trae el nuevo microservicio nim?

detrás de las aplicaciones industriales mencionadas anteriormente, todas se basan en la aplicación de tecnología de simulación y modelado 3d.

la construcción de contenidos y escenas 3d siempre ha sido un dolor de cabeza en el pasado. implica cadenas y procesos complejos, como modelado, coloreado, animación, iluminación, renderizado, etc.

durante las últimas décadas, los estudios de animación, efectos visuales y juegos han intentado mejorar la interoperabilidad entre las distintas herramientas de sus proyectos, pero con un éxito limitado. mover datos de una ubicación a otra es complicado, por lo que el estudio creó flujos de trabajo complejos para gestionar la interoperabilidad de los datos.

además, además de la separación de sistemas y herramientas, el proceso de producción 3d tradicional es una colaboración lineal, que implica conversión y modificación de formatos por parte de múltiples departamentos y personal, lo que requiere mucho tiempo y mano de obra.

openusd es un marco de intercambio de datos 3d universal de código abierto que se estableció en 2023 bajo el liderazgo de nvidia, pixar, apple y otros fabricantes. puede construir mundos virtuales mediante la interoperabilidad entre herramientas de software y tipos de datos y tiene una interoperabilidad y compatibilidad extremadamente altas. resuelve muchos desafíos de flujo de trabajo y complejidad al crear escenas 3d.

openusd es también la base de la plataforma nvidia omniverse. en una conversación con un escritor senior de la revista wired, huang renxun dijo una vez: openusd es el primer formato que integra la expresión multimodal de casi todas las herramientas. idealmente, con el tiempo, se puede incorporar casi cualquier formato, permitiendo que todos colaboren y haciendo que el contenido dure para siempre. la ia generativa definitivamente ayudará a omniverse a producir mejores resultados de simulación.

el microservicio nim lanzado por nvidia esta vez para el desarrollo de openusd es también el primer modelo de ia generativa del mundo para el desarrollo de openusd. integra capacidades de ia generativa en el flujo de trabajo de usd en forma de microservicios nim, lo que reduce significativamente el umbral para que los usuarios utilicen openusd. al mismo tiempo, nvidia también ha lanzado una serie de nuevos conectores usd adecuados para formatos de datos de robots y transmisión de apple vision pro.

imagen del sitio web oficial de nvidia

actualmente, se han lanzado tres microservicios nim: uno es el microservicio nim usd code, que puede responder preguntas de sentido común de openusd y generar automáticamente código python basado en indicaciones de texto.

el segundo es el microservicio usd search nim, que permite a los desarrolladores utilizar lenguaje natural o entrada de imágenes para buscar en bases de datos masivas de imágenes, 3d y openusd, mejorando en gran medida la velocidad de recuperación de procesos empresariales y procesamiento de materiales.

el tercero es el microservicio usd validate nim, que puede verificar la compatibilidad de los archivos cargados con la versión de lanzamiento de openusd y generar imágenes de seguimiento de ruta de renderizado rtx totalmente impulsadas por la api nvidia omniverse cloud.

además de los microservicios nim nativos proporcionados por nvidia, los socios del ecosistema también están creando múltiples modelos de ia populares basados ​​en estos microservicios para brindar a los usuarios optimización de inferencia.

shutterstock, una plataforma de contenido creativo de renombre mundial, ha lanzado un nuevo servicio de conversión de texto a 3d basado en la última versión del modelo de generación visual edify de nvidia, que incluye la creación de prototipos 3d o el llenado de entornos virtuales.

por ejemplo, crear una iluminación reflectante con precisión para escenas virtuales es una tarea compleja. en el pasado, los creadores necesitaban operar costosos equipos de cámara de 360 ​​grados, ir al lugar de rodaje para crear el fondo desde cero o buscar contenido similar en una enorme base de datos.

pero ahora, a través de los servicios de generación 3d, los usuarios sólo necesitan describir el entorno específico que necesitan con texto o imágenes, y pueden obtener imágenes panorámicas de alto rango dinámico (360 hdri) con una resolución máxima de 16k. además, estas escenas y componentes se pueden cambiar rápidamente, como hacer que aparezca un coche deportivo en el desierto, una playa tropical o una sinuosa carretera de montaña.

además de crear iluminación, los creadores también pueden agregar rápidamente varios materiales de renderizado, como concreto, madera o cuero, para construir sus propios recursos 3d. además, los recursos 3d generados con la ayuda de la ia también se pueden editar en cualquier momento y proporcionarse en varios formatos de archivo populares.

el modelo edify ai de nvidia también ayuda a getty images a permitir que los artistas controlen la composición y el estilo de las imágenes a voluntad. como hacer flotar una pelota de playa roja sobre una foto perfecta de un arrecife de coral. además, los creadores también pueden utilizar datos corporativos para ajustar el modelo básico y generar imágenes que se ajusten al estilo creativo de una marca específica.

estos microservicios y herramientas modelo están acelerando enormemente la creación de activos 3d por parte de las marcas y harán que el desarrollo de gemelos digitales sea más popular y conveniente.

03

las empresas pioneras han comenzado a intentarlo.

a medida que la creación de contenidos y activos en 3d se vuelve más cómoda y precisa, sectores como la industria, la conducción autónoma, la ingeniería y la robótica disfrutan de los dividendos tecnológicos que aporta la ia generativa. especialmente en las industrias creativas de fabricación y publicidad, un grupo de primeros usuarios están acelerando activamente la aplicación de gemelos digitales y simulación a través de la plataforma nvidia omniverse.

coca-cola es la primera marca que utiliza ia generativa proporcionada por los microservicios omniverse y nim en escenarios de marketing. en un vídeo de su demostración, simplemente se escribe en el sistema en lenguaje natural "constrúyeme una mesa con tacos y salsa a la luz de la mañana".

pronto, el microservicio usd search nim podrá buscar los activos 3d correspondientes en la enorme biblioteca de activos 3d y llamarlos rápidamente a través de la api. usd code nim puede combinar estos modelos en escenas y los desarrolladores pueden obtenerlos ingresando indicaciones. el código utilizado para crear nuevos mundos en 3d mejora enormemente sus capacidades creativas. a través de la ia generativa, coca-cola puede personalizar una imagen personalizada en más de 100 mercados de todo el mundo para lograr un marketing localizado.

imagen del sitio web oficial de nvidia

como proveedor de servicios de publicidad detrás de coca-cola, wpp ha lanzado especialmente un sistema operativo de marketing inteligente. el sistema aprovecha la plataforma de desarrollo omniverse y openusd para agilizar y automatizar la creación de texto, imágenes y videos multilingües, simplificando el proceso de creación de contenido para anunciantes y especialistas en marketing. al atender a los clientes a través de ia generativa, wpp hace realidad ideas locas.

como dijo el director de tecnología de wpp: “la belleza de estas innovaciones es que son altamente compatibles con la forma en que trabajamos y aprovechan al máximo los estándares abiertos. esto no solo acelera el trabajo futuro, sino que también nos permite continuar construyendo. y ampliar nuestras inversiones anteriores en estándares como openusd. al utilizar los microservicios nvidia nim con nvidia omniverse, podemos lanzar nuevas herramientas de producción innovadoras más rápido que nunca con empresas como the coca-cola company”.

como el oem de electrónica de consumo más grande del mundo, foxconn ha construido una fábrica de gemelos digitales virtuales para una nueva fábrica en méxico. los ingenieros pueden definir procesos y entrenar robots en el entorno virtual, mejorando así el nivel de automatización de la fábrica y la eficiencia de producción y ahorrando tiempo y costos. y energía.

foxconn también utilizó la plataforma omniverse detrás de escena para construir su gemelo digital, integrando todos los elementos cad 3d en la misma fábrica virtual y entrenando a los robots allí usando nvidia isaac sim, una plataforma de simulación de robots escalable desarrollada en omniverse y openusd para brindar precisión física. y presentación visual realista a su gemelo digital.

además de foxconn, empresas de fabricación de productos electrónicos, incluidas delta electronics, mediatek y pegatron, están utilizando nvidia ai y omniverse para construir gemelos digitales de fábrica.

el modelo mpv xpeng x9 de xpeng motors utilizó la plataforma omniverse en el proceso de diseño. al introducir el flujo de trabajo de desarrollo del modelo en el mundo virtual, xpeng motors puede evitar los cuellos de botella de los flujos de trabajo tradicionales al diseñar automóviles nuevos.

por ejemplo, por un lado, la plataforma omniverse tiene una fuerte interoperabilidad, de modo que los archivos y datos utilizados para el modelado industrial, el renderizado y los efectos especiales 3d ya no necesitan una conversión complicada, lo que acelera la comunicación y la colaboración entre los equipos de diseño de xpeng motors en el; por otro lado, xpeng motors utiliza las funciones de trazado de rayos y renderizado en tiempo real de omniverse para realizar una visualización instantánea del color del automóvil y los cambios interiores, haciendo que el efecto virtual sea más realista, ayudando a satisfacer las necesidades del usuario y mejorando así la experiencia del producto. .

en los últimos dos años, la explosión de la ia generativa ha atraído más atención del mundo exterior hacia algunas aplicaciones en el campo de la toc y la oficina colaborativa, pero ahora, el mundo físico también marcará el comienzo de una nueva ola de explosiones y oportunidades.