noticias

¡Xiao Zha y Lao Huang tienen una conversación íntima junto a la chimenea mientras se cambian de ropa!Xiao Zha realmente rompió el espesor a prueba de explosiones y Lao Huang reveló que se lanzó el primer lote de Blackwell.

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Nuevo informe de sabiduría

Editor: Departamento Editorial

[Introducción a la Nueva Sabiduría] Hace un momento, Lao Huang reveló en la conferencia SIGGRAPH: ¡Las muestras de ingeniería de Blackwell se enviaron oficialmente al mundo esta semana! Luego, Lao Huang y Xiao Zha tuvieron una conversación junto a la chimenea e intercambiaron ropa íntimamente. Cuando llegaron al punto emocionante, Xiao Zha se enojó tanto que se volvió violento.

¡Las últimas noticias están aquí!

Hace un momento, Lao Huang reveló en la conferencia de gráficos por computadora SIGGRAPH: ¡Justo esta semana, NVIDIA ha comenzado a enviar muestras de ingeniería de Blackwell al mundo!

Inmediatamente después, la presentadora Lauren Goode bromeó: Sí, todos bajan la cabeza, ahí está debajo del taburete.

Vale la pena mencionar que detrás del chip de IA más poderoso de la actualidad, la IA también es inseparable——

Sin IA, Hopper no sería posible; sin IA, Blackwell tampoco sería posible.


En una conversación informal entre él y Xiao Zha, Xiao Zha ni siquiera pudo evitar maldecir en un momento en el que se emocionó.

Porque el efecto de los cambios de ropa anteriores de los dos jefes es realmente difícil de describir.

Esta vez, Xiao Zha le dio especialmente a Lao Huang un abrigo de algodón personalizado "estilo cuero negro".


Después de tomar la parte superior del cuerpo, ¡el efecto es realmente sobresaliente!


Por supuesto, Xiao Zha también se puso la chaqueta de cuero "segunda mano" de Lao Huang que solo usó durante 2 horas. (Esto es mucho más valioso que uno nuevo)


El mundo de las “réplicas” digitales de NVIDIA

En la conferencia, Lao Huang anunció que NVIDIA ha construido el primer modelo de IA generativa del mundo que puede entender OpenUSD (lenguaje, geometría, materiales, física y espacio).

¿Qué es OpenUSD? Se refiere a la Descripción de escena universal, que puede entenderse como una descripción de escena universal.

Huang dijo que lo más emocionante que lo que la IA puede hacer con el texto es que nosotros podemos hacer lo mismo con las imágenes.

Por ejemplo, el modelo Edify AI creado por NVIDIA es un modelo básico desde texto hasta 2D.


Para las marcas, puede crear Coca-Cola, automóviles, artículos de lujo, etc. Sin embargo, controlar las señales es algo difícil.

Esto se debe a que la latitud de las palabras es muy baja, su contenido está extremadamente comprimido, pero al mismo tiempo es muy impreciso.

NVIDIA ha creado una manera de hacer esto: crear otro modelo, controlarlo y ajustar su alineación a más condiciones.


Con Omniverse, todos estos datos y contenidos multimodales se pueden combinar, ya sea 3D, IA, animación o materiales.

Podemos cambiar su postura, posición, en definitiva lo que queramos.

El uso de indicaciones condicionales en Omniverse puede entenderse como una especie de generación mejorada en 3D, al igual que la generación mejorada de recuperación.

De esta manera podremos generar la imagen como queramos.

Luego, WPP utilizó Shutterstock para completar trabajos con marcas de renombre mundial, lo que sorprendió directamente a la audiencia.

Constrúyeme una mesa en una habitación vacía, con sillas alrededor, en un restaurante concurrido.


Prepárame una mesa con tacos y un plato de salsa a la luz de la mañana.


Constrúyeme un coche en una carretera vacía, rodeada de árboles, cerca de una casa moderna.


Constrúyeme un árbol en un campo vacío.


Constrúyeme cientos de estos árboles en todas direcciones.


Que los bosques estén cubiertos de arbustos y enredaderas.


Constrúyeme una selva tropical gigante llena de flores exóticas y rayos de sol.


Omniverse ahora comprende la conversión de texto a USD. Entiende texto y tiene una base de datos semántica para que se puedan buscar todos los objetos 3D.

Entonces la niña puede imaginarse cómo quiere llenar el árbol 3D y, una vez que lo ha hecho, la escena 3D pasa a un modelo de IA generativo que la convierte en un modelo fotorrealista.

A partir de entonces, aparecerá cada vez más IA generativa en Omniverse para ayudar a las personas a crear estas simulaciones, o gemelos digitales.

Por ejemplo, la siguiente IA digital permitirá a todas las empresas brindar servicio al cliente.

Por el momento, el servicio al cliente lo realizan humanos, pero en el futuro la IA estará involucrada.

El servicio al cliente estará conectado a una interfaz humana digital, que es un IO. Este IO puede hablar y hacer contacto visual con nosotros.


Se pueden conectar todo tipo de IA a este humano digital, e incluso el humano digital se puede conectar a la IA de servicio al cliente con búsqueda mejorada de NVIDIA.

servicio NIM

En esta conferencia, NVIDIA lanzó un nuevo conjunto de microservicios NIM.

NIM está diseñado para diferentes flujos de trabajo, incluidos OpenUSD, modelado 3D, física, materiales, robótica, gemelos digitales industriales e IA física.

En el campo de la IA y los gráficos, NVIDIA ha lanzado un nuevo microservicio NIM OpenUSD diseñado para generar aplicaciones físicas de IA.

Este flujo de trabajo incluye nuevos microservicios NIM para simulación de robots y más para acelerar el desarrollo de robots humanoides.

"Tres cuerpos" crea robots

Huang predijo que la próxima ola de IA será la IA física.

Si la tecnología robótica quiere avanzar, necesitará IA avanzada y mundos virtuales realistas y antes de que se pueda implementar la próxima generación de robots humanoides, debemos entrenar la IA;

La robótica requiere tres computadoras: una para entrenar la IA, otra para probar la IA en simulaciones físicamente precisas y una dentro del propio robot que puede aprender a optimizarlo.


En otras palabras, la tercera IA es la computadora que realmente ejecuta la IA.

Para ello, Nvidia creó tres ordenadores.

Sin IA no existirían el H100/H200 y el B100

En la historia de NVIDIA que comienza en la década de 1990, el verdadero ADN está en los gráficos por computadora.

Los gráficos por computadora también han llevado a Nvidia a donde se encuentra hoy.


Esta imagen muestra algunos hitos importantes en la industria informática, incluido el sistema IMB 360, la tetera Utah, el trazado de rayos, el sombreado programable, etc.

En 1993 se fundó NVIDIA. Ocho años más tarde, inventaron la primera GPU de sombreado programable, que impulsó en gran medida la historia de desarrollo de Nvidia.

Se puede decir que el núcleo detrás de todo lo que hace NVIDIA es la computación acelerada. Creían firmemente que si creaban un modelo computacional que mejorara la informática de propósito general, podrían resolver problemas que las computadoras comunes no pueden resolver.

El campo preferido son los gráficos por computadora. Hicieron la apuesta correcta.

La aplicación de gráficos por computadora a un campo no convencional en ese momento: los videojuegos con gráficos 3D, promovió directamente el volante de Nvidia.

Después de eso, les llevó mucho tiempo hacer que CUDA fuera omnipresente y luego, en 2012, como en Star Trek, NVIDIA se acercó a AlexNet por primera vez.

En 2012, fue un momento explosivo, AlexNet logró un avance sorprendente en la visión por computadora. Su núcleo: el aprendizaje profundo es tan profundo que los ingenieros ya no necesitan imaginar cómo se verá el resultado después de proporcionar información.


En 2016, Nvidia lanzó la primera computadora diseñada para el aprendizaje profundo, la DGX-1, que fue favorecida por Musk. Posteriormente, el producto se entregó al entonces poco conocido OpenAI.

Posteriormente, se inventaron RTX y DLSS.

Luego vino el nacimiento de ChatGPT.

En el futuro, todo el mundo tendrá un asistente de IA

Hoy en día, hemos aprendido a utilizar la IA para aprenderlo todo, no sólo palabras, sino también imágenes, vídeos, 3D, productos químicos, proteínas, física, termodinámica, dinámica de fluidos, física de partículas y más.


Entendemos el significado de todas estas diferentes modalidades.

En opinión de Lao Huang, la revolución de la IA generativa basada en la computación visual está mejorando la creatividad humana.

Estamos verdaderamente en un momento revolucionario, dirigiéndonos hacia la era del Software 3.0: ¡ninguna industria puede escapar del impacto de la IA!


Huang predijo: Todos tendrán un asistente de IA, y cada empresa y cada trabajo dentro de la empresa contará con la asistencia de IA.


Acelerar la informática para resolver problemas energéticos

Aunque se espera que la IA generativa mejore la productividad humana, el consumo de energía de la infraestructura de IA es un problema importante que afecta a todo el planeta.

Una búsqueda en ChatGPT equivale a la potencia de 10 búsquedas en Google.

Los centros de datos consumen entre el 1% y el 2% del total de la energía mundial, e incluso pueden llegar al 6% dentro de una década.


¿qué hacer? Lao Huang tiene una solución.

Dijo que se espera que la tecnología informática acelerada haga que la informática sea más eficiente energéticamente.

"La computación acelerada puede ayudarnos a ahorrar mucha energía. Puede ahorrar 20 o 50 veces y realizar el mismo procesamiento", afirmó Huang.

"Lo primero que debemos hacer como sociedad es acelerar todas las aplicaciones que podamos: esto reduce la cantidad de energía utilizada en todo el mundo".

Por eso Blackwell es tan esperado porque utiliza la misma energía pero acelera enormemente las aplicaciones.

Y cada vez es más barato.


Lao Huang enfatizó: Recuerde, el objetivo de la IA generativa no es entrenar, sino razonar. Idealmente, la inferencia podría permitirnos crear nuevos modelos para predecir el clima, predecir nuevos materiales, optimizar las cadenas de suministro y más.

Recuerde, los centros de datos no son los únicos lugares que consumen energía. Los centros de datos globales representan sólo el 40% de la informática total, y el 60% del consumo de energía se realiza en línea, moviendo electrones, bits y bytes.

Por lo tanto, la IA generativa reducirá el consumo de energía en línea porque no es necesario recuperar información, podemos generarla directamente en el sitio.


Y justo ahora, Nvidia implementó GPU en GCP para ejecutar Pandas.

La plataforma de ciencia de datos líder en el mundo ha aumentado directamente la velocidad de 50 a 100 veces, superando la informática general.

En los últimos 10 a 12 años, hemos aumentado la velocidad del aprendizaje profundo un millón de veces y hemos reducido el costo y el consumo de energía un millón de veces. Por eso nació LLM.

Sin embargo, NVIDIA también aportará nuevas innovaciones a la IA mediante el diseño de nuevos procesadores, nuevos sistemas, GPU con núcleo Tensor y estructuras de conmutadores NVLink.

Charla informal entre Lao Huang y Xiao Zha


Mucha gente esperaba desde hace mucho tiempo la charla informal entre los dos directores ejecutivos en SIGGRAPH de este año. En palabras del propio Xiao Zha, "los dos fundadores más importantes de la industria", ¿qué tipo de chispas chocarán?

siguiente ola

No es sorprendente que los dos héroes de "Green Plum Cooking Wine" compartieran sus predicciones y hablaran sobre las futuras tendencias de desarrollo tecnológico, desde GenAI hasta Agent y el "Metaverso" en el que Xiao Zha siempre ha estado pensando.

Huang dijo que también estaba sorprendido por el poder técnico de GenAI: “No recuerdo ninguna tecnología que haya impactado a los consumidores, las empresas, la industria y el mundo académico a un ritmo tan rápido, y que haya abarcado todo, desde la tecnología climática hasta la biotecnología y todos los diferentes. áreas de las ciencias físicas”.

Xiao Zha también dijo que es probable que GenAI remodele los diversos software de redes sociales de Meta.

En el pasado, el núcleo de estos productos, el sistema de recomendación, era simplemente enviar contenido de interés a los usuarios.

Pero GenAI ya no se limitará al contenido existente: no solo ayudará a los creadores, sino que también creará contenido en tiempo real para los usuarios o sintetizará el contenido existente para generarlo.


En cuanto al desarrollo de Agent, los dos parecen tener puntos de vista similares.

En su discurso anterior, Huang dejó claro que "en el futuro, cada uno tendrá su propio asistente de IA".

Durante esta conversación, Xiao Zha también expresó una visión similar. Está planeando productos AI Assistant y AI Studio para Meta, lo que permitirá a todos crear su propio Agente para diferentes propósitos.

En el futuro, cada empresa tendrá su propia IA, así como hoy todas las empresas tienen sus propias redes sociales y cuentas de correo electrónico.

¿Qué tan “inteligente” debe ser el “asistente de IA” que lo llaman?

El Llama 3 que hemos visto hasta ahora es simplemente un modelo de lenguaje similar a un “chatbot” que sólo puede responder a preguntas humanas. Pero Xiao Zha espera que a la IA se le pueda dar "intención".


Lao Huang lo describió como una "capacidad de planificación", que puede formar un "árbol de decisiones" en la mente como los humanos y luego guiar el comportamiento.

Aún más audaz predijo que este tipo de asistente de IA costaría sólo 10 dólares por hora, pero podría mejorar enormemente el rendimiento laboral de los ingenieros. "Si aún no has contratado IA, ¡hazlo ahora!"

En cuanto a la tecnología AR/VR principal y única de Meta, el plano de Xiao Zha también es bastante preciso y refleja plenamente su personalidad obsesivo-compulsiva.

(Según las noticias de Lao Huang, los tomates se pueden cortar con precisión milimétrica y cada rodaja de tomate no puede tocarse entre sí).

En septiembre del año pasado, Meta y Ray-Ban lanzaron nuevas gafas inteligentes, equipadas con equipos de audio y cámaras, que permiten a los usuarios tomar fotografías directamente desde la perspectiva de ambos ojos, o transmitir en vivo el campo de visión visto en las gafas directamente a Facebook o Instagram, e integró el asistente de conversación Meta AI.


Xiao Zha dijo que, basándose en la situación actual de las gafas Ray-Ban, las gafas de IA sin pantalla con un precio de 300 dólares se convertirán en un producto muy popular.

Según su predicción, las gafas inteligentes se convertirán en un dispositivo similar a un teléfono móvil en el futuro, y todos los que usan gafas usarán gafas inteligentes (más de mil millones de personas en el mundo).

En los próximos años, Meta también lanzará gafas con funciones AR holográficas. Aunque el costo sigue siendo alto, será un producto factible.


A diferencia de las gafas inteligentes, los cascos de realidad mixta se parecen más a estaciones de trabajo o consolas de juegos. No son cómodos de transportar, pero tienen una mayor potencia informática y pueden brindar a los usuarios una experiencia más inmersiva.

Además, con el desarrollo de la tecnología AR holográfica, las “reuniones virtuales” pronto se convertirán en una realidad.

A diferencia de los avatares o videos en la plataforma Zoom, cada uno tendrá su propia imagen holográfica. Incluso si están en diferentes espacios físicos, las "personas virtuales" creadas por hologramas pueden colaborar e interactuar en el mismo espacio.

El código abierto es el camino a seguir

Cuando se trata de Meta, su consistente estrategia de "código abierto" también es un punto clave que debe discutirse.

Lao Huang aprecia mucho esta estrategia. Dijo que Llama 2 puede ser el evento más importante en el campo de la IA el año pasado, junto con PyTorch y el recién lanzado Llama 3.1, Meta ha construido un ecosistema completo;

Pero Xiao Zha dijo que su camino hacia el código abierto también fue una especie de "adaptación".

En muchas pistas, especialmente en sistemas informáticos distribuidos y centros de datos, la línea de partida de Meta en realidad va por detrás de otras empresas, por lo que el equipo pensó en el código abierto, especialmente en la computación abierta.

Inesperadamente, este recurso se ha convertido en una estrategia clave para "adelantar en las curvas".

Es el código abierto lo que hace que los productos lanzados por Meta se conviertan en estándares de la industria y toda la cadena de suministro se base en ellos. Meta incluso ahorró miles de millones de dólares al hacer que el proyecto fuera de código abierto.

Por ejemplo, Meta ingresó al campo de las GPU más tarde que la mayoría de las empresas, pero la escala de los clústeres de supercomputación de GPU que operan actualmente supera la de casi todos los competidores.

Por supuesto, el fuerte apoyo de Lao Huang es indispensable detrás de esto. Después de todo, las 600.000 GPU de Meta también son fabricadas por Nvidia.


Aunque el código abierto puede promover el progreso de esta comunidad e industria, Xiao Zha también dijo honestamente que el código abierto no es caridad y que no elegimos esta estrategia por un corazón desinteresado.

El propósito más importante es hacer que el producto que se está construyendo alcance su punto máximo y se convierta en lo mejor posible.

PyTorch es el ejemplo más típico. Los desarrolladores de todo el mundo, incluidos entre doscientos y trescientos ingenieros de NVIDIA, están ayudando a este marco de código abierto a encontrar errores y optimizarlo, formando lo que Huang llama la "montaña de ingeniería de PyTorch".

Aunque el propio Xiao Zha admite que el código abierto es egoísta, todavía no puede evitar emocionarse cuando habla de plataformas "cerradas". La única mala palabra en la sala provino de este tema.

Aunque Meta tiene una serie de software social de primer nivel, estas aplicaciones deben distribuirse a través de las plataformas de la competencia, especialmente la App Store de Apple y el sistema Android de Google.

Lo que molesta mucho a Xiaozha es que alguna vez tuvo muchas ideas de productos, pero debido a varias limitaciones de estas plataformas móviles, finalmente no pudieron despegar.

La naturaleza extremadamente dependiente de la plataforma de la era de Internet móvil es completamente diferente de la apertura de la era de las PC, lo que hace que Xiao Zha extrañe Facebook en la web.


Por lo tanto, dijo con confianza que estamos dando forma a la próxima generación de plataformas informáticas, es decir, a la tecnología de realidad mixta, en la que el software de código abierto recuperará un mayor valor.

La plataforma y el ecosistema de próxima generación serán más abiertos e inclusivos, similares al ecosistema anterior de Windows o Android, en lugar del Apple completamente cerrado.

Esta ambición de "hacer que el código abierto vuelva a ser grandioso" recuerda a la gente su metáfora cuando se lanzó Llama 3.1: Llama 3.1 es el Linux de esta era.

No es fácil ser director ejecutivo

A lo largo de la conversación, los dos se sintieron bastante comprensivos y, a menudo, hablaron sobre las dificultades de la carrera de CEO.

Jensen, de 61 años y vestido con una chaqueta de cuero, incluso se comparó con una flor delicada y rostro serio: "Somos directores ejecutivos, como flores delicadas, necesitamos mucho apoyo".

Xiao Zha incluso continuó diciendo: "Ahora estamos bastante demacrados".

Esta emoción puede provenir de los altibajos que los dos fundadores senior han experimentado con la empresa.

En opinión de Xiao Zha, Lao Huang, bajo la presión de no ser favorecido, insistió en hacer de la computadora una "súper bestia", convirtiendo a Nvidia en una leyenda de la industria;

En opinión de Lao Huang, Xiao Zha llevó a Meta a transformarse muchas veces, de PC a dispositivos móviles, y de las redes sociales a la investigación de realidad virtual, realidad aumentada y inteligencia artificial.

Al final de la conversación, Huang declaró sin rodeos las similitudes entre los dos: "Sé lo difícil que es hacer eso (transformación). Ambos hemos sido gravemente afectados, pero esto es lo que se necesita para convertirnos en pioneros e innovar". .

Referencias:

https://www.youtube.com/watch?v=H0WxJ7caZQU

https://www.youtube.com/watch?v=w-cmMcMZoZ4