новая экологическая акция nvidia нацелена на промышленный путь

2024-09-19

утка-сантехник спринг-ривер пророк. текущие действия nvidia открывают некоторые новые тенденции.

текст | чжоу лупин и чжао яньцю

редактор | ню хуэй

не так давно nvidia выпустила сервис генеративного искусственного интеллекта для 3d-моделирования, который привлек широкое внимание в отрасли. если мы скажем, что предыдущий генеративный ии больше занимался генерацией контента в двумерном мире, такого как текст, изображения и видео. что ж, на этот раз nvidia использует генеративный искусственный интеллект, чтобы помочь предприятиям создавать 3d-активы, ускорить развитие цифровых двойников и отраслей моделирования, а также ускорить применение искусственного интеллекта в физическом мире.

«нативный cuda» нацелен на промышленность

утка-сантехник спринг-ривер пророк. действия nvidia, мирового лидера в области ускоренных вычислений, открывают некоторые новые тенденции.

основатель и генеральный директор nvidia дженсен хуанг в двух беседах за столом переговоров на siggraph в 2024 году сосредоточил свои последние идеи об искусственном интеллекте на том, как генеративный искусственный интеллект и ускоренные вычисления могут изменить производство и другие отрасли посредством визуализации. во время конференции nvidia также представила новый набор микросервисов nim.

конференция siggraph — место для обсуждения последних инноваций в области компьютерной графики. nvidia выпустила генеративные модели искусственного интеллекта и микросервисы nim, подходящие для openusd, геометрии, физики, материалов и т. д. openusd — это программное обеспечение с открытым исходным кодом для внутреннего обмена данными в 3d-сценах, которое постепенно стало стандартом во многих отраслях, таких как 3d-видение, архитектура, дизайн и производство.

с помощью этих моделей и услуг разработчики могут ускорить разработку приложений в обрабатывающей промышленности, автомобилестроении, робототехнике и других отраслях.

в ходе двух бесед у камина хуан обсудил важность создания цифровых двойников и виртуальных миров. он сказал, что отрасль повышает эффективность и сокращает затраты за счет создания крупномасштабных цифровых двойников в масштабе городов. «например, ии можно обучить в этом виртуальном мире, прежде чем его можно будет использовать в роботах-гуманоидах следующего поколения».

почему дженсен хуанг фокусируется на промышленной визуализации, виртуальных мирах или цифровых двойниках? почему nvidia запустила новый микросервис nim в экосистеме cuda именно сейчас?

изображение с официального сайта nvidia

как сказал преподобный лебаредиан, вице-президент по omniverse и технологиям моделирования nvidia, волна генеративного искусственного интеллекта уже наступила в тяжелой промышленности. digital intelligence frontier также узнала, что генеративный искусственный интеллект переходит от простых сценариев к сложным производственным звеньям. упомянутая выше технологическая экология может ускорить этот процесс.

«до недавнего времени основными пользователями цифрового мира были творческие отрасли. теперь, благодаря расширенным возможностям и доступности openusd, предоставляемым микросервисами nvidia nim, отрасли могут создавать для этого виртуальные миры на основе физики и цифровых двойников. будьте готовы к новому; волна бума технологий искусственного интеллекта», — сказал преподобный лебаредиан.

в автомобилестроении отечественные автопроизводители «раскатывают» цифровых двойников. «tesla недавно собирается выпустить версию fsd 12.5, а также активно продвигает внедрение fsd в китае». специалист по искусственному интеллекту из крупной китайской автомобильной компании рассказал digital intelligence frontier: «tesla рассматривает моделирование как стратегическую цель, и мы так и делаем. также создайте метавселенную и решите замкнутую проблему данных автономного вождения. «раньше автомобильным компаниям было сложно и дорого собирать данные «призрачного зонда». теперь автомобильные компании могут решать задачи обучения сценариям с длинным хвостом в среде моделирования метавселенной.

в сфере робототехники компания, производящая роботов для проверки мощности, обучает ии с помощью среды моделирования, чтобы робот мог воспринимать сложную среду и физическое пространство электростанции в режиме реального времени, планировать маршрут своего движения и просматривать тысячи метров на различных устройствах. по пути.

архитектурное проектирование — сложная и трудоемкая задача, а 3d-модели в архитектурном проектировании являются важным результатом. для некоторых сложных геометрических форм и конструкций специальной формы реконструкция 3d-моделей затруднена. сейчас некоторые дизайнерские компании сотрудничают с компаниями, занимающимися искусственным интеллектом, пытаясь создавать модели, состоящие только из изображений, эскизов и текста. в архитектурный проект также могут быть включены различные материалы для улучшения дизайна.

в сталелитейной промышленности металлографический анализ — это метод исследования дефектов и структур внутри слоев материала с помощью микроскопа, чтобы понять общие характеристики основного материала. традиционный ручной труд менее эффективен и во многом зависит от человеческого опыта. сейчас многие сталелитейные компании призывают использовать прошлую базу знаний для проведения комплексного анализа материалов путем обучения профессионального ии.

благодаря новым микросервисам nim nvidia позволяет компаниям-разработчикам приложений напрямую вызывать сервисы, не начиная с нуля, а затем объединять их со своими собственными данными для быстрой реализации приложения. поэтому некоторые компании описывают это как «родной cuda».

по мере того как генеративный ии переходит от периферийных сценариев к более глубоким, хуан ренсюнь сказал: «у каждого будет помощник ии». в то же время интеграция искусственного интеллекта и технологий изображений углубляется: «эта технология затронет почти все отрасли, будь то научные вычисления для лучшего прогнозирования погоды с меньшими затратами энергии или работа с создателями для создания изображений или создание виртуальных технологий. сцены для промышленной визуализации», — сказал хуанг. «генеративный искусственный интеллект также произведет революцию в области роботизированных беспилотных автомобилей».

какое воображение приносит новый микросервис nim?

все вышеупомянутые отраслевые приложения основаны на применении технологий 3d-моделирования и моделирования.

создание 3d-контента и сцен в прошлом всегда было головной болью. оно включает в себя сложные цепочки и процессы, такие как моделирование, раскрашивание, анимация, освещение, рендеринг и т. д.

за последние несколько десятилетий студии анимации, визуальных эффектов и игр пытались улучшить совместимость между различными инструментами в своих конвейерах, но с ограниченным успехом. перемещать данные из одного места в другое сложно, поэтому студия разработала сложные рабочие процессы для управления совместимостью данных.

более того, помимо разделения систем и инструментов, традиционный процесс 3d-производства представляет собой линейное сотрудничество, включающее преобразование и модификацию формата несколькими отделами и персоналом, что требует много времени и труда.

openusd — это универсальная платформа обмена 3d-данными с открытым исходным кодом. она была создана в 2023 году под руководством nvidia, pixar, apple и других производителей. она может создавать виртуальные миры за счет взаимодействия между программными инструментами и типами данных и обладает чрезвычайно высокой функциональной совместимостью. . он решает многие проблемы рабочего процесса и сложности при создании 3d-сцен.

openusd также является основой платформы nvidia omniverse. в беседе со старшим автором журнала wired хуан ренсюнь однажды сказал: openusd — это первый формат, объединяющий мультимодальное выражение почти всех инструментов. в идеале со временем в него можно будет добавить практически любой формат, что позволит всем сотрудничать и сделает контент вечным. генеративный ии определенно поможет omniverse добиться лучших результатов моделирования.

микросервис nim, запущенный nvidia на этот раз для разработки openusd, также является первой в мире генеративной моделью искусственного интеллекта для разработки openusd. он интегрирует возможности генеративного искусственного интеллекта в рабочий процесс доллара сша в форме микросервисов nim, что значительно снижает порог использования openusd пользователями. в то же время nvidia также выпустила ряд новых разъемов usd, подходящих для форматов данных роботов и потоковой передачи apple vision pro.

изображение с официального сайта nvidia

в настоящее время выпущено три микросервиса nim: один из них — микросервис nim usd code, который может отвечать на здравые вопросы openusd и автоматически генерировать код python на основе текстовых подсказок.

второй — микросервис nim usd search, который позволяет разработчикам использовать естественный язык или ввод изображений для поиска в огромных базах данных openusd, 3d и изображениях, что значительно повышает скорость поиска и обработки материалов в корпоративных процессах.

третий — это микросервис usd validate nim, который может проверять совместимость загруженных файлов с версией openusd и генерировать изображения трассировки пути рендеринга rtx, полностью управляемые nvidia omniverse cloud api.

в дополнение к собственным микросервисам nim, предоставляемым nvidia, партнеры по экосистеме также создают несколько популярных моделей искусственного интеллекта на основе этих микросервисов, чтобы предоставить пользователям возможность оптимизации вывода.

shutterstock, всемирно известная платформа творческого контента, запустила новый сервис преобразования текста в 3d, основанный на последней версии модели визуальной генерации nvidia edify, включая создание 3d-прототипов или заполнение виртуальных сред.

например, создание точно отражающего освещения для виртуальных сцен — сложная задача. раньше создателям приходилось пользоваться дорогостоящим оборудованием для 360-градусной камеры, приезжать на съемочную площадку, чтобы создать фон с нуля, или искать похожий контент в огромной базе данных.

но теперь, с помощью услуг по созданию 3d-изображений, пользователям нужно только описать конкретную среду, которая им нужна, с помощью текста или изображений, и они могут получить панорамные изображения с расширенным динамическим диапазоном (360 hdri) с максимальным разрешением 16k. более того, эти сцены и компоненты можно быстро переключать, например, создать спортивный автомобиль в пустыне, на тропическом пляже или на извилистой горной дороге.

помимо создания освещения, создатели также могут быстро добавлять различные материалы для рендеринга, такие как бетон, дерево или кожа, для создания собственных 3d-ресурсов. более того, 3d-ресурсы, созданные с помощью ии, также можно редактировать в любое время и предоставлять в различных популярных форматах файлов.

модель edify ai от nvidia также помогает getty images позволить художникам управлять композицией и стилем изображений по своему усмотрению. это похоже на плавание красного пляжного мяча над идеальной фотографией кораллового рифа. более того, авторы также могут использовать корпоративные данные для точной настройки базовой модели для создания изображений, соответствующих творческому стилю конкретного бренда.

эти модельные микросервисы и инструменты значительно ускорят создание 3d-активов брендами и сделают разработку цифровых двойников более популярной и удобной.

компании-первопроходцы начали пытаться

поскольку создание 3d-контента и активов становится все более удобным и точным, такие отрасли, как промышленность, автономное вождение, машиностроение и робототехника, получают технологические дивиденды, которые приносит генеративный искусственный интеллект. группа первых пользователей, особенно в сфере производства и рекламы, активно ускоряет применение цифровых двойников и моделирования с помощью платформы nvidia omniverse.

coca-cola — первый бренд, использующий генеративный искусственный интеллект, предоставляемый микросервисами omniverse и nim, в маркетинговых сценариях. в видео его демонстрации просто «сделай мне стол с тако и сальсой в утреннем свете» просто вводится в систему на естественном языке.

вскоре микросервис usd search nim сможет искать соответствующие 3d-ресурсы в огромной библиотеке 3d-ресурсов и быстро вызывать их через api. usd code nim сможет объединять эти модели в сцены, а разработчики смогут получать их, вводя подсказки python. код, используемый для создания новых трехмерных миров, значительно расширяет их творческие возможности. с помощью генеративного искусственного интеллекта coca-cola может настроить персонализированный имидж на более чем 100 рынках по всему миру для достижения локализованного маркетинга.

изображение с официального сайта nvidia

как поставщик рекламных услуг coca-cola, wpp специально запустила интеллектуальную маркетинговую операционную систему. система использует платформу разработки omniverse и openusd для оптимизации и автоматизации создания многоязычного текста, изображений и видео, упрощая процесс создания контента для рекламодателей и маркетологов. обслуживая клиентов с помощью генеративного искусственного интеллекта, wpp воплощает сумасшедшие идеи в реальность.

как сказал технический директор wpp: «прелесть этих инноваций в том, что они полностью совместимы с тем, как мы работаем, и в полной мере используют преимущества открытых стандартов. это не только ускоряет будущую работу, но и позволяет нам продолжать развивать их. и расширить наши предыдущие инвестиции в такие стандарты, как openusd. используя микросервисы nvidia nim с nvidia omniverse, мы можем запускать новые инновационные производственные инструменты быстрее, чем когда-либо, вместе с такими компаниями, как the coca-cola company».

будучи крупнейшим в мире производителем бытовой электроники, компания foxconn построила виртуальный цифровой двойник для нового завода в мексике. инженеры могут определять процессы и обучать роботов в виртуальной среде, тем самым повышая уровень автоматизации завода и эффективность производства, а также экономя время и затраты. и энергия.

foxconn также использовала платформу omniverse для создания своего цифрового двойника, интегрируя все элементы 3d cad в одну виртуальную фабрику и обучая там роботов с помощью nvidia isaac sim, масштабируемой платформы моделирования роботов, разработанной на базе omniverse и openusd bring с физической точностью. и реалистичное визуальное представление своего цифрового двойника.

помимо foxconn, компании-производители электроники, включая delta electronics, mediatek и pegatron, используют nvidia ai и omniverse для создания цифровых двойников предприятий.

модель mpv xpeng x9 от xpeng motors использовала платформу omniverse в процессе проектирования. перенеся рабочий процесс разработки модели в виртуальный мир, xpeng motors может избежать узких мест традиционных рабочих процессов при проектировании новых автомобилей.

например, с одной стороны, платформа omniverse обладает высокой функциональной совместимостью, поэтому файлы и данные, используемые для промышленного моделирования, рендеринга и 3d-спецэффектов, больше не требуют сложного преобразования, что ускоряет взаимодействие и сотрудничество между группами разработчиков xpeng motors; с другой стороны, xpeng motors использует функции рендеринга и трассировки лучей omniverse в реальном времени для мгновенной визуализации цвета автомобиля и изменений интерьера, что делает виртуальный эффект более реалистичным, помогая удовлетворить потребности пользователей и тем самым улучшая качество продукта.

за последние два года взрыв генеративного ии привлек больше внимания внешнего мира к некоторым приложениям в области toc и совместного офиса, но теперь физический мир также откроет новую волну взрывов и возможностей.

новости

новая экологическая акция nvidia нацелена на промышленный путь

введение

моя контактная информация