новости

студентки пекинского университета после 2000 года создают платформу 4d-анимации, созданную искусственным интеллектом

2024-09-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

полное название компании: beijing yunke technology co., ltd.

раунды финансирования: ангел + раунд

продукты/услуги: aiuni — платформа 4d-анимации, созданная искусственным интеллектом.

основатель: ху ятин (25-й выпуск entrepreneurship star camp)

год рождения: 2000

образование: факультет компьютерных наук пекинского университета.

автор | ма вэньпей

редактор: лю хэнтао

источник изображения | предоставлено aiuni

ху ятин, родившийся в 2000-х годах, решил начать бизнес после окончания университета. ху ятин обладает красивой внешностью и модной одеждой, что полностью освежает наше представление об образе предпринимателя.

ху ятин окончила факультет компьютерных наук пекинского университета, работала инженером-алгоритмом в google, alibaba и bytedance. она также участвовала в олимпиаде по информатике и выиграла национальную золотую медаль и награду лучшей спортсменки. во время стажировки на большом заводе она увидела, что интернет-трафик достиг своего пика, но 3d — это увеличение размерности контента, поэтому после окончания колледжа она решила заняться бизнесом.

aiuni, основанная ху ятингом, представляет собой ip-платформу для 4d-анимации, созданной искусственным интеллектом. в июне этого года созданная aiuniai 3d-модель unique3d была выложена с открытым исходным кодом на github, huggingface и других платформах. она быстро вошла в рейтинг популярных моделей на huggingface. номинирована как «самая популярная модель». «создание 3d-моделей из лучших изображений» завоевало похвалы многих разработчиков.

unique3d способен генерировать высококачественные трехмерные сетки с разнообразной текстурой из однопроекционного изображения примерно за 30 секунд на видеокарте 4090. многие пользователи сети поделились результатами своей генерации в социальных сетях и похвалили модель за достижение очень высокого уровня с точки зрения точности, последовательности и эффективности. всего за несколько месяцев unique3d достиг миллионов созданных копий.

этим летом ху ятин присоединился к 25-му этапу entrepreneurship star camp — передовой программы ускорения развития искусственного интеллекта star camp.

после акселерации она будет на сцене 2024demo china с 19 по 20 числа этого месяца, демонстрируя свои мысли о продуктах и ​​коммерческом применении известным инвесторам, отраслевым экспертам и отраслевым партнерам в различных областях на передовой основе. образом.

ориентация на рынок 3d

в качестве ключевого средства отображения реального мира в мире интернета 3d-технологии проникли в различные области: от разработки игр, производства фильмов до дизайна продуктов, рендеринга электронной коммерции и архитектурного планирования. сценарии применения 3d-технологий охватывают почти все. вся интернет-индустрия.

в зависимости от сценария применения стоимость 3d-моделирования также варьируется. чем детальнее модель, тем громоздче производственный процесс, длительный производственный цикл и высокая стоимость. стоимость создания каждой 3d-модели требует как минимум нескольких. тысячи или даже десятки тысяч юаней.

в настоящее время основными областями применения 3d-моделирования являются анимация, кино, телевидение, игры и другие индустрии развлечений. в игровой индустрии, благодаря постоянному развитию 3d-движков, 3d-игры постепенно стали основным направлением рынка, а спрос на 3d-моделирование чрезвычайно высок в индустрии анимационных фильмов и телевидения, где 3d-технологии используются только для создания грандиозных сцен; требуется технология зеленого экрана и важные актеры. его можно завершить, что снижает затраты на персонал драмы.

согласно данным, опубликованным toubao, объем рынка 3d-моделирования в китае достигнет 10,34 млрд юаней в 2021 году, а к 2026 году ожидается, что размер рынка достигнет 19,57 млрд юаней. размер мирового рынка 3d-анимации в 2021 году оценивается примерно в 164 миллиарда долларов сша, и ожидается, что совокупный годовой темп роста рынка (cagr) составит 11,5%, достигнув примерно 310 миллиардов долларов сша к 2026 году.

команда aiuni нацелена на этот рынок.

помимо ху ятин, технический партнер компании у кайлу познакомился с ху ятин, когда она участвовала в олимпиаде по информатике. он окончил класс яо университета цинхуа и занимался исследованиями в направлении 3d-генерации и nerf в междисциплинарном информационном институте. университет цинхуа. во время учебы в бакалавриате он опубликовал множество статей. в статье новаторски предлагаются fsd (фракционная дистилляция потока в 3d) и memsr (эффективное обучение модели сверхвысокого разрешения). однажды он участвовал в составе национальной сборной олимпиады по информатике и познакомился во время соревнований. жэнь цзиньшань, операционный партнер компании, является бывшим чемпионом в области гуманитарных наук. она окончила школу менеджмента гуанхуа пекинского университета и имеет степень магистра теории искусства в чикагском университете.

аюни успешно получил три раунда финансирования, включая раунды «ангел+».

создавайте вертикальные модели для формирования технических преимуществ

в процессе создания продуктов ху ятин обнаружил, что, поскольку почти все анимации и игры вращаются вокруг персонажей, наиболее ценными из всех типов 3d-ресурсов являются персонажи. более того, многие пользователи воссоздают классических персонажей или имеют оригинальных персонажей, которых они хотят реализовать, и спрос на оригинальность относительно велик. ху ятин считает, что эту часть больше подходит для создания с помощью aigc.

«эти пользователи надеются создавать 3d-персонажей удобно и дешево, но стоимость 3d-моделирования высока, и в большинстве случаев его можно использовать только в студиях b-стороны, таких как анимация, кино и телевидение».

когда искусственный интеллект используется для максимального снижения порога 3d-моделирования, пользователи, которые ранее не могли создавать 3d-контент, получат возможность создавать новые 3d-работы самостоятельно.

«большая часть видеоконтента, который мы видим сейчас, снимается в реальном времени. в будущем анимация и спецэффекты на основе 3d-моделей будут превращаться в короткие видеоролики, а количество видео и творчества значительно увеличится». сказал.

по сравнению с другими изображениями генерация символов сложнее. ху ятин сказал: «поскольку 3d-модели представляют собой относительно профессиональные сцены, айюни затем будет заниматься генерацией персонажей, анимацией и синтезом видео, чтобы предоставлять услуги создателям цифрового контента. все это предъявляет более высокие требования к точности модели. например, человеческие кости и аксессуары для одежды, требуется большое количество деталей и данных, а обработка геометрических данных является огромной проблемой. в то же время, поскольку она должна поддерживать стандартные позы модели (например, позу), материал и действие. данные также должны быть более детальными.

решение aiuni заключается в достижении точности уровня sota за счет инновационной архитектуры алгоритма. по сравнению с предыдущими методами, такими как sds, aiuni решает проблемы генерации моделей, которые требуют долгосрочной оптимизации, низкого геометрического качества и несогласованности. в то же время команда также оптимизировала проблему, заключающуюся в том, что метод, основанный на модели многоракурсной диффузии, ограничен локальной несогласованностью и разрешением генерации, что затрудняет создание тонких текстур и сложных геометрических деталей. был увеличен с 256 до уровня 2k/8k, что соответствует требованиям пользователя к точности и качеству модели.

согласно статье unique3d, это решение может дать лучшие 3d-результаты благодаря модели многоракурсной диффузии и соответствующей модели нормальной диффузии, многоуровневому процессу обновления и мгновенному и последовательному алгоритму реконструкции сетки isomer. в экспериментах модель аюни сравнивалась с instantmesh, crm и openlrm, и она смогла генерировать более точную геометрию и подробные текстуры, что значительно лучше, чем другие модели.

«unique3d обладает генеративными и обобщающими возможностями и может фактически использоваться в механизмах рендеринга для создания контента, который очень ценен для пользователей». ху ятинг считает, что по сравнению с конкурирующими продуктами преимущество unique3d заключается в том, что он может дифференцировать компьютерную графику и 3d-рендеринг с помощью искусственного интеллекта. хорошо сочетается.

по сравнению с обобщенными крупными моделями крупных производителей, ху ятин считает, что aiuni имеет больше модальностей и более вертикальна: «на самом деле, у нас есть вертикальные модели с множеством различных модальностей, таких как модели настройки символов, 3d-модели, автоматическая привязка или создание действий. данных и рендеринга синтетических моделей и т. д., мы соединим их вместе по вертикали, и это не вопрос чистой вычислительной мощности или данных и требует некоторых инноваций в архитектуре алгоритмов».

обобщение больших видеомоделей является относительно сильным, но трудно контролировать согласованность символов, управляемость действий, затраты на обучение генерации и эффективность вывода. по сравнению с этим, aiuni имеет большие преимущества в этих аспектах.

от 3d к 4d для создателей интеллектуальной собственности со всего мира

на веб-сайте aiuni.ai в настоящее время есть две онлайн-функции, которые могут создавать 3d-миры и 3d-модели соответственно. ху ятин сообщил, что следующие функции, которые запустит aiuni, будут связаны с режимом анимированного видео — генерация 3d-персонажей, генерация анимации персонажей, замена реальных видео 3d-персонажами, синтез анимации персонажей в реальные видеоролики и т. д. это также направление, в котором работает команда aiuni, а именно динамический 3d-контент (т. е. 4d).

команда aiuni считает, что тенденция развития мультимодальности aigc заключается в создании 2d-моделей к созданию 3d-моделей и, наконец, к созданию 4d-контента. создание 2d-изображений из текста — это только начало. придание пространственных размеров 2d-изображениям создает 3d-модель, которая также является основным носителем будущих пространственных вычислений. они надеются, что в будущем эта функция сможет придать 3d-моделям временное измерение и превратить их в высокочастотный интерактивный 4d-контент.

«после того, как мы создадим 3d-модель персонажа, мы можем продолжить ее расширение до 4d, например, изменить движение модели или позволить модели взаимодействовать с пользователем. у нас также могут быть возможности рендеринга видео и голосового взаимодействия. любой модель может продолжать создавать динамический контент». ху ятин сказал, что для завершения процесса от естественной речи к изображениям, 3d-моделям и динамическому видео самое важное во всем рабочем процессе — это сочетание технологий искусственного интеллекта и графического искусства cg.

основываясь на этих ожиданиях, aiuni в апреле впервые запустила внутреннюю бета-версию создания 3d-моделей и раздала пригласительные коды по некоторым каналам. в октябре этого года компания планирует запустить новую публичную бета-версию, которая ориентирована на пользователей-создателей анимации персонажей.

«пользователь, возможно, раньше не использовал профессиональные 3d-инструменты, но может быть просто энтузиастом игр или анимации acgn. с помощью нашей платформы он также может создавать оригинальные произведения или контент для своих любимых ip-персонажей, а на платформе он может экспортировать анимированные видео и распространять их в сообществах авторов и на новых медиа-платформах: «ху ятин сказал, что новая общедоступная бета-версия будет поддерживать генерацию персонажей и анимацию и подходит для таких сцен, как устные видеоролики и танцевальные видеоролики.

что касается бизнес-модели, план айюни состоит в том, чтобы запустить различные модели взимания платы для профессиональных авторов и энтузиастов интеллектуальной собственности. профессиональным пользователям 3d нужны исходные 3d-данные, и платформа может повысить их производительность, поэтому они будут готовы платить за создателей новых медиа-ip, плата за токены взимается в основном в зависимости от времени генерации и точности рендеринга; для других типов пользователей экономика создателей более разнообразна. например, некоторые пользователи хотят добавлять персонализированные модели голоса для персонажей или использовать модели 3d-печати для создания других производных интеллектуальной собственности. это потенциальные точки оплаты.

ху ятин сказал, что aiuni в будущем будет ориентироваться на новые медиа-сценарии, создаваемые ip, и постепенно будет запускать больше мультимодальных алгоритмов, сочетающих технологию искусственного интеллекта с компьютерной графикой. зарубежные пользователи aiuniai составляют 70%, и платформа будет работать для авторов со всего мира. ху ятин сказал, что 3d/4d-модальность все еще является новой вещью, и китайцы делают больше, и у компании нет прямых конкурирующих продуктов за рубежом.

«наша миссия — создать ip-платформу для 4d-анимации, генерируемой искусственным интеллектом, ориентированную на создателей цифрового контента новых медиа. генерация 3d — наш первый шаг. в этом новом режиме у нас неограниченное творческое пространство, и мы также верим в объединение контента aigc. с размерностью придаст бесконечную жизнеспособность новому поколению создания интеллектуальной собственности», — сказал ху ятин.

революция промышленной парадигмы, вызванная технологией искусственного интеллекта, позволила многим молодым предпринимателям, таким как ху ятин, реализовать свои мечты.