новости

спустя 16 месяцев после своего создания компания wuwen core qiong привлекла финансирование в размере 1 миллиарда юаней и стремится стать лучшим «оператором вычислительной мощности» в эпоху больших моделей.

2024-09-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

фотографии и информация этой газеты
infinigence ai, крупномасштабный инфраструктурный стартап, объявил сегодня о завершении финансирования серии а на сумму почти 500 миллионов юаней. на данный момент компания wuwen xinqiong, созданная всего 16 месяцев, завершила финансирование на сумму почти 1 миллиард юаней.
ся лисюэ, соучредитель и генеральный директор wuwen xinqiong, считает, что новый «восьмой-восьмой закон», принесенный волной искусственного интеллекта 2.0, должен решить только 20% ключевых технических проблем, чтобы поддержать 80% обобщения вертикальных сценариев, и экосистема вычислительной мощности китая мы сталкиваемся с дисбалансом спроса и предложения и неравномерным распределением ресурсов, что, несомненно, создает для wuwenxinqiong возможности для совместной работы вверх и вниз по течению для достижения эффективной интеграции разнообразных и гетерогенных вычислительных мощностей.
увэнь синьцюн сказал, что средства, полученные от этого финансирования, будут использованы для усиления набора технических талантов, технологических исследований и разработок, поддержания технологического лидерства в области сотрудничества в области программного и аппаратного обеспечения, а также диверсификации и неоднородности для дальнейшего содействия коммерциализации продуктов и поддержания; гетерогенное облако infini-ai. тесная интеграция между платформенными продуктами и рынком; укрепление экологического сотрудничества, активация гетерогенных кластерных вычислительных ресурсов, создание базы вычислительных мощностей искусственного интеллекта, которая поддерживает «типы моделей m» и «типы n чипов» и служит в качестве «суперусилитель вычислительной мощности модели искусственного интеллекта» «...увэнь синьцюн будет стремиться стать первым «оператором вычислительной мощности» в эпоху больших моделей.
станьте «суперусилителем» вычислительной мощности модели искусственного интеллекта.
фактический промышленный масштаб, который могут поддерживать большие модели, зависит от фактической доступной вычислительной мощности модели ии. wuwen core qiong считает, что фактическая доступная вычислительная мощность большой модели не только зависит от теоретической вычислительной мощности чипа, но также может повысить эффективность использования вычислительной мощности за счет коэффициентов оптимизации, а также увеличить общий масштаб вычислительной мощности за счет размера кластера. поэтому вувэнь кор цюн предложил формулу «вычислительная мощность чипа × коэффициент оптимизации (совместная работа программного и аппаратного обеспечения) × размер кластера (множественная гетерогенность) = вычислительная мощность модели искусственного интеллекта». следуя этой формуле, wuwen core qiong продолжит улучшать использование вычислительной мощности чипов в задачах больших моделей посредством совместной технологии оптимизации программного и аппаратного обеспечения, а также улучшать использование вычислительной мощности кластера и расширять использование вычислительной мощности кластера за счет множества гетерогенных вычислений. технология адаптации мощности общий вычислительный источник питания отрасли.
что касается совместной оптимизации программного и аппаратного обеспечения, wuwen xinqiong значительно улучшила использование основного и гетерогенного оборудования с помощью собственной разработки технологии ускорения вывода flashdecoding++, превзойдя предыдущую sota, и завершила несколько основных крупных моделей с открытым исходным кодом в amd, huawei ascend. , он был адаптирован к более чем 10 типам вычислительных карт, таких как biren, cambrian, suiyuan, haiguang, tianshu zhixin, muxi, moore thread, nvidia и т. д., и достиг лучших в отрасли результатов ускорения вывода на некоторых вычислительных картах. эффективно удовлетворяйте растущий спрос на рассуждения на больших моделях в различных отраслях. основываясь на результатах оптимизации, достигнутых с помощью этого решения, wuwen core dome подписала соглашение о стратегическом сотрудничестве с amd, чтобы совместно способствовать повышению производительности коммерческих приложений искусственного интеллекта.
что касается адаптации мультигетерогенных вычислительных мощностей, wuwen xinqiong также обладает возможностями гетерогенной адаптации и кластеризации, которых не хватает в отрасли. крупномасштабная гетерогенная распределенная гибридная система обучения hethub, выпущенная в июле, — это первый случай в отрасли, который она представила. в общей сложности шесть комбинаций чипов «4+2», включая tianshu zhixin, muxi, moore threads, amd и nvidia, были использованы для достижения смешанного обучения мощности гетерогенных вычислений в масштабе килокалорий. достигает максимума 97,6% при среднем высоком уровне. эталонное решение примерно на 30% лучше, а это означает, что при тех же условиях многочипового компьютерного зала или кластера wuwen core dome может сократить общее время обучения на 30%.
предоставляет полный набор возможностей: от использования гетерогенных вычислительных мощностей до разработки приложений для крупных моделей.
в последние годы уровень модели и уровень микросхем постепенно сформировали паттерн «двуглавой конвергенции» на международном уровне, в то время как уровень модели и уровень микросхем в китае продолжают представлять собой шаблон «m×n», состоящий из «m типов моделей» и «m типов моделей». n типов фишек». однако разные аппаратные платформы должны адаптироваться к различным программным стекам и цепочкам инструментов, и между разнородными чипами уже давно существует феномен «экологической разрозненности», который трудно использовать одновременно. поскольку все больше и больше отечественных чипов гетерогенной вычислительной мощности используются в локальных кластерах вычислительной мощности по всей стране, проблема сложности эффективного использования гетерогенной вычислительной мощности становится все более серьезной и постепенно становится узким местом в развитии крупной модельной индустрии китая.
опираясь на преимущества совместной работы программного и аппаратного обеспечения и мультигетерогенной технологии, wuwen core dome создала гетерогенную облачную платформу infini-ai, основанную на базе многочиповой вычислительной мощности. платформа обратно совместима с несколькими гетерогенными вычислительными мощностями и может эффективно активировать бездействующие гетерогенные вычислительные мощности по всей стране. в настоящее время действующие вычислительные мощности охватывают 15 городов по всей стране. кроме того, гетерогенная облачная платформа infini-ai также включает в себя универсальную платформу искусственного интеллекта (aistudio) и платформу обслуживания больших моделей (genstudio). с момента запуска платформы многие ведущие клиенты в отрасли крупных моделей, такие как kimi, liblibai, liepin, shengshu technology и zhipu ai, стабильно использовали гетерогенные вычислительные мощности на гетерогенной облачной платформе infini-ai и наслаждались беспроблемной разработкой крупных моделей. сервис цепочки инструментов, предоставляемый core dome.
гетерогенная облачная платформа infini-ai может не только помочь нижестоящим клиентам легко скрыть различия в оборудовании и беспрепятственно и эффективно использовать базовую гетерогенную вычислительную мощность, но также эффективно решить экологическую дилемму внутренних гетерогенных вычислительных мощностей и ускорить постепенную трансформацию верхнего уровня. приложения к гетерогенным вычислениям. миграция базы вычислительной мощности эффективно интегрирует и расширяет масштаб доступной вычислительной мощности в отечественной индустрии крупномасштабных моделей, действительно преобразует гетерогенную вычислительную мощность в полезную, достаточную и простую в использовании большую вычислительную мощность. и помогает создавать локализованные вычислительные мощности с китайскими характеристиками.
автор: шэнь цюша
текст: шэнь цюша фотографии: предоставлены собеседником редактор: шэнь цюша редактор: жэнь цюань
пожалуйста, указывайте источник при перепечатке статьи.
отчет/отзыв