après 16 mois de création, il a reçu 1 milliard de yuans de financement. wuwen core qiong vise à être le « opérateur de puissance informatique » de premier choix à l'ère des grands modèles.

après 16 mois de création, il a levé 1 milliard de yuans de financement. wuwen core qiong vise à devenir le « opérateur de puissance informatique » de premier choix à l'ère des grands modèles.

2024-09-02

photos et informations de ce journal

infinigence ai, une start-up d'infrastructure à grande échelle, a annoncé aujourd'hui avoir finalisé un financement de série a de près de 500 millions de yuans. jusqu'à présent, wuwen xinqiong, créée depuis seulement 16 mois, a réalisé un financement de près d'un milliard de yuans.

xia lixue, co-fondateur et pdg de wuwen xinqiong, estime que la nouvelle « huit-huitième loi » apportée par la vague ai 2.0 n'a besoin de résoudre que 20 % des problèmes techniques clés pour prendre en charge 80 % de la généralisation verticale des scénarios, et l'écosystème chinois de la puissance de calcul nous sommes confrontés à des déséquilibres entre l'offre et la demande et à une répartition inégale des ressources, ce qui crée sans aucun doute des opportunités pour wuwenxinqiong de travailler ensemble en amont et en aval pour parvenir à une intégration efficace d'une puissance de calcul diversifiée et hétérogène.

wuwen xinqiong a déclaré que les fonds récoltés grâce à ce financement seront utilisés pour renforcer le recrutement de talents techniques et la recherche et le développement technologique, maintenir le leadership technologique en matière de collaboration logicielle et matérielle, ainsi que la diversification et l'hétérogénéité, promouvoir davantage la commercialisation des produits et maintenir l'excellence ; cloud hétérogène infini-ai intégration étroite entre les produits de la plate-forme et le marché ; renforcer la coopération écologique, activer les ressources informatiques en cluster hétérogènes, construire une base de puissance de calcul ia qui prend en charge les « types m de modèles » et les « types n de puces » et servir de "super amplificateur de puissance de calcul du modèle d'ia" "... wuwen xinqiong s'engagera à devenir le "opérateur de puissance de calcul" de premier choix à l'ère des grands modèles.

soyez un « super amplificateur » pour la puissance de calcul des modèles d’ia

l'échelle industrielle réelle que les grands modèles peuvent prendre en charge dépend de la puissance de calcul réellement disponible du modèle d'ia. wuwen core qiong estime que la puissance de calcul réellement disponible d'un grand modèle dépend non seulement de la puissance de calcul théorique de la puce, mais peut également amplifier l'efficacité d'utilisation de la puissance de calcul grâce à des coefficients d'optimisation et amplifier l'échelle globale de la puissance de calcul grâce à la taille du cluster. par conséquent, wuwen core qiong a proposé la formule « puissance de calcul de la puce × coefficient d'optimisation (collaboration logicielle et matérielle) × taille du cluster (hétérogénéité multiple) = puissance de calcul du modèle d'ia ». suivant cette formule, wuwen core qiong continuera d'améliorer l'utilisation de la puissance de calcul des puces dans les tâches de grands modèles grâce à une technologie d'optimisation conjointe des logiciels et du matériel, d'améliorer l'utilisation de la puissance de calcul des clusters et d'étendre l'utilisation de la puissance de calcul des clusters grâce à de multiples calculs hétérogènes. technologie d'adaptation de puissance. l'alimentation globale en énergie de calcul de l'industrie.

en termes d'optimisation conjointe des logiciels et du matériel, wuwen xinqiong a considérablement amélioré le taux d'utilisation du matériel grand public et hétérogène grâce à sa technologie d'accélération d'inférence auto-développée flashdecoding++, surpassant le sota précédent, et a réalisé plusieurs grands modèles open source grand public chez amd, huawei. ascend, il a été adapté à plus de 10 types de cartes informatiques telles que biren, cambrian, suiyuan, haiguang, tianshu zhixin, muxi, moore thread, nvidia, etc., et a obtenu des résultats d'accélération d'inférence de pointe sur certaines cartes informatiques . répondre efficacement à la demande croissante de raisonnement sur grands modèles dans diverses industries. sur la base des résultats d'optimisation obtenus par cette solution, wuwen core dome a signé une coopération stratégique avec amd pour promouvoir conjointement l'amélioration des performances des applications commerciales d'ia.

en termes d'adaptation de la puissance de calcul multi-hétérogène, wuwen xinqiong dispose également de capacités d'adaptation hétérogène et de clustering qui sont rares dans l'industrie. le système de formation hybride distribué hétérogène à grande échelle hethub, lancé en juillet, est la première fois dans l'industrie. promu par huawei. un total de six combinaisons de puces « 4+2 », dont tianshu zhixin, muxi, moore threads, amd et nvidia, ont été utilisées pour obtenir une formation mixte de puissance de calcul hétérogène à l'échelle des kilocalories. atteint un maximum de 97,6 %, avec une moyenne élevée. la solution de référence est environ 30 % meilleure, ce qui signifie que dans les mêmes conditions de salle informatique multi-puces ou de cluster, wuwen core dome peut comprimer le temps total de formation de 30 %.

fournir des capacités complètes pour utiliser une puissance de calcul hétérogène et développer des applications de grands modèles

ces dernières années, la couche modèle et la couche puce ont progressivement formé un modèle de « convergence à deux têtes » au niveau international, tandis que la couche modèle et la couche puce de la chine continuent de présenter un modèle « m×n » composé de « types m de modèles » et « n types de puces". cependant, les différentes plates-formes matérielles doivent s'adapter aux différentes piles logicielles et chaînes d'outils, et il existe depuis longtemps un phénomène de « silo écologique » entre des puces hétérogènes, difficiles à utiliser simultanément. alors que de plus en plus de puces de puissance de calcul hétérogènes produites dans le pays sont utilisées dans des clusters de puissance de calcul locaux à travers le pays, le problème de la difficulté à utiliser efficacement la puissance de calcul hétérogène est devenu de plus en plus grave et est progressivement devenu un goulot d'étranglement dans le développement de la grande industrie modèle chinoise. .

s'appuyant sur les avantages de la collaboration logicielle et matérielle et de la technologie multi-hétérogène, wuwen core dome a créé la plate-forme cloud hétérogène infini-ai basée sur la base de puissance de calcul multi-puces. la plate-forme est rétrocompatible avec plusieurs puces de puissance de calcul hétérogènes et peut activer efficacement la puissance de calcul hétérogène dormante à travers le pays. la puissance de calcul actuellement opérationnelle couvre 15 villes à travers le pays. de plus, la plateforme cloud hétérogène infini-ai comprend également une plateforme d'ia unique (aistudio) et une plateforme de services à grande échelle (genstudio). depuis le lancement de la plate-forme, de nombreux clients leaders dans de grandes industries de modèles tels que kimi, liblibai, liepin, shengshu technology et zhipu ai ont utilisé de manière stable une puissance de calcul hétérogène sur la plate-forme cloud hétérogène infini-ai et ont bénéficié d'un développement de grands modèles sans tracas. service de chaîne d’outils fourni par core dome.

la plate-forme cloud hétérogène infini-ai peut non seulement aider les clients en aval à masquer facilement les différences matérielles et à utiliser la puissance de calcul hétérogène sous-jacente de manière transparente et efficace, mais elle brisera également efficacement le dilemme écologique de la puissance de calcul hétérogène nationale et accélérera la transformation progressive de la couche supérieure. applications vers l'informatique hétérogène. la migration de la base de puissance de calcul intègre et élargit efficacement l'échelle de la puissance de calcul disponible dans l'industrie nationale du modèle à grande échelle, transforme véritablement la puissance de calcul hétérogène en une grande puissance de calcul utilisable, suffisante et facile à utiliser. , et aide à construire une puissance de calcul localisée avec des caractéristiques chinoises.

auteur : shen qiusha

texte : shen qiusha photos : fournies par la personne interrogée editeur : shen qiusha editeur : ren quan

veuillez indiquer la source lors de la réimpression de cet article.

rapport/commentaires

nouvelles

après 16 mois de création, il a levé 1 milliard de yuans de financement. wuwen core qiong vise à devenir le « opérateur de puissance informatique » de premier choix à l'ère des grands modèles.

introduction

mes coordonnées