nouvelles

Financial Times : les challengers des puces tentent de briser le contrôle de Nvidia sur le marché de l’IA

2024-08-28

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Whip Bull Report, 28 août, selon le Financial Times, les concurrents de Nvidia prennent des mesures pour briser le monopole de Nvidia sur le marché des puces d'intelligence artificielle. Ils ont levé des centaines de millions de dollars de financement et lancé de nouveaux produits, dans l'espoir de partager les résultats. du développement prospère de la technologie de l’intelligence artificielle.

Un groupe de petites entreprises, dont Cerebras, d-Matrix et Groq, espèrent conquérir le marché multimilliardaire des puces d'IA de Nvidia, qui a jusqu'à présent dominé la première vague d'investissement avec ses unités de traitement graphique (GPU).

Ils s’attendent à ce qu’à mesure que les chatbots et autres applications d’IA générative deviennent plus populaires, la demande d’inférence d’IA (la puissance de calcul requise par des modèles comme ChatGPT d’OpenAI et Gemini de Google pour générer des réponses aux requêtes) augmentera de façon exponentielle.

Les GPU Hopper de Nvidia sont idéaux pour la tâche gourmande en ressources de formation des meilleurs modèles d'IA et sont devenus l'un des produits les plus prisés au monde.

Cerebras, d-Matrix et Groq se concentrent sur la conception de puces moins chères et plus spécialisées pour exécuter des modèles d'IA.

Mardi, Cerebras a annoncé le lancement de sa nouvelle plateforme d'inférence Cerebras basée sur la puce CS-3, qui a à peu près la taille d'une assiette.

Cerebras affirme que sa solution est 20 fois plus rapide en termes d'inférence IA que les puces Hopper de la génération actuelle de Nvidia, pour une fraction du prix. Cerebras a cité des tests menés par le fournisseur d'analyses de référence Artificial Analysis.

Andrew Feldman, PDG de Cerebras, a déclaré au Financial Times : La manière de vaincre le gorille de 800 livres est de mettre un meilleur produit sur le marché. D'après mon expérience, le meilleur produit gagne généralement et nous avons retiré des clients importants à Nvidia.

Plutôt que d'utiliser des puces mémoire distinctes à large bande passante comme celles de Nvidia, la puce CS-3 propose une architecture alternative avec une mémoire intégrée directement dans la plaquette de la puce.

Feldman a déclaré que la limitation de la bande passante mémoire est la contrainte fondamentale sur la vitesse d'inférence des puces d'intelligence artificielle. La combinaison de la logique et de la mémoire dans une grande puce peut permettre d'obtenir des résultats plusieurs fois plus rapides, a-t-il déclaré.

d-Matrix a été fondée par Sid Sheth en 2019, moins d'un an après que la société a levé 110 millions de dollars lors d'un cycle de série B dirigé par le fonds public singapourien Temasek, et a maintenant lancé un nouveau cycle de financement.

Sheth a déclaré que la société prévoyait de lever 200 millions de dollars ou plus plus tard cette année ou au début de l'année prochaine. d-Matrix en est aux premières étapes du processus de financement et a déclaré que le montant final collecté pourrait changer.

d-Matrix prévoit de lancer entièrement sa propre plate-forme de puces Corsair d'ici la fin de cette année.

Sheth a déclaré que la société associait ses produits à des logiciels ouverts comme Triton, qui concurrence Cuda de Nvidia, une plate-forme logicielle largement utilisée qui donne aux développeurs les outils nécessaires pour créer des applications d'IA et optimiser les performances de ses puces.

Le plus grand support client de Nvidia utilise des logiciels ouverts tels que Triton. "Les développeurs d'applications n'aiment pas être liés à un outil spécifique", a déclaré Sheth. "Les gens se rendent compte que Nvidia a le monopole sur Cuda en termes de formation".

Groq, un autre concurrent d'inférence d'IA dirigé par un ancien membre fondateur de l'équipe Tensor Processing Unit de Google, a levé ce mois-ci 640 millions de dollars auprès d'investisseurs dirigés par BlackRock Private Equity Partners, le valorisant à 2,8 milliards de dollars.

Malgré le battage médiatique autour du secteur, les startups de semi-conducteurs ont encore du mal à pénétrer le marché, a prévenu un investisseur en capital-risque.

SoftBank a acquis le fabricant de puces Graphcore le mois dernier pour un peu plus de 600 millions de dollars, selon des sources proches du dossier, soit moins que les quelque 700 millions de dollars de capital-risque levés par la société depuis sa création en 2016.

Groq et Cerebras ont également été fondées en 2016.

Peter Hébert, co-fondateur et associé directeur de la société de capital-risque Lux Capital, a déclaré : « Les investisseurs publics sont impatients de trouver et de soutenir le prochain Nvidia. Il ne s’agit pas seulement de suivre les dernières tendances. Cet élan profite également à plusieurs startups de puces financées par du capital-risque qui travaillent dur depuis près d’une décennie.