nouvelles

Version européenne d'OpenAI CEO : Il n'y a aucun risque dans le modèle open source, je ne vois que les avantages

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

【Note de l'éditeur】avoir« OpenAI européenne »Mistral AI, connu sous le nom de Mistral AI, est évalué à 6 milliards de dollars après seulement un an de création.

Depuis sa création, Mistral AI a souvent fait des efforts dans le domaine de l'open source et a récemment publié son modèle phare de nouvelle génération. Mistral Grand 2, atteignant des performances comparables à celles du Llama 3.1 405B avec moins d'un tiers du nombre de paramètres.

Récemment, Arthur Mensch, co-fondateur et PDG de Mistral AI, en a parlé en détail dans une interview exclusive avec le magazine Time. Des sujets tels que la manière dont Mistral AI attire les rares talents en intelligence artificielle (IA), comment atteindre la rentabilité et le manque d'écosystème européen d'IA.

Les idées principales sont les suivantes :

  • Mensch affirme qu'il n'y a aucun risque avec le modèle open source, il n'y voit que des avantages ;
  • Le modèle open source est un outil neutre qui peut être utilisé pour tout faire ;
  • Les gens n’interdisent pas l’utilisation du C simplement parce qu’il est possible de créer des logiciels malveillants en C ;
  • Dans un sens, l’IA ne change rien au logiciel, c’est juste une manière plus abstraite de définir le logiciel ;
  • La technologie utilisée pour construire ces applications n'est pas la seule chose qui peut être réglementée, il est important de contrôler la qualité des applications mises sur le marché ;
  • Dans un sens, les grands modèles peuvent être considérés comme un langage de programmation plus abstrait qui changera notre façon de travailler au cours des 10 prochaines années ;
  • Mistral AI n'a pas changé en termes d'open source, mais a toujours voulu disposer de modèles leaders dans le domaine de l'open source, ainsi que de certaines fonctionnalités avancées qui ne peuvent être obtenues que via des services monétisés.



Photo | Arthur Mensch, co-fondateur et PDG de Mistral AI

L'académicien Toutiao a réalisé une compilation simple sans changer l'idée principale du texte original. Le contenu est le suivant :

Au cours de l’année écoulée, Mistral AI, basée à Paris, est rapidement devenue l’une des sociétés locales d’IA les plus influentes d’Europe. La startup a publié six modèles de langage capables de répondre aux questions, de générer du code et d'effectuer un raisonnement de base.

En juin, Mistral AI a annoncé avoir levé 645 millions de dollars lors d'un cycle de financement qui l'a valorisé à plus de 6 milliards de dollars. En février, ils ont conclu un accord avec Microsoft pour mettre leurs modèles à la disposition des clients de cette dernière en échange d'un accès aux ressources informatiques de Microsoft.

Arthur Mensch, co-fondateur et PDG de Mistral AI, intervient dans le débat sur la loi historique sur l'intelligence artificiellePlutôt que de réglementer des modèles fondateurs comme Mistral, les législateurs devraient se concentrer sur la réglementation de la manière dont d’autres utilisent ces modèles. . Il s’oppose également aux restrictions imposées aux développeurs d’IA partageant librement leurs créations. "Je ne vois aucun risque dans le modèle open source. Je n'en vois que les avantages", a-t-il déclaré.

TIME s'est entretenu avec Mensch sur la manière d'attirer les rares talents en IA, sur la manière dont Mistral AI peut devenir rentable et sur l'absence d'un écosystème d'IA en Europe.

Q : Il y a quelques mois, votre directeur commercial Florian Bressand a déclaré à CNBC que plus de la moitié de l'équipe R&D de Llama travaille désormais chez Mistral. Comment avez-vous attiré autant d’excellents chercheurs de Meta ?

Au début, nous avons encerclé nos propres amis. Nous pouvons le faire parce que nous avons apporté des contributions significatives dans le domaine, donc les gens savent que c'est amusant de travailler avec nous. Puis, à partir de décembre, nous avons commencé à embaucher des personnes que nous ne connaissions pas très bien. Cela est dû à la stratégie que nous suivons pour pousser le domaine dans une direction plus ouverte. C'est aussi la mission de nombreux scientifiques. Ils ont des raisons similaires aux nôtres et aiment l'ancienne méthode de libre communication et de circulation de l'information.

Q : Très peu de personnes dans le monde peuvent entraîner un système d’IA comme Mistral. Je sais que l'industrie de l'IA en France est très développée, mais pensez-vous avoir réussi à recruter une partie considérable (voire la totalité) des personnes qui comprennent l'IA ?

(Bien sûr) Pas tout le monde. Beaucoup de nos amis sont dans l'industrie, ils sont chez Google, OpenAI et quelques personnes sont encore chez Meta. Mais nous avons certainement attiré 15 personnes qui savaient former ces modèles. Bien qu'il soit difficile d'estimer la taille du vivier de talents, je dirais que c'était probablement 10 % des personnes qui savaient comment travailler sur ce genre de choses à l'époque.

Q : Mistral AI a collecté des fonds, où avez-vous dépensé l'argent ?

Nous dépensions principalement notre argent en informatique. La structure de cette industrie est différente de celle de l'industrie du logiciel, car au début, il faut investir beaucoup d'argent pour former une équipe de recherche scientifique et construire des modèles de pointe.

Q : Les dirigeants de presque toutes les autres entreprises du modèle de base ont expliqué qu'ils prévoyaient de dépenser 100 milliards de dollars en informatique au cours des prochaines années. Avez-vous des attentes similaires ?

Nous avons dépensé environ 25 millions d'euros au cours des 12 derniers mois pour arriver là où nous en sommes aujourd'hui : nous avons une présence mondiale et nos modèles ouvrent la voie en termes de performances et d'efficacité. Notre argument est que nous pouvons utiliser le capital plus efficacement et que la technologie que nous développons est en réalité à forte intensité de capital, mais avec une bonne idée, elle peut être mise en œuvre à moindre coût que nos concurrents. Nous l’avons prouvé en 2023-2024 et nous espérons que cela continuera en 2024-2025. Évidemment, nous allons dépenser davantage. Mais nos dépenses ne représenteront toujours qu’une fraction de celles de nos concurrents.

Q : Êtes-vous actuellement rentable ?

pas encore. Notre investissement était assez important, et pour une startup qui n'avait que 12 mois, la rentabilité n'était pas attendue.

Q : Qu’est-ce que le plan de profit ? Quel est votre modèle économique ?

Notre modèle économique consiste à construire des modèles de pointe et à les mettre à disposition des développeurs. Nous construisons une plate-forme de développement qui permet aux développeurs de personnaliser les modèles d'IA et de développer des applications d'IA différenciées. Ils peuvent déployer la technologie là où ils le souhaitent, potentiellement sans utiliser de services de cloud public, ce qui leur permet de personnaliser des modèles au lieu d'utiliser des modèles génériques derrière des API fermées et opaques. comme c'est le cas actuellement. Enfin, nous accordons également une grande attention à l’efficacité du modèle, afin de pouvoir atteindre un certain niveau de capacités d’inférence afin de rendre le modèle aussi rapide et aussi bon marché que possible.

C'est ce que nous construisons : une plate-forme de développement que nous hébergeons nous-mêmes et que nous servons ensuite aux clients via des API et des services gérés. Mais nous déployons également la plateforme pour les clients qui souhaitent un contrôle total sur la technologie, afin de pouvoir leur donner accès aux logiciels et un contrôle total sur les données utilisées dans leurs applications.

Q : Est-il juste de dire que votre projet est de créer pour vous et vos clients des modèles d'IA à un coût inférieur, presque comparables à ceux de vos concurrents, et de rendre ces modèles plus accessibles au public ? Ou espérez-vous égaler les modèles les plus avancés ou les « modèles de pointe » de vos concurrents en termes de capacités ?

Nous prévoyons de continuer à rattraper notre retard et, à terme, d'être aussi compétitifs que les autres entreprises. Mais en réalité, notre modèle économique est quelque chose que d’autres entreprises n’ont pas. Nous préférons partager, personnaliser et déployer notre technologie. Nous n'avons plus de contrôle dans ces domaines.

Q : Récemment, vous avez fourni des services pour vos modèles les plus puissants sous forme d'API, et au début, tous vos modèles étaient ouverts. Pourquoi avez-vous fait ce changement ?

Nous n'avons pas changé à ce stade. Nous souhaitons toujours avoir un modèle leader dans l'espace open source, mais également disposer de fonctionnalités avancées qui ne sont disponibles que via des services monétisés.

Une grande partie de ce que nous proposons est open source, ce qui permet aux développeurs d'adopter notre technologie et de créer tout ce dont ils ont besoin avec. En fin de compte, ces développeurs viendront utiliser notre plateforme lorsque vous souhaiterez déplacer les charges de travail qu'ils ont créées en production, ou si vous souhaitez les rendre meilleures, plus efficaces, mieux gérées et moins coûteuses à maintenir, en utilisant notre modèle d'optimisation latente pour améliorer les performances et la vitesse des capacités d’inférence.

Nous continuerons à faire cela. L'open source est très important pour nous. Nous construisons par-dessus cela une plateforme de développement, qui sera évidemment monétisée car nous avons vraiment besoin d'un modèle économique qui fonctionne. Mais nous espérons apporter une valeur supplémentaire aux développeurs utilisant notre modèle open source.

Q : Vous dites souvent que l’Europe ne peut pas s’appuyer sur les sociétés américaines d’IA et a besoin d’un modèle local de pointe. Mistral AI est l'une des sociétés d'IA les plus connues en Europe, mais elle a conclu un partenariat avec Microsoft pour obtenir la puissance de calcul dont elle a besoin. La dépendance de Mistral AI à l'égard de Microsoft à cet égard limitera-t-elle sa capacité à jouer un rôle souverain de pointe en matière d'IA ?

Nous avons quatre fournisseurs de cloud. Nous sommes indépendants du cloud par conception, et c'est notre stratégie depuis le premier jour. Nos modèles sont disponibles via Microsoft Azure, ainsi que via Amazon Web Services et Google Cloud Platform. Nous utilisons les trois comme fournisseurs de cloud. Nous faisons également appel à différents fournisseurs de cloud, notamment CoreWeave, pour dispenser des formations. Nous avons construit notre propre pile technologique et nos propres canaux de distribution pour créer l'indépendance dont nos clients avaient besoin.

Q : En plus d’établir des laboratoires d’IA en Europe, l’Europe devrait-elle également essayer d’établir sa propre infrastructure informatique souveraine ?

Je pense que ce sera bon pour l'écosystème. Mais l’Europe n’est pas un acteur qui prend des décisions par elle-même et qui construit quelque chose à partir de rien. Cela implique une question d’écosystème, à savoir comment garantir que l’Europe puisse fournir efficacement une infrastructure informatique.

Ceci est très important pour nos clients car certains d’entre eux sont des clients européens et souhaitent une certaine forme de souveraineté sur l’infrastructure cloud qu’ils utilisent. À cet égard, une partie de l’accessibilité, de l’inférence et de la plateforme de nos modèles est en fait déjà déployée en Europe. Mais il peut y avoir quelques améliorations. Ce n’est pas l’Europe qui décide. Il s'agit d'un écosystème et il faut reconnaître que certains besoins peuvent être satisfaits. Nous espérons avoir des partenaires cloud européens dans un avenir proche.

Q : Cédric O, ancien ministre français du Numérique et l'un de vos co-fondateurs, a prévenu que le projet de loi sur l'intelligence artificielle pourrait « tuer » Mistral AI. Le projet de loi a été adopté, mais aucun code de conduite pour les modèles d’IA à usage général n’a encore été élaboré. À quoi devraient-ils ressembler ?

D’une manière générale, la loi sur l’intelligence artificielle est tout à fait réalisable car les contraintes auxquelles nous sommes soumis sont des contraintes que nous rencontrons déjà. Nous avons documenté la façon dont nous utilisons le modèle, la façon dont nous l'évaluons, et c'est devenu une exigence pour les modèles de pointe. Donc c'est bien de faire ça.

Il y a encore des discussions à avoir sur la transparence de l'ensemble des données de formation, ce que nous aimerions beaucoup atteindre, mais cela doit être mis en balance avec la confidentialité commerciale. Bon nombre de nos droits de propriété intellectuelle se reflètent également dans la manière dont nous traitons et sélectionnons les données. Il s'agit également des droits de propriété intellectuelle d'autrui. En tant que petite entreprise, nous faisons très attention à notre propriété intellectuelle car c’est la seule chose que nous possédons. De ce point de vue, nous sommes convaincus que nous pouvons trouver une solution acceptable pour toutes les parties.

Il nous est demandé de participer et d’apporter notre contribution à l’élaboration des spécifications techniques. Nous voulons également que l’Europe soit capable de faire des choix indépendants qui favorisent le développement de l’écosystème et rendent tout le monde heureux.

Q : Les dirigeants de vos concurrents ont beaucoup à dire sur la façon dont l’IA va changer le monde au cours des cinq ou dix prochaines années, sur ce qui les inquiète et sur le genre de choses que le développement de systèmes d’IA plus puissants pourrait apporter. . Avez-vous prédit comment l’IA allait changer le monde ?

Nous avons construit une technologie puissante, mais je pense qu’on a désormais tendance à supposer que cette technologie puissante peut résoudre tous les problèmes. Chez Mistral AI, nous veillons à ce que notre technologie puisse améliorer la productivité, apporter des capacités de raisonnement à certaines industries verticales, certains domaines, et ainsi générer des avantages sociaux.

Tout ce que les humains créent est un outil, et les nouveaux outils que nous apportons apportent de nouvelles capacités abstraites. Donc, dans un sens, vous pouvez le considérer comme un langage de programmation plus abstrait. Nous programmons dans des langages que les ordinateurs comprennent depuis 50 ans. De nos jours, nous pouvons créer des systèmes simplement en leur parlant en anglais, en français ou dans n'importe quelle langue. Cela apporte une nouvelle méthode d’abstraction aux travailleurs et aux développeurs, ce qui va évidemment changer notre façon de travailler au cours des 10 prochaines années.

Je pense que si nous le faisons correctement et veillons à ce que tout le monde ait cet outil entre les mains - et c'est vraiment la raison pour laquelle nous avons créé Mistral - nous pouvons nous assurer qu'il améliore la vie de chacun dans le monde, pour les personnes de tous les statuts socio-économiques. . Pour y parvenir, nous devons d’abord parvenir à des applications différenciées dans les domaines médical, éducatif et autres. Il est également très important de s'assurer que les gens sont formés et ont accès à la technologie, mais aussi que la technologie soit accessible aux gens - rendre la technologie disponible d'une manière plus ouverte que ce ne serait le cas autrement est un moyen d'accélérer le développement technologique. Si cela ne suffit pas, les décideurs politiques doivent également développer des programmes de soutien pour accélérer l’accès à Internet dans les régions du monde qui n’y ont pas encore accès. Mais je pense que les nouveaux outils que nous développons – l’IA générative – ont un effet positif en aidant les gens à utiliser ce nouvel outil.

Q : Pouvez-vous imaginer ce qui se passera dans le futur ? Si vous avez développé un modèle d'IA ou si vous développez un modèle et que vous remarquez certaines de ses capacités. Dans ce cas, décideriez-vous qu'il est préférable de ne pas ouvrir le modèle en source, mais de le conserver derrière une API, ou même de ne pas le déployer derrière une API ?

Nous ne serons pas comme ça dans un avenir prévisible. Les modèles que nous construisons ont des capacités prédictives. Nous avons découvert que la seule façon de gérer collectivement les logiciels et de les utiliser était d'être open source. C’est tout l’enjeu de la cybersécurité. Il en va de même pour les systèmes d'exploitation. Par conséquent, la technologie la plus sécurisée aujourd’hui est la technologie open source.

Dans un sens, l’IA ne change rien aux logiciels. C'est juste une manière plus abstraite de définir un logiciel. Par conséquent, je ne vois aucun risque dans le modèle open source. Je n'en vois que les avantages. Il s’agit d’un outil neutre qui peut être utilisé pour n’importe quoi. Nous n'interdisons pas l'utilisation du C simplement parce que vous pouvez créer des logiciels malveillants en C. Le modèle que nous avons publié n'est pas différent. Il reste donc très important de contrôler la qualité des applications mises sur le marché. Mais la technologie utilisée pour créer ces applications n’est pas la seule chose qui peut être réglementée.

Auteur original : Will Henshall