nouvelles

Llama 3.1, « European OpenAI » lance un nouveau modèle open source Large 2 Forefront |

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Auteur | Wang Yixin

Rédactrice|Anita Tang

Moins d'un jour après que Meta ait publié le dernier grand modèle open source Llama 3.1, la startup française d'IA Mistral est venue le lancer - le 24 juillet, Mistral a publié son nouveau modèle phare Large 2.

Mistral AI est une start-up française d'IA qui vient d'être créée il y a un an. Elle est également l'acteur d'IA le mieux financé et le plus compétitif d'Europe à ce jour. Ses principaux membres proviennent d'institutions d'IA de premier plan telles que Google DeepMind, par exemple. comme Lianchuang Mensch Les auteurs de grands articles modèles tels que Chinchilla ont proposé des technologies de base, notamment les lois de mise à l'échelle.

Seulement 4 semaines après sa création en juin 2023, Mistral AI a reçu 105 millions d'euros de financement avec une équipe de 6 personnes. La société se concentre sur la recherche et le développement de grands modèles open source et a été saluée par le président français Macron comme « un modèle pour une nouvelle génération de start-ups européennes souhaitant rivaliser avec les géants technologiques américains ».

En décembre 2023, Mistral a publié un grand modèle open source appelé Mistral 8x7B, qui possède 56 milliards de paramètres. Son efficacité et ses performances sont comparables à celles du LLaMA-65B, et il est devenu un succès instantané dans l'industrie du grand modèle. En outre, la société a également comparé ChatGPT et lancé un assistant de conversation multilingue appelé Le Chat (le site officiel indique qu'il est encore en phase de test et nécessite une inscription et une demande de qualification de test) pour présenter les dernières capacités techniques de la société.

Mistral a déclaré que Large 2 a surpassé Llama 3.1 405B en termes de capacités de génération de code, de mathématiques et de raisonnement en utilisant moins d'un tiers des paramètres de Llama 3.1 405B, soit 123 milliards de paramètres, et a surpassé les autres principaux modèles d'IA en termes de génération de réponses plus concises et évitantes. trop de longues descriptions. Cela signifie que Large 2 présente plus d'avantages en termes de coût et que les développeurs peuvent l'exécuter localement plus rapidement.

Comme Llama 3.1 de Meta, Large 2 n'a pas de capacités multimodales, mais en termes de précision et de fiabilité des réponses de dialogue, il peut être comparé au « petit est plus grand » de Llama. Mistral a déclaré que le problème des hallucinations du modèle était l'un des points centraux du processus de formation de Large 2. De plus, Large 2 améliore également le suivi des commandes et les tâches conversationnelles, en gérant des instructions précises et des conversations longues et à plusieurs tours.

Large 2 a une longueur de contexte de 128 Ko et peut recevoir environ autant de caractères qu'un livre de 300 pages dans une seule conversation. De plus, Large 2 prend en charge plusieurs langues et peut gérer l'anglais, le français, l'allemand, l'espagnol, l'italien, le portugais, l'arabe, l'hindi, le russe, le chinois, le japonais et le coréen, ainsi que 80 langues de code.


Source : Site officiel de Mistral

Il convient de souligner que le modèle de Mistral n'est pas un modèle open source au sens traditionnel du terme et que son utilisation commerciale est payante.

Actuellement, Large 2 est entré sur les plates-formes de Google, Amazon, Azure et IBM pour que les utilisateurs puissent l'utiliser. Les utilisateurs peuvent également en faire l'expérience via « mistral-large-2407 » sur La Plateforme de Mistral (une plateforme complète qui simplifie le développement d'applications d'IA et fournit des modèles pré-entraînés, des outils de traitement de données et des interfaces API), ou le tester gratuitement sur Le Chat.

Mistral a finalisé un financement de série B en juin de cette année, levant un total de 640 millions de dollars américains et une valorisation de 6 milliards de dollars américains. Cette ronde de financement a été menée par General Catalyst et les investisseurs comprennent également Lightspeed Venture Partners, Andreessen Horowitz, Nvidia, Samsung Ventures et IBM.

Mistral AI compte aujourd'hui environ 60 salariés, dont 45 en France, 10 aux États-Unis et cinq au Royaume-Uni. Environ les trois quarts de ses employés travaillent dans le développement de produits et la recherche, selon le Financial Times.