noticias

Llama 3.1, "European OpenAI" lanza un nuevo modelo de código abierto Large 2 |

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Autor |

Editora|Anita Tang

Menos de un día después de que Meta lanzara el último modelo grande de código abierto Llama 3.1, la startup francesa de inteligencia artificial Mistral vino a inaugurarlo: el 24 de julio, Mistral lanzó su nuevo modelo insignia Large 2.

Mistral AI es una nueva empresa francesa de IA que acaba de establecerse hace un año. También es el actor de IA mejor financiado y competitivo en Europa hasta el momento. Sus miembros principales provienen de las principales instituciones de IA, como Google DeepMind. como Lianchuang Mensch. Los autores de grandes artículos modelo como Chinchilla han propuesto tecnologías centrales, incluidas las leyes de escala.

Apenas 4 semanas después de su creación en junio de 2023, Mistral AI recibió 105 millones de euros de financiación con un equipo de 6 personas. La empresa se centra en la investigación y el desarrollo de grandes modelos de código abierto y ha sido elogiada por el presidente francés Macron como "un modelo para que una nueva generación de empresas emergentes europeas compita con los gigantes tecnológicos estadounidenses".

En diciembre de 2023, Mistral lanzó un modelo grande de código abierto llamado Mistral 8x7B, que tiene 56 mil millones de parámetros. Su eficiencia y rendimiento son comparables al LLaMA-65B, y se convirtió en un éxito instantáneo en la industria de los modelos grandes. Además, la compañía también comparó ChatGPT y lanzó un asistente de conversación en varios idiomas llamado Le Chat (el sitio web oficial muestra que todavía está en la fase de prueba y requiere registro y solicitud para las calificaciones de prueba) para mostrar las últimas capacidades técnicas de la compañía.

Mistral dijo que Large 2 superó a Llama 3.1 405B en capacidades de generación de código, matemáticas y razonamiento utilizando menos de un tercio de los parámetros de Llama 3.1 405B, o 123 mil millones de parámetros, y superó a otros modelos líderes de IA en la generación de respuestas. demasiadas descripciones largas. Esto significa que Large 2 tiene más ventajas en términos de costo y los desarrolladores pueden ejecutarlo localmente más rápido.

Al igual que Meta's Llama 3.1, Large 2 no tiene capacidades multimodales, pero en términos de precisión y confiabilidad de las respuestas del diálogo, se puede comparar con "poco es más grande" de Llama. Mistral dijo que el problema de las alucinaciones del modelo fue uno de los focos durante el proceso de entrenamiento de Large 2. Además, Large 2 también mejora el seguimiento de comandos y las tareas conversacionales, manejando instrucciones precisas y conversaciones largas de varios turnos.

Large 2 tiene una longitud de contexto de 128k y puede recibir aproximadamente tantos caracteres como un libro de 300 páginas en una sola conversación. Además, Large 2 admite varios idiomas y puede manejar inglés, francés, alemán, español, italiano, portugués, árabe, hindi, ruso, chino, japonés y coreano, así como 80 idiomas de código.


Fuente: sitio web oficial de Mistral

Cabe señalar que el modelo de Mistral no es un modelo de código abierto en el sentido tradicional y el uso comercial requiere pago.

Actualmente, Large 2 ha ingresado a las plataformas de Google, Amazon, Azure e IBM para que lo utilicen los usuarios. Los usuarios también pueden experimentarlo a través de "mistral-large-2407" en La Plateforme de Mistral (una plataforma integral que simplifica el desarrollo de aplicaciones de IA y proporciona modelos previamente entrenados, herramientas de procesamiento de datos e interfaces API), o probarlo de forma gratuita en Le Chat.

Mistral completó el financiamiento Serie B en junio de este año, recaudando un total de 640 millones de dólares y una valoración de 6 mil millones de dólares. Esta ronda de financiación fue liderada por General Catalyst, y entre los inversores también se encuentran Lightspeed Venture Partners, Andreessen Horowitz, Nvidia, Samsung Ventures e IBM.

Mistral AI cuenta actualmente con aproximadamente 60 empleados, 45 de los cuales están en Francia, 10 en Estados Unidos y cinco en el Reino Unido. Aproximadamente tres cuartas partes de sus empleados trabajan en investigación y desarrollo de productos, según el Financial Times.