Versión europea de OpenAI CEO: no hay riesgos en el modelo de código abierto, solo veo los beneficios

Versión europea del CEO de OpenAI: no hay riesgos en el modelo de código abierto, solo veo los beneficios

2024-08-07

【Nota del editor】tener“OpenAI europeo”Mistral AI, conocida como Mistral AI, ha sido valorada en 6 mil millones de dólares después de solo un año de establecimiento.

Desde su creación, Mistral AI ha realizado esfuerzos frecuentes en el campo del código abierto y recientemente lanzó su modelo insignia de nueva generación. Mistral Grande 2, logrando un rendimiento comparable al Llama 3.1 405B con menos de un tercio del número de parámetros.

Recientemente, el cofundador y director ejecutivo de Mistral AI, Arthur Mensch, habló en detalle en una entrevista exclusiva con la revista Time. Temas como cómo Mistral AI atrae el escaso talento en inteligencia artificial (IA), cómo lograr rentabilidad y la falta de un ecosistema europeo de IA。

Las ideas centrales son las siguientes:

Mensch dice que no hay riesgos con el modelo de código abierto, sólo ve beneficios;
El modelo de código abierto es una herramienta neutral que se puede utilizar para hacer cualquier cosa;
La gente no está prohibiendo el uso de C sólo porque se pueda crear malware en C;
En cierto sentido, la IA no cambia nada sobre el software, es sólo una forma más abstracta de definir el software;
La tecnología utilizada para construir estas aplicaciones no es lo único que se puede regular, es importante controlar la calidad de las aplicaciones que se ponen en el mercado;
En cierto sentido, los modelos grandes pueden verse como un lenguaje de programación más abstracto que cambiará la forma en que trabajamos en los próximos 10 años;
Mistral AI no ha cambiado en términos de código abierto, pero siempre ha querido tener modelos líderes en el campo del código abierto, así como algunas funciones avanzadas que solo se pueden obtener a través de servicios monetizados.

Imagen | Arthur Mensch, cofundador y director ejecutivo de Mistral AI

El académico Toutiao ha realizado una recopilación sencilla sin cambiar la idea principal del texto original. El contenido es el siguiente:

Durante el año pasado, Mistral AI, con sede en París, se ha convertido rápidamente en una de las empresas locales de IA más influyentes de Europa. La startup ha lanzado seis modelos de lenguaje que pueden responder preguntas, generar código y realizar razonamientos básicos.

En junio, Mistral AI dijo que había recaudado 645 millones de dólares en una ronda de financiación que la valoró en más de 6 mil millones de dólares. En febrero, llegaron a un acuerdo con Microsoft para poner sus modelos a disposición de los clientes de este último a cambio de acceso a los recursos informáticos de Microsoft.

El cofundador y director ejecutivo de Mistral AI, Arthur Mensch, interviene en el debate sobre la histórica Ley de Inteligencia ArtificialEn lugar de regular modelos fundamentales como Mistral, los legisladores deberían centrarse en regular cómo otros usan estos modelos. . También se opone a las restricciones a que los desarrolladores de IA compartan libremente sus creaciones. "No veo ningún riesgo en el modelo de código abierto. Sólo veo los beneficios", afirmó.

TIME habló con Mensch sobre cómo atraer el escaso talento de IA, cómo Mistral AI puede volverse rentable y la falta de un ecosistema de IA en Europa.

P: Hace unos meses, su director comercial, Florian Bressand, le dijo a CNBC que más de la mitad del equipo de I+D de Llama ahora trabaja en Mistral. ¿Cómo atrajiste a tantos excelentes investigadores del Meta?

Al principio, atamos a nuestros propios amigos. Podemos hacer esto porque hemos hecho algunas contribuciones significativas al campo, para que la gente sepa que es divertido trabajar con nosotros. Luego, a partir de diciembre, empezamos a contratar a algunas personas que no conocíamos muy bien. Esto se debe a la estrategia que estamos siguiendo para impulsar el campo en una dirección más abierta. Esta es también la misión de muchos científicos. Tienen razones similares a las nuestras y les gusta la antigua forma de libre comunicación y flujo de información.

P: Muy pocas personas en el mundo pueden entrenar un sistema de inteligencia artificial como Mistral. Sé que la industria de la IA en Francia está muy desarrollada, pero ¿crees que has reclutado con éxito a una parte considerable (o incluso a la totalidad) de las personas que entienden la IA?

(Por supuesto) No todos. Muchos de nuestros amigos están en la industria, están en Google, OpenAI y algunas personas todavía están en Meta. Pero ciertamente atrajimos a 15 personas que supieron entrenar a estos modelos. Si bien es difícil estimar el tamaño del grupo de talentos, yo diría que probablemente era el 10% de las personas que sabían cómo trabajar en estas cosas en ese momento.

P: Mistral AI ha estado recaudando fondos, ¿dónde ha gastado el dinero?

Gastamos principalmente nuestro dinero en informática. La estructura de esta industria es diferente a la de la industria del software, porque al principio es necesario invertir mucho dinero para formar un equipo de investigación científica y construir modelos de vanguardia.

P: Los ejecutivos de casi todas las demás empresas de modelos básicos han hablado de cómo esperan gastar 100 mil millones de dólares en informática en los próximos años. ¿Tienes expectativas similares?

Hemos gastado alrededor de 25 millones de euros en los últimos 12 meses para llegar a donde estamos hoy: tenemos presencia global y nuestros modelos están a la vanguardia en términos de rendimiento y eficiencia. Nuestro argumento es que podemos utilizar el capital de manera más eficiente y la tecnología que estamos desarrollando en realidad requiere mucho capital, pero con una buena idea se puede implementar con menos gasto que nuestros competidores. Lo hemos demostrado en 2023-2024 y esperamos que continúe en 2024-2025. Obviamente vamos a gastar más. Pero nuestro gasto seguirá siendo una fracción del de nuestros competidores.

P: ¿Actualmente son rentables?

aún no. Nuestra inversión fue bastante grande y para una startup que solo tenía 12 meses no se esperaba rentabilidad.

P: ¿Cuál es el plan de ganancias? ¿Cuál es su modelo de negocio?

Nuestro modelo de negocio es construir modelos de vanguardia y ponerlos a disposición de los desarrolladores. Estamos construyendo una plataforma para desarrolladores que les permite personalizar modelos de IA y desarrollar aplicaciones de IA diferenciadas: pueden implementar la tecnología donde quieran, potencialmente sin usar servicios de nube pública, lo que les permite personalizar modelos en lugar de usar modelos genéricos detrás de API opacas y cerradas. como ocurre actualmente. Finalmente, también prestamos gran atención a la eficiencia del modelo, de modo que podamos lograr un cierto nivel de capacidades de inferencia para hacer que el modelo sea lo más rápido y económico posible.

Eso es lo que estamos construyendo: una plataforma de desarrollo que hospedamos nosotros mismos y luego brindamos servicios a los clientes a través de API y servicios administrados. Pero también implementamos la plataforma para clientes que desean un control total sobre la tecnología, de modo que podamos brindarles acceso al software y control total sobre los datos utilizados en sus aplicaciones.

P: ¿Es justo decir que su plan es crear modelos de IA para usted y sus clientes a un costo menor que sean casi comparables a los de sus competidores, y hacer que estos modelos estén más disponibles públicamente? ¿O espera igualar los modelos más avanzados o los "modelos de vanguardia" de sus competidores en términos de capacidades absolutas?

Planeamos seguir poniéndonos al día y eventualmente ser tan competitivos como otras empresas. Pero, de hecho, nuestro modelo de negocio es algo que otras empresas no tienen. Preferimos compartir, personalizar y desplegar nuestra tecnología. Ya no tenemos control en estas áreas.

P: Recientemente, proporcionó servicios para sus modelos más potentes como API y todos sus modelos al principio estaban abiertos. ¿Por qué hiciste este cambio?

No hemos cambiado en este momento. Siempre queremos tener un modelo líder en el espacio de código abierto, pero también tener algunas funciones avanzadas que solo están disponibles a través de servicios monetizados.

Una gran parte de lo que ofrecemos es de código abierto, lo que permite a los desarrolladores adoptar nuestra tecnología y crear lo que necesiten con ella. En última instancia, estos desarrolladores vendrán y utilizarán nuestra plataforma cuando desee mover las cargas de trabajo que crearon a producción, o desee hacerlas mejores, más eficientes, mejor administradas y menos costosas de mantener, utilizando nuestro modelo de optimización latente para mejorar el rendimiento y la velocidad de las capacidades de inferencia.

Seguiremos haciendo esto. El código abierto es muy importante para nosotros. Además, estamos construyendo una plataforma para desarrolladores, que obviamente se monetizará porque realmente necesitamos un modelo de negocio que funcione. Pero esperamos aportar valor adicional a los desarrolladores que utilizan nuestro modelo de código abierto.

P: Usted suele decir que Europa no puede depender de las empresas estadounidenses de inteligencia artificial y necesita un modelo local de vanguardia. Mistral AI es una de las empresas de IA más conocidas de Europa, pero tiene una asociación con Microsoft para obtener la potencia informática que necesita. ¿La dependencia de Mistral AI de Microsoft en este sentido limitará su capacidad para desempeñar un papel de vanguardia en IA soberana?

Tenemos cuatro proveedores de nube. Somos independientes de la nube por diseño y esa ha sido nuestra estrategia desde el primer día. Nuestros modelos están disponibles a través de Microsoft Azure, así como a través de Amazon Web Services y Google Cloud Platform. Usamos los tres como proveedores de nube. También utilizamos diferentes proveedores de nube, en particular CoreWeave, para impartir formación. Construimos nuestra propia tecnología y canales de distribución para crear la independencia que pensábamos que nuestros clientes necesitaban.

P: Además de establecer laboratorios de IA en Europa, ¿debería Europa también intentar establecer su propia infraestructura informática soberana?

Creo que será bueno para el ecosistema. Pero Europa no es un actor que toma decisiones por sí solo y construye algo de la nada. Esto implica una cuestión de ecosistema, es decir, cómo garantizar que Europa pueda proporcionar efectivamente alguna infraestructura informática.

Esto es muy importante para nuestros clientes porque algunos de ellos son clientes europeos y quieren algún tipo de soberanía sobre la infraestructura de nube que utilizan. En este sentido, parte de la accesibilidad, la inferencia y la plataforma de nuestros modelos ya están implementadas en Europa. Pero puede haber algunas mejoras. Esto no lo decide Europa. Es un ecosistema y es necesario reconocer que algunas necesidades pueden resolverse. Esperamos tener algunos socios europeos en la nube en un futuro próximo.

P: Cedric O, ex ministro francés de Asuntos Digitales y uno de sus cofundadores, advirtió que el proyecto de ley sobre inteligencia artificial podría "matar" a Mistral AI. El proyecto de ley se aprobó, pero aún no se ha desarrollado un código de conducta para los modelos de IA de uso general. ¿Cómo deberían verse?

En términos generales, la Ley de Inteligencia Artificial es muy factible porque las limitaciones a las que estamos sujetos son limitaciones que ya cumplimos. Hemos documentado la forma en que utilizamos el modelo, la forma en que evaluamos el modelo, y eso se ha convertido en un requisito para los modelos de vanguardia. Entonces está bien hacer esto.

Todavía queda algo de debate sobre la transparencia del conjunto de datos de entrenamiento, que es algo que nos gustaría mucho lograr, pero debe sopesarse con la confidencialidad comercial. Muchos de nuestros derechos de propiedad intelectual también se reflejan en la forma en que procesamos y seleccionamos los datos. También son los derechos de propiedad intelectual de otros. Como empresa pequeña, tenemos mucho cuidado con nuestra propiedad intelectual porque es lo único que poseemos. Así pues, desde esa perspectiva, confiamos en que podremos encontrar una manera que sea aceptable para todas las partes.

Se nos pide que participemos y aportemos información sobre el desarrollo de especificaciones técnicas. También queremos que Europa pueda tomar decisiones independientes que promuevan el desarrollo del ecosistema y hagan felices a todos.

P: Los ejecutivos de sus competidores tienen mucho que decir sobre cómo la IA cambiará el mundo en los próximos cinco o diez años, qué les preocupa y el tipo de cosas que el desarrollo de sistemas de IA más potentes podría traer consigo. . ¿Has predicho cómo la IA cambiará el mundo?

Construimos una tecnología poderosa, pero creo que ahora hay una tendencia a asumir que esta poderosa tecnología puede resolver todos los problemas. En Mistral AI, estamos muy enfocados en asegurarnos de que nuestra tecnología pueda mejorar la productividad, brindar capacidades de razonamiento a ciertas industrias verticales, ciertos campos y, por lo tanto, generar beneficios sociales.

Todo lo que crean los humanos es una herramienta, y las nuevas herramientas que traemos aportan nuevas capacidades abstractas. Entonces, en cierto sentido, puedes considerarlo como un lenguaje de programación más abstracto. Llevamos 50 años programando en lenguajes que las computadoras entienden. Hoy en día podemos crear sistemas con solo hablarles en inglés, francés o cualquier idioma. Esto aporta un nuevo método de abstracción para trabajadores y desarrolladores, que obviamente cambiará la forma en que trabajamos durante los próximos 10 años.

Creo que si lo hacemos bien y nos aseguramos de que todos tengan esta herramienta en sus manos, que es realmente la razón por la que creamos Mistral, podemos asegurarnos de que mejore las vidas de todas las personas en todo el mundo, de todos los niveles socioeconómicos. . Para lograr esto, para nosotros, primero debemos lograr aplicaciones diferenciadas en los campos médico, educativo y otros. También es muy importante garantizar que las personas estén capacitadas y tengan acceso a la tecnología, pero también que la tecnología sea accesible para las personas; hacer que la tecnología esté disponible de una manera más abierta de lo que sería de otro modo es una forma de acelerar el desarrollo tecnológico. Si esto no fuera suficiente, los tomadores de decisiones políticas también deben desarrollar programas de apoyo para acelerar el acceso a Internet en áreas del mundo que aún no tienen acceso a Internet. Pero creo que las nuevas herramientas que estamos desarrollando (IA generativa) tienen un efecto positivo al ayudar a las personas a utilizar esta nueva herramienta.

P: ¿Te imaginas lo que sucederá en el futuro? Si ha desarrollado un modelo de IA o está desarrollando un modelo y nota algunas de sus capacidades. En este caso, ¿decidirías que es mejor no abrir el código del modelo, sino mantenerlo detrás de una API, o ni siquiera implementarlo detrás de una API?

No seremos así en el futuro previsible. Los modelos que construimos tienen capacidades predictivas. Descubrimos que la única forma de gestionar colectivamente el software y cómo utilizarlo era que fuera de código abierto. De eso se trata la ciberseguridad. Lo mismo ocurre con los sistemas operativos. Por tanto, la tecnología más segura en la actualidad es la tecnología de código abierto.

En cierto sentido, la IA no cambia nada del software. Es simplemente una forma más abstracta de definir el software. Por tanto, no veo ningún riesgo en el modelo de código abierto. Sólo veo los beneficios. Esta es una herramienta neutral que se puede utilizar para cualquier cosa. No vamos a prohibir el uso de C sólo porque se pueda crear malware en C. El modelo que lanzamos no es diferente. Por tanto, sigue siendo muy importante controlar la calidad de las aplicaciones comercializadas. Pero la tecnología utilizada para crear estas aplicaciones no es lo único que se puede regular.

Autor original: Will Henshall

noticias

Versión europea del CEO de OpenAI: no hay riesgos en el modelo de código abierto, solo veo los beneficios

Introducción

Mi informacion de contacto