noticias

"La función más potente y de bajo coste"! OpenAI lanza GPT-4o mini para participar en la competencia de modelos pequeños

2024-07-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

OpenAI lanzó "GPT-4o mini" el jueves, hora del Este, entrando en la competencia de modelos de IA "pequeños pero refinados". Llamó a este nuevo modelo "el modelo más potente y de bajo costo" y planeó integrar imágenes, videos y audio. en el futuro.

Más de un 60% más barato que GPT-3.5 Turbo y el rendimiento del chat es mejor que el de los productos de la competencia

La compañía dijo que GPT-4o mini está disponible para los usuarios gratuitos de ChatGPT, suscriptores de ChatGPT Plus y Teams a partir del jueves, y estará disponible para los usuarios empresariales de ChatGPT la próxima semana. GPT-4o mini reemplazará el modelo anterior GPT-3.5 Turbo en ChatGPT. OpenAI dijo que GPT-4o mini cuesta 15 centavos por millón de tokens de entrada y 60 centavos por millón de tokens de salida, lo que lo hace más de un 60% más barato que GPT-3.5 Turbo.

La compañía también dijo que el nuevo modelo actualmente supera al modelo GPT-4 en preferencias de chat y logró una puntuación del 82% en la prueba masiva de comprensión del lenguaje multitarea (MMLU). Según informes de los medios, MMLU es un punto de referencia de razonamiento e inteligencia textual que se utiliza para evaluar las capacidades del modelo lingüístico. Una puntuación MMLU más alta indica una mejor comprensión y uso del lenguaje en una variedad de dominios, lo que mejora su aplicación en el mundo real.

Según datos de OpenAI, el modelo GPT-4o mini obtuvo un 82%, que es más alto que los otros dos competidores de bajo costo, Gemini Flash de Google obtuvo un 77,9% y Claude Haiku de Anthropic obtuvo un 73,8%.

Entre los modelos más grandes, el GPT-3.5 obtuvo una puntuación del 70% en esta prueba, el GPT-4o obtuvo una puntuación del 88,7% y Google afirma que su Gemini Ultra logró su puntuación más alta del 90%.

El análisis sugiere que los modelos de lenguaje más pequeños requieren menos potencia informática para funcionar, lo que los convierte en una opción más asequible para empresas con recursos limitados para implementar IA generativa.

Además, este nuevo modelo liviano también admitirá funciones visuales y de texto en la API, y OpenAI dice que pronto manejará todas las entradas y salidas multimodales, como video y audio. Con estas capacidades, esto podría actuar como un asistente virtual más poderoso, capaz de comprender su itinerario de viaje y hacer recomendaciones. Sin embargo, este modelo actualmente sólo se puede utilizar principalmente para tareas sencillas.

La competencia por modelos de IA “pequeños pero refinados” es feroz y OpenAI finalmente entra al juego

Según informes de los medios, la valoración de OpenAI, respaldada por Microsoft, ha superado los 80.000 millones de dólares. Aunque todavía ocupa una posición de liderazgo en el mercado de la IA generativa, la empresa se enfrenta a una presión competitiva cada vez mayor. OpenAI también necesita encontrar formas de ganar dinero, ya que la empresa gasta mucho dinero en procesadores e infraestructura para construir y entrenar sus modelos.

Sin embargo, muchas empresas no pueden permitirse modelos más grandes y caros, por lo que los modelos ligeros y más baratos pueden ser más populares. Hasta entonces, muchos desarrolladores elegirían Claude 3 Haiku o Gemini 1.5 Flash en lugar de pagar los altos costos computacionales necesarios para ejecutar los modelos más potentes. Por ejemplo, un modelo más pequeño puede ser más adecuado para automatizar tareas básicas de gran volumen, mientras que un modelo más grande puede manejar trabajos más complejos. Es posible que algunos desarrolladores deseen utilizar ambos modelos en una sola aplicación.

Olivier Godement, líder de productos API de OpenAI, explicó en una entrevista con los medios por qué la compañía no lanzó antes modelos de IA "pequeños y refinados". Dijo que esto era puramente una cuestión de "prioridad" porque OpenAI se centró en crear más grandes y mejores. Los modelos, como GPT-4, requieren importantes recursos humanos y computacionales. Con el tiempo, OpenAI notó que los desarrolladores estaban cada vez más interesados ​​en utilizar modelos más pequeños, por lo que la compañía decidió que ahora era el momento de invertir recursos en el desarrollo de GPT-4o Mini.

"Nuestra misión es crear la tecnología más avanzada y crear las aplicaciones más potentes y útiles, y ciertamente esperamos continuar creando modelos de vanguardia y promoviendo el avance tecnológico", dijo el líder de productos API de OpenAI, Olivier Godement, en una entrevista con los medios de comunicación. "Pero también queremos tener el mejor modelo pequeño y creo que será muy popular".

"Creo que GPT-4o Mini realmente encarna la misión de OpenAI de hacer que la IA sea más accesible. Si queremos que la IA beneficie a todos los rincones del mundo, a todas las industrias y a todas las aplicaciones, debemos hacer que los productos de la plataforma API de OpenAI sean más asequibles", dijo Olivier. dijo Godement a los medios.

GPT-4o mini ayuda a los empleados a concentrarse

Godement dijo que algunos desarrolladores han estado probando el modelo durante la semana pasada.

OpenAI le pidió a la startup fintech Ramp que probara el modelo, utilizando GPT-4o Mini para crear una herramienta que extraiga datos de gastos de los recibos. Para que los usuarios puedan subir fotos de sus recibos y el modelo organizará los datos por ellos. El cliente de correo electrónico Superhuman también probó GPT-4o Mini y lo utilizó para crear una función que sugiere automáticamente respuestas de correo electrónico.

Inicialmente, GPT-4o mini podrá procesar y generar texto e imágenes. Una vez que se complete la versión final, OpenAI dice que podrá manejar otros tipos de contenido.

OpenAI también dijo que GPT-4o mini es el primer modelo de IA de la compañía que utiliza su nueva "jerarquía de instrucciones" de política de seguridad. El objetivo de este enfoque es hacer que los sistemas de inteligencia artificial den prioridad a ciertas instrucciones, como las de las empresas, para dificultar que las personas hagan que la herramienta haga algo que se supone que no debe hacer.

El análisis cree que el mini modelo GPT-4o es parte del compromiso de OpenAI con la "multimodalidad", es decir, proporcionar una amplia gama de medios generados por IA (como texto, imágenes, audio y video) en una sola herramienta: ChatGPT.

El año pasado, el director de operaciones de OpenAI, Brad Lightcap, dijo a los medios:

"El mundo es multimodal. Si piensas en la forma en que nosotros, como humanos, procesamos y nos relacionamos con el mundo, vemos cosas, oímos cosas, hablamos, el mundo no es sólo texto. Así que, para nosotros, sólo hay texto y código como Una única modalidad, una única interfaz, siempre parece incompleta porque el poder de estos modelos y lo que pueden hacer es mucho más”.