¿lento y caro? el modelo de inferencia openai "strawberry" ya está aquí, ¿qué tan lejos está gpt-5?

2024-09-13

la “fresa” de openai finalmente está aquí.

el 12 de septiembre, hora local, el gigante de la inteligencia artificial (ia) openai lanzó la serie openai o1 de modelos de inferencia de ia con el nombre en código "strawberry", que incluye openai o1-preview y una versión pequeña de o1-mini.

según openai, o1 pasará más tiempo pensando en los problemas antes de reaccionar, al igual que los humanos. a través de la capacitación, aprendí a refinar mi proceso de pensamiento, probar diferentes estrategias y reconocer mis errores. razonar sobre tareas complejas y resolver problemas más difíciles que los modelos científicos, de codificación y matemáticos anteriores.

openai dijo que esta serie de modelos es un avance importante para tareas de razonamiento complejas, por lo que también restablece el contador del producto a 1 y lo nombró openai o1. la "o" del nombre puede referirse a orión.

mayor capacidad de razonamiento y la cadena de pensamiento ofrece nuevas oportunidades para la seguridad del modelo.

el proyecto "strawberry" se llamaba anteriormente "q*", motivo que desencadenó la "batalla judicial" de openai y provocó el repentino despido del director general de la empresa, sam altman. en ese momento, la directora de tecnología de openai, mira murati, dijo a los empleados que una carta sobre el avance de la ia q* (pronunciado q-star) llevó a la junta a aceptar el despido, según las fuentes.

el progreso de openai en q* ha llevado a algunos expertos de la empresa a creer que este puede ser su avance en la búsqueda de la "superinteligencia (agi, inteligencia artificial general)".

según información oficial, o1 tiene muchas capacidades que superan con creces las de gpt-4o. ocupó el puesto 89 en codeforces, estuvo entre los 500 mejores estudiantes del país en la olimpiada estadounidense de matemáticas (aime) y superó el nivel de doctorado humano.

según los informes, de manera similar a cómo los humanos pueden pensar durante mucho tiempo antes de responder un problema difícil, o1 también utiliza una serie de pensamientos cuando intenta resolver un problema. a través del aprendizaje por refuerzo, o1 puede aprender a perfeccionar su cadena de pensamiento y mejorar las estrategias que utiliza. aprende a reconocer y corregir errores, dividir pasos difíciles en otros más simples y probar diferentes enfoques cuando el actual no funciona.

openai dijo que el uso de cadenas de pensamiento puede mejorar significativamente la seguridad y la coherencia porque el pensamiento del modelo se puede observar de manera clara y el razonamiento del modelo sobre las reglas de seguridad es más sólido en escenarios fuera de la distribución.

xu li, presidente ejecutivo y director ejecutivo de sensetime, ha dicho anteriormente que en el futuro, si un modelo es inteligente o no depende enteramente de si la metodología para construir datos de la cadena de pensamiento del modelo es lo suficientemente sólida y si esta metodología lo suficientemente sólida puede ser sostenible. e iterativo.

captura de pantalla parcial de la cadena de pensamiento completa original de openai o1

sin embargo, openai finalmente optó por no mostrar la cadena de pensamiento original al usuario, sino mostrar un resumen de la cadena de pensamiento. openai explicó con más detalle: "las cadenas de pensamientos ocultas brindan una oportunidad única para monitorear los modelos. suponiendo que el modelo sea fielmente legible, las cadenas de pensamientos ocultas nos permiten 'leer' los pensamientos del modelo y comprender su proceso de pensamiento. por ejemplo, en el futuro uno es posible que desee monitorear las cadenas de pensamiento en busca de signos de manipulación de los usuarios. sin embargo, para hacer esto, el modelo debe poder expresar libremente sus pensamientos en una forma inalterada, por lo que no podemos entrenar ningún cumplimiento de políticas en las cadenas de pensamiento o las preferencias de los usuarios. no quiero que los usuarios vean directamente cadenas de pensamiento inconsistentes”.

actualmente, hay dos modelos o1 disponibles para usuarios plus y team de chatgpt, y los usuarios empresariales y educativos podrán usarlos a partir de la próxima semana.

más lento pero más caro, no es el "sucesor" del gpt-4o

actualmente, el límite de mensajes semanales es 30 para o1-preview y 50 para o1-mini. openai dijo que está trabajando arduamente para aumentar el límite de mensajes y permitir que chatgpt seleccione automáticamente el modo apropiado según las indicaciones dadas. también extiende el acceso a más niveles de usuarios y planea brindar acceso o1-mini a todos los usuarios gratuitos.

en el lado de la api (interfaz de programación de aplicaciones), o1-preview cobra $15 por cada millón de tokens de entrada (los modelos grandes dividen el texto en palabras, conjuntos de caracteres o combinaciones de palabras y signos de puntuación) y $60 por cada millón de tokens de salida. en comparación con gpt-4o, el costo de los insumos es 3 veces y el costo de salida es 4 veces.

o1-mini es más rápido en posicionamiento y más rentable. también se dice que tiene un rendimiento excelente en matemáticas y programación. es casi equivalente a o1 en rendimiento en puntos de referencia de evaluación como aime y codeforces. a o1-preview con límites de velocidad más altos y menor latencia, o1-mini es un 80% más barato que o1-preview para los usuarios de api.

otros inconvenientes también son obvios. openai o1 es más lento que otros modelos. según informes de medios extranjeros, o1 puede tardar más de 10 segundos en responder ciertas preguntas, y el modelo elige mostrar el progreso mostrando etiquetas para las subtareas que se están ejecutando actualmente.

al mismo tiempo, dada la imprevisibilidad de los modelos de ia generativa, o1 puede tener otros defectos y limitaciones. por ejemplo, a veces se pueden cometer errores en un juego de tres en raya. en un documento técnico, openai dijo que algunos evaluadores habían rumoreado que o1 era más propenso a alucinaciones que gpt-4o y estaba menos dispuesto a admitir cuando no sabía la respuesta a una pregunta.

además, actualmente o1 no puede navegar por la web ni analizar archivos.

altman admitió con franqueza que o1 es la serie de modelos más poderosa y alineada de openai actualmente, pero aún tiene fallas.

el presidente de openai, greg brockman, también dijo que la tecnología o1 aún se encuentra en sus primeras etapas y openai está explorando activamente, incluida la confiabilidad, las alucinaciones y la robustez (estabilidad) contra los atacantes.

openai dijo que, como modelo inicial, openai o1 aún no tiene muchas de las características que hacen que chatgpt sea útil, como explorar información de la red, cargar archivos e imágenes, etc. para muchos casos comunes, gpt-4o tendrá mayores capacidades en el corto plazo. seguirán actualizaciones y mejoras periódicas, y "aún se está trabajando para que este nuevo modelo sea tan fácil de usar como el modelo actual".

openai enfatiza que openai o1 no es el "sucesor" de gpt-4o. 4o puede usarse junto con las funciones de inferencia de o1. planea continuar desarrollando y lanzando modelos de la serie gpt después de la serie o1.

comparación de múltiples puntos de referencia entre openai o1 y gpt-4o

vale la pena mencionar que, según informes anteriores de medios extranjeros, openai podría estar considerando establecer estándares de carga más altos para el modelo grande "strawberry" o el modelo insignia de próxima generación, que puede alcanzar un máximo de 2.000 dólares al mes. a modo de comparación, la tarifa actual de chatgpt plus es de $20 por mes.

turbulento openai, ¿cuándo llegará gpt-5?

según informes de medios extranjeros, mulati dijo que actualmente se está construyendo el modelo principal de próxima generación gpt-5, que será mucho más grande que su predecesor. si bien la compañía todavía cree que la escala ayudará a desbloquear nuevas capacidades de la inteligencia artificial, es probable que gpt-5 también incluya la tecnología de inferencia lanzada esta vez.

"hay dos paradigmas", dijo murati, "el paradigma de escalamiento y este nuevo paradigma. queremos unirlos".

el camino de desarrollo de gpt-5 no es fácil.

el 11 de septiembre, hora local, alexis conneau, líder de investigación de gpt-4o/gpt-5 y líder técnico de la versión openai de “her”, anunció repentinamente su renuncia. anteriormente, el cofundador y científico jefe de openai, ilya sutskever, el líder del equipo "super alignment", jan leike, y el cofundador john schulman, el director de chatgpt, peter deng, y otros han dimitido... actualmente, sólo dos de los 11 fundadores permanecen en openai. .

no solo hay confusión de personal, sino que también se revela que openai enfrenta una brecha de ingresos y gastos de 5 mil millones de dólares este año.

pero lo que se puede ver es que openai ya está tomando medidas.

el último plan de openai es recaudar aproximadamente 6.500 millones de dólares, lo que elevaría la valoración de esta ronda de financiación a 150.000 millones de dólares. a finales del mes pasado, se reveló que openai se estaba preparando para una nueva ronda de financiación de mil millones de dólares liderada por la firma de capital riesgo thrive capital, en la que microsoft, apple y nvidia posiblemente participarían en la inversión cuando openai estaba valorada en. poco más de 100 mil millones de dólares.

el 29 de agosto, hora local, openai declaró que chatgpt tiene actualmente más de 200 millones de usuarios activos semanales, el doble que el otoño pasado.

openai dice que el 92% de las empresas fortune 500 utilizan sus productos y el uso de su api se ha duplicado desde el lanzamiento de chatgpt-4o mini en julio.

el reportero del periódico qin sheng

(este artículo es de the paper. para obtener más información original, descargue la aplicación “the paper”)

informe/comentarios

noticias

¿lento y caro? el modelo de inferencia openai "strawberry" ya está aquí, ¿qué tan lejos está gpt-5?

introducción

mi información de contacto