¿cómo "razona" o1 como un humano? preguntas y respuestas del equipo de investigación de openai: revelando detalles del modelo, planes futuros y consejos para maximizar el rendimiento de o1

2024-09-15

el 13 de septiembre, openai anunció el debut oficial de la serie de modelos o1, lo que marca una nueva era en el campo de la ia y marca el comienzo de la era de los modelos grandes capaces de realizar tareas de razonamiento complejas de propósito general. después del lanzamiento del modelo, el equipo de investigación de openai celebró un evento ama (ask me anything) en la plataforma social x, que reveló muchos detalles del modelo de la serie o1 en profundidad.

fuente de la imagen: plataforma social x

asistente de ia de nivel “alienígena”

openai dijo que la serie o1 incluye dos versiones: o1-preview, que es una versión temprana del modelo completo, y el o1-mini, más rápido y liviano. a diferencia de los modelos anteriores,o1 es capaz de generar largas cadenas de procesos de pensamiento ocultos antes de dar la respuesta final, lo que demuestra capacidades de razonamiento similares a las humanas.。los investigadores comparan a o1 con un "alienígena" con superpoderes。

fuente de la imagen: plataforma social x

durante el proceso de razonamiento,o1 utiliza el aprendizaje por refuerzo para lograr un desempeño de "razonamiento". aunque actualmente no hay planes para mostrar estos tokens de la cadena de pensamiento a los usuarios de api o chatgpt, los investigadores revelaron que las instrucciones integradas en las indicaciones pueden influir en la forma de pensar de o1. en contraste,gpt-4o no puede alcanzar el nivel de rendimiento de la cadena de pensamiento de o1 mediante indicaciones。

fuente de la imagen: plataforma social x

el modelo de la serie o1 utiliza el mismo tokenizador que gpt-4o y sigue siendo consistente en el token de entrada. pero,o1 es capaz de manejar tareas más largas y abiertas, lo que reduce la necesidad de fragmentación de entradas. en el futuro, o1 también admitirá ventanas de contexto de entrada más grandes.。

o1 también demostró impresionantes habilidades de razonamiento y generalización, como descifrar códigos, reflexionar sobre cuestiones filosóficas y realizar autoexámenes para evaluar sus habilidades.

el equipo de investigación también reveló queel rendimiento de o1-preview en algunas tareas de escritura personalizadas es equivalente o ligeramente mejor que gpt-4o.

¿la versión mini es aún más fuerte?

en comparación con o1-preview, o1-mini está optimizado en tamaño y velocidad.

fuente de la imagen: plataforma social x

aunque puede haber limitaciones en algunas áreas como el conocimiento mundial,o1-mini demuestra sus ventajas en tareas stem (ciencia, tecnología, ingeniería, matemáticas) y tareas relacionadas con código. también,o1-mini puede explorar más cadenas de pensamiento que o1-preview。

fuente de la imagen: plataforma social x

o1 pronto admitirá la integración de herramientas y la comprensión multimodal

aunque o1-preview no utiliza herramientas actualmente,openai planea agregar capacidades como llamadas a funciones, intérpretes de código y navegación web. en futuras actualizaciones también se introducirán soporte de herramientas, resultados estructurados y avisos del sistema.。

fuente de la imagen: plataforma social x

además, el equipo de desarrolladores de openai declaró:en el futuro, los usuarios podrán controlar el tiempo de pensamiento y los límites de tokens de o1., y prometió promover activamente la implementación de esta función.

openai también está promoviendo activamente el soporte de transmisión y la retroalimentación del progreso de la inferencia en la api.. también,o1 ya tiene capacidades multimodales integradas,se espera que alcance el nivel más avanzado en tareas de comprensión multimodal (mmlu).

fuente de la imagen: plataforma social x

o1-mini tiene un límite de 50 indicaciones por semana

actualmente, o1-mini está abierto para usuarios de chatgpt plus, pero hay un límite de 50 mensajes por semana.todas las propinas cuentan para la misma cuota. openai promete,los niveles de acceso a la api y los límites de tarifas se incrementarán gradualmente en el futuro, y se ofrecerán descuentos en los precios por volumen una vez que se relajen las restricciones.。

se espera que el precio del modelo o1 siga la tendencia de recortes de precios cada 1 o 2 años.. también,el soporte de ajuste personalizado está en la hoja de ruta del producto, pero el calendario de lanzamiento específico aún no está claro.

fuente de la imagen: plataforma social x

secretos para maximizar el rendimiento del o1

actualmente, o1-mini está capacitado utilizando datos de octubre de 2023, y las iteraciones futuras utilizarán conjuntos de datos más nuevos para ampliar su conocimiento del mundo.

para aprovechar al máximo las ventajas de razonamiento de o1,el equipo recomienda que los usuarios proporcionen ejemplos informativos y concretos que cubran casos extremos al diseñar indicaciones y especifiquen claramente los pasos de razonamiento y el estilo requeridos.. pero ten cuidado,el contexto irrelevante puede interferir con el proceso de inferencia del modelo.。

noticias económicas diarias información pública completa.

noticias económicas diarias

informe/comentarios

noticias

¿cómo "razona" o1 como un humano? preguntas y respuestas del equipo de investigación de openai: revelando detalles del modelo, planes futuros y consejos para maximizar el rendimiento de o1

asistente de ia de nivel “alienígena”

¿la versión mini es aún más fuerte?

o1 pronto admitirá la integración de herramientas y la comprensión multimodal

o1-mini tiene un límite de 50 indicaciones por semana

secretos para maximizar el rendimiento del o1

introducción

mi información de contacto