¡se revela el nuevo modelo o1 de openai! preguntas y respuestas oficiales en línea durante la noche, aquí están los puntos clave

¡se revela el nuevo modelo o1 de openai! preguntas y respuestas oficiales en línea durante la noche, aquí están los puntos clave de las preguntas y respuestas

2024-09-14

una comunidad profesional centrada en el campo de aigc, prestando atención al desarrollo y desarrollo de grandes modelos de lenguaje (llm) como microsoft y openai, baidu wenxinyiyan, iflytek spark, etc.solicitudlanzado, centrándose en la investigación de mercado de llm y la ecología de desarrolladores de aigc, ¡bienvenido a prestar atención!

ayer, el modelo o1 recién lanzado de openai se volvió viral en el círculo tecnológico, pero muchas personas todavía tienen dudas al respecto. por ejemplo, ¿por qué no se llama "fresa" sino o1? ¿cuándo se lanzarán las funciones multimodales de o1?

por lo tanto, para resolver las dudas de la mayoría de las personas, openai realizó una sesión de preguntas y respuestas en línea durante la noche. los internautas hicieron varias preguntas sobre el modelo o1, y luego los principales desarrolladores de o1 respondieron en línea.

「gcia"open community" ha organizado toda la sesión de preguntas y respuestas en función de los problemas que más preocupan a todos. espero que pueda ayudarles a comprender mejor el rendimiento del modelo.

lo siguiente se presenta principalmente en forma de preguntas y respuestas.

ayeria abiertadespués del lanzamiento, muchas personas se sorprendieron de que no fuera el nombre "strawberry" filtrado anteriormente. por lo tanto, algunas personas preguntaron qué significa o1 y qué representan la vista previa y el mini.

openai:la inferencia representa un nuevo nivel de capacidades de ia, por lo que decidimos restablecer el contador a 1 y hacer esta serie openai o1.

vista previa significa vista previa, porque es solo una versión preliminar de estas capacidades, y mini significa mini, porque su escala es relativamente pequeña. o1- preview-mini es la versión mini de vista previa de o1.

¿hay alguna manera de alargar el modo de pensamiento único de o1?

openai: esta opción aún no está disponible, pero se considerará en el futuro para que el tiempo de pensamiento de o1 esté completamente controlado por el usuario.

¿cómo se calculan los tokens de entrada de o1?

openai: el token de entrada para o1 se calcula de la misma manera que 4o. ambos modelos utilizan el mismo tokenizador.

¿cuándo se lanzará la función de reconocimiento de imágenes de o1?

openai: se lanzará lo antes posible, pero no hay una hora oficial para el anuncio.

¿por qué el límite de uso actual de o1 es tan bajo? ¿por qué o1-preview 30 veces por semana? ¿se convertirá eventualmente en un límite de uso diario?

openai: sabemos que los límites son bajos al principio, pero es genial ver a todos comenzar y probar o1. estamos trabajando para aumentar los límites de uso con el tiempo.

¿este resumen de etiquetas ocultas de cadenas de pensamiento reproduce fielmente las etiquetas reales? ¿puede proporcionar un mensaje del sistema para este resumidor?

openai: no podemos garantizar que el resumen sea completamente preciso, aunque esperamos que lo sea. se recomienda encarecidamente no asumir que el resumen del pensamiento en cadena (cot) de o1 sea preciso, ni que el pensamiento en cadena en sí sea preciso para el razonamiento real del modelo.

¿o1 ha considerado proporcionar una versión contextual más amplia? ¿cuánto más pequeño es o1-mini en comparación con o1-preview y o1? ¿cuánto más pequeño es o1 en comparación con o1-preview?

openai: pronto lanzaremos una versión contextual más amplia. aún no es posible hablar del tamaño de las dos versiones del modelo, pero el o1-mini es más pequeño y más rápido, por lo que también está disponible para todos los usuarios gratuitos.

¿pueden aclarar, chicos, si o1 es un "sistema" que ejecuta pensamiento en cadena en segundo plano y da respuestas, o es un modelo que razona con marcadores especiales, pero simplemente oculta esos marcadores y solo muestra la respuesta final?

openai: no llamaría a o1 un "sistema". es sólo un modelo, pero a diferencia de los modelos anteriores, está entrenado para generar cadenas de pensamientos muy largas antes de dar una respuesta final.

¿por qué a veces o1-mini funciona mejor que o1-preview?

openai: los modelos o1-mini están optimizados para aplicaciones stem en todas las etapas de capacitación y datos. pero tiene limitaciones en el conocimiento mundial.

¿cuáles son las diferencias en las habilidades de estimulación entre o1 y los modelos anteriores?

openai: aunque no existe una buena razón técnica por la que o1 deba necesitar más sugerencias, según nuestra experiencia, descubrimos que o1 de hecho puede beneficiarse de ciertos estilos de sugerencias, por ejemplo, aquellos que muestran casos extremos, estilos de razonamiento subyacentes, etc. esto se debe a que, en última instancia, esto también es una forma de inferencia y el modelo parece ser más capaz de captar señales de estas sugerencias.

¿cuándo se lanzará la versión mejorada de o1?

openai: se ha planificado el proceso de desarrollo, pero no se puede dar una fecha exacta.

¿o1 utiliza agentes para validar su propia ruta de decisión al procesar la respuesta?

openai:agents no es un término bien definido, yo diría que no.

¿cuándo el precio de o1 será 0?

openai: históricamente, los precios han caído 10 veces cada 1 o 2 años y es probable que esta tendencia continúe.

hay muchas preguntas interesantes en esta sesión de preguntas y respuestas, y todas ellas son respondidas por los propios desarrolladores. los amigos interesados pueden ir y echar un vistazo.

el material de este artículo proviene de openai. si hay alguna infracción, contáctenos para eliminarla.

noticias

¡se revela el nuevo modelo o1 de openai! preguntas y respuestas oficiales en línea durante la noche, aquí están los puntos clave de las preguntas y respuestas

introducción

mi información de contacto