noticias

OpenAI lanza nuevas funciones que permiten a las empresas personalizar los modelos de IA más potentes en función de sus propios datos

2024-08-21

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

TencentNoticias de ciencia y tecnología, martes 21 de agosto, hora local de Estados Unidos.IA abiertaSe lanzó una nueva función que permitirá a los clientes empresariales personalizar este producto utilizando los datos de su propia empresa.AI (AI) El modelo más potente para startupsGPT-4o

OpenAI planea lanzar el martes capacidades de personalización, comúnmente conocidas en la industria de la inteligencia artificial como nudges. El ajuste permite entrenar los modelos de IA existentes con información adicional sobre una tarea o área temática específica.

Por ejemplo, una empresa que fabrica patinetas podría perfeccionar un modelo de IA para que pueda usarse como un chatbot de servicio al cliente capaz de responder preguntas sobre los detalles de las ruedas y el cuidado de las patinetas.

En el contexto actual de feroz competencia entre las nuevas empresas en el campo de los productos de inteligencia artificial, y las empresas necesitan demostrar urgentemente el retorno de la inversión en inteligencia artificial, ajustar las últimas características del modelo insignia de OpenAI es particularmente importante.

Vale la pena señalar que esta característica se introdujo por primera vez en GPT-4o y sus predecesores, y OpenAI anteriormente brindó a los usuarios permisos de ajuste fino para múltiples tipos de modelos, incluido GPT-4o mini, brindando a los usuarios una experiencia más detallada. opciones rentables.

Frente a los servicios de personalización de modelos de muchas empresas de tecnología en el mercado, el director de productos API de OpenAI, Olivier Godement, enfatizó que OpenAI se compromete a simplificar y acelerar los ajustes de los clientes a sus mejores modelos mediante el establecimiento de asociaciones directas con las empresas para evitar que los usuarios recurran a procesos externos. servicios o alternativas más débiles.

También señaló: "Siempre estamos comprometidos a bajar el umbral técnico y reducir las barreras operativas, reduciendo así la carga del usuario de iniciar y ajustar modelos".

Cuando los clientes realizan un ajuste del modelo, necesitan transmitir datos al servidor OpenAI. Según John Allard, ingeniero de software de trabajo personalizado de OpenAI, este proceso demora aproximadamente una o dos horas en promedio. Inicialmente, el ajuste se limitará a datos de texto, sin soporte para imágenes u otros formatos multimedia.

A medida que OpenAI emite tokens gratuitos, enfrenta desafíos deGoogleAntrópicoy otros proveedores de modelos propios y Nous Research Hermes 3.Meta Feroz guerra de precios por modelos de código abierto como Llama 3.1.

Sin embargo, la ventaja de utilizar OpenAI y modelos propietarios/de código cerrado similares es que los desarrolladores no necesitan soportar las tareas de alojamiento del servidor de inferencia o capacitación del modelo. Pueden utilizar los recursos del servidor OpenAI o conectar sin problemas sus servidores preferidos a través de API.

Sin embargo, las investigaciones muestran que ajustar un modelo puede conllevar riesgos, incluidas desviaciones de las barreras de seguridad y garantías de rendimiento originales, lo que a su vez afecta su eficacia general. Es necesario que las propias empresas sopesen si están dispuestas a asumir este riesgo. Pero OpenAI claramente piensa que vale la pena y alienta a los usuarios a considerar el ajuste como una opción de optimización.

Por otra parte, OpenAI dijo el martes que incluirá contenido de marcas como Vogue, The New Yorker y Wired en sus productos. El acuerdo también permite a OpenAI utilizar el contenido de Condé Nast para ayudar a entrenar sus modelos de inteligencia artificial, que requieren grandes cantidades de datos para aprender.

El anuncio marca el mayor esfuerzo de OpenAI para llegar a acuerdos con empresas de medios en lugar de pelear con ellas sobre cómo utilizar artículos de noticias y otros contenidos en sus herramientas de inteligencia artificial. Las partes no revelaron el valor de transacción del acuerdo.

El siguiente es el texto completo de la noticia oficial publicada por OpenAI:

Hoy lanzamos ajustes para GPT-4o, una de las funciones más solicitadas por los desarrolladores. A partir del 23 de septiembre, también proporcionaremos a cada empresa 1 millón de tokens de capacitación de forma gratuita todos los días.

Los desarrolladores ahora pueden ajustar GPT-4o utilizando sus conjuntos de datos únicos para lograr un mayor rendimiento a un menor costo para casos de uso específicos. La tecnología de ajuste fino le da al modelo la capacidad de ajustar de manera flexible la estructura y el tono de las respuestas, e incluso seguir instrucciones de dominio complejas y altamente especializadas. Solo requiere una pequeña cantidad de muestras de entrenamiento (como docenas de ejemplos) para lograr resultados significativos. la aplicación.

Desde la codificación hasta la escritura creativa, la función de ajuste cubre una amplia gama de campos, lo que afecta y mejora profundamente el rendimiento general del modelo. Esto es solo el comienzo y continuaremos invirtiendo en ampliar nuestras opciones de personalización de modelos para desarrolladores.

A partir de ahora, la función de ajuste fino de GPT-4o está completamente abierta a todos los desarrolladores que paguen. Visite el panel de ajuste directamente, haga clic en el botón "crear" y seleccione "GPT-4o -2024-08-06" de la lista desplegable del modelo base para iniciar el proceso de ajuste. En cuanto a los costos, los costos de entrenamiento de ajuste fino de GPT-4o se establecen en $25 por millón de tokens, mientras que los costos de inferencia son de $3,75 por millón de tokens de entrada y $15 por millón de tokens de salida.

Además, la mini función de ajuste fino del GPT-4o también está abierta a todos los desarrolladores que paguen. Solo necesita seleccionar "GPT-4o-mini-2024-07-18" como modelo base en el panel de ajuste. Oferta especial: para celebrar el lanzamiento, ofrecemos a los usuarios mini de GPT-4o hasta 2 millones de tokens de entrenamiento gratis todos los días. Esta oferta es válida hasta el 23 de septiembre.

Historias de éxito de ajuste

Durante los últimos meses, hemos trabajado con varios socios confiables para ajustar y probar GPT-4o y comprender sus casos de uso. Aquí hay algunos ejemplos exitosos:

1.Cosine tuvo un desempeño sorprendente en la prueba comparativa del banco SWE

Coseno de inicioGenioEs un asistente de ingeniería de software de inteligencia artificial que puede identificar y reparar vulnerabilidades de forma independiente, crear funciones y colaborar de manera eficiente con los usuarios para refactorizar el código. También puede razonar sobre problemas técnicos complejos y realizar cambios en el código con mayor precisión y menos requisitos de token.

Genie funciona con un modelo GPT-4o optimizado que incorpora la experiencia del mundo real de ingenieros de software reales, lo que permite que el modelo aprenda a responder de maneras específicas. Además, el modelo también domina el formateo de resultados en formatos específicos, como parches, que se pueden integrar fácilmente en el código base, lo que mejora aún más la eficiencia del trabajo.

Los resultados de las pruebas comparativas de verificación del banco SWE publicados el martes pasado mostraron que Genie logró un rendimiento del 43,8%.SOTALa puntuación es sobresaliente, especialmente en la prueba completa. Su puntuación SOTA llega al 30,08%, lo que supone un salto significativo con respecto a la mejor puntuación anterior del 19,27%, lo que marca un gran avance en la historia de esta prueba de referencia. SWE-Bench es una prueba que evalúa las capacidades de ingeniería de software de inteligencia artificial.

2.Distyl ocupa el primer lugar en el punto de referencia BIRD-SQL

Distyl, un socio de soluciones de inteligencia artificial para empresas Fortune 500, ocupó recientemente el puesto número 1 en el punto de referencia BIRD-SQL, el punto de referencia líder de texto a SQL. El GPT-4o optimizado de Distyl logra una precisión de ejecución del 71,83 % en la tabla de clasificación y se desempeña bien en tareas como la reformulación de consultas, la clasificación de intenciones, el encadenamiento de pensamientos y la autocorrección, y es particularmente sobresaliente en la generación de SQL.

Privacidad y seguridad de datos

El modelo de ajuste está completamente bajo el control del usuario, quien tiene la propiedad absoluta de los datos comerciales, abarcando todas las entradas y salidas. Esto garantiza que los datos de un usuario nunca se compartan ni se utilicen para entrenar otros modelos.

Además, hemos implementado mecanismos de protección de seguridad de múltiples capas para modelos ajustados para evitar abusos. Por ejemplo, realizamos continuamente evaluaciones de seguridad automatizadas en modelos ajustados y monitoreamos el uso para garantizar que las aplicaciones cumplan con nuestras políticas de uso.

Esperamos ansiosamente ver lo que usted crea al ajustar GPT-4o. Si está ansioso por explorar más posibilidades de personalización del modelo, no dude en ponerse en contacto con nuestro equipo y estaremos encantados de brindarle apoyo y asistencia. (Compilado/Ciervo Dorado)