noticias

openai devday “sin modelos, sin nuevas funciones”, ¿qué más pueden esperar los desarrolladores?

2024-10-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

imagen de encabezado generada por doubao
palabras clave: interacción con el desarrollador, llamada api, modelo grande de ia, ciberpunk, detalles de alta definición

el año pasado, openai celebró una conferencia de desarrolladores (devday 2023) que causó revuelo en la industria en san francisco, lanzando una serie de nuevos productos y herramientas, incluido gpt-4 turbo que admite contexto de 128k, reducción de precio de api, nuevos asistentes api, y gpt-4 turbo para funciones visuales, dall·e 3 api y un modelo json muy mejorado, así como los desafortunados gpt y la plataforma gpt store similar a app store.

el director general sam altman dijo con confianza: "esperamos que pueda venir el año que viene. en comparación con los nuevos resultados que estamos construyendo cuidadosamente, lo que publicamos hoy parecerá muy anticuado", lo que vuelve a aumentar las expectativas.

después de vivir una nueva ronda de renuncias de equipos de alta dirección, se acerca el evento anual devday 2024 de openai y todos tienen una pregunta en mente: ¿qué pasará después?

sin embargo, el openai devday de este año ha cambiado silenciosamente de tono. primero, se anunció que se ajustaría el formato de la conferencia, desde un evento a gran escala hasta una serie de sesiones interactivas para desarrolladores estilo roadshow.

lo que es aún más sorprendente es que, según los spoilers oficiales, openai no lanzará su principal modelo insignia de próxima generación durante el devday, sino que se centrará en actualizaciones de api y servicios para desarrolladores.

en resumen: el modelo de próxima generación todavía se está asando en el horno, así que no lo mencionemos en absoluto.

devday ya no es una conferencia modelo, esta vez es realmente una conferencia de "desarrolladores".

1

sin gpt-5 devday, ¿qué más esperan los desarrolladores?

aunque openai anunció que no lanzará una nueva generación de modelos emblemáticos en el devday de este año, la industria todavía tiene muchas expectativas para esta conferencia de desarrolladores. según se especula, openai puede centrarse en lanzar nuevas capacidades api, como el razonamiento a largo plazo y la llamada de funciones, al tiempo que mejora las capacidades del agente del modelo para proporcionar a los desarrolladores más autonomía y la posibilidad de integración con otras api.

la api del modo de voz 4o también es muy esperada

silicon star también se comunicó con varios desarrolladores para comprender sus necesidades reales de api. la multimodalidad y el rendimiento se convirtieron en el centro de atención.

talkme es un producto toc de aprendizaje de idiomas para mercados extranjeros, el director ejecutivo, jia zijian, le dijo a silicon star que los desarrolladores de inteligencia artificial que viajan al extranjero generalmente eligen la api de openai, y un pequeño número de ellos usan gemini y claude. la api principal utilizada por talkeme es openai, además de la asistencia de gemini.

"gpt-3.5 turbo básicamente se ha eliminado y todos cambiarán a 4o-mini o 4o para mejorar la lógica empresarial. para productos tob saas más complejos, puede considerar gpt-4, que tiene capacidades más potentes y es relativamente más caro".

talkme también está considerando actualmente o1, pero debido a su alto costo, actualmente se limita a la investigación previa sobre funciones experimentales y no se puede poner en producción formal de aplicaciones toc.

"las capacidades de o1 son realmente muy sólidas, pero desde una perspectiva de ingeniería, usar o1 para algunos, 4o para algunos y 4omini para algunos puede cubrir básicamente el escenario de desarrollo".

con respecto a las expectativas para la api openai, jia zijian dijo que hay tres puntos principales:

el primero es la baja latencia.

el segundo son las capacidades multimodales con baja latencia. "parte de nuestras capacidades multimodales utilizan actualmente 4o y algunas utilizan gemini".

el tercer punto es una salida json más estable. "la publicidad de openai aún no es tan rigurosa. es más probable que esté dominada por algoritmos científicos. como resultado, la salida json de openai no es muy estable. en muchos escenarios, es mejor escribir sus propias reglas regulares "para analizar el contenido del texto de salida, en esta dimensión, google es peor que openai. si se hace bien, será más beneficioso para los desarrolladores si hay una salida json estable".

en términos de precio, "a excepción de o1, otros precios son relativamente baratos".

chen yang, director de operaciones de motores cocos y gerente de lao cai miao, realizó un análisis desde la perspectiva de los productos nacionales de ia. le dijo a silicon stars que, en términos de capacidades actuales y velocidad de respuesta, openai sigue siendo el más fuerte. por otro lado, los desarrolladores nacionales consideran un mayor cumplimiento y retorno de la inversión, mientras que los modelos nacionales qwen, doubao, minimax como wenxin también se están poniendo al día. y la relación precio/rendimiento de algunos productos después de los descuentos no es más débil que openai.

dijo: "la demanda futura debe ser multimodal. las solicitudes de publicación http tradicionales se eliminarán gradualmente. doubao nacional ha tomado la iniciativa en el uso de webrtc y openai webrtc está a punto de abrirse. por lo tanto, además de la calidad del modelo "el mercado futuro debe considerar el efecto integral, la combinación de asr, tts, webrtc, etc., desde esta perspectiva, los productos nacionales tienen mayores ventajas en la integración y existe la posibilidad de obtener una ventaja en la guerra de precios".

yuhe technology se dirige a aplicaciones de escenarios empresariales, chi guangyao, espera que la actualización de la api openai pueda proporcionar mejoras en dos aspectos: capacidades de ingeniería integradas para reducir o detectar alucinaciones para o1, proporcionar opciones de uso más flexibles y permitir a los usuarios especificar. si utilice capacidades de razonamiento complejas en esta solicitud.

1

agi puede esperar, pero si le falta dinero, no puede esperar.

el cambio de enfoque de devday se alinea con la reciente estrategia de openai de dar pasos más graduales en el desarrollo de la ia generativa.

actualmente, la compañía está optimizando sus modelos insignia gpt-4o y gpt-4o mini, enfrentando el desafío de mantenerse a la vanguardia de la tecnología en la carrera por la ia generativa. según algunos puntos de referencia, openai parece haber perdido su liderazgo tecnológico absoluto.

una de las razones es la dificultad para obtener datos de entrenamiento de alta calidad. según datos de originality.ai, más del 35% de los 1.000 sitios web más importantes del mundo han prohibido el rastreador web de openai.

un estudio realizado por el data provenance project del mit encontró que alrededor del 25% de los datos de fuentes de "alta calidad" han sido restringidos para su uso en el entrenamiento de modelos de ia.

para abordar estos desafíos de adquisición de datos, openai ha firmado una serie de acuerdos de licencia de alto valor con editores y corredores de datos.

otro aspecto de la presión proviene del coste de funcionamiento de la empresa. según reuters, openai espera que los ingresos este año alcancen los 3.700 millones de dólares y una pérdida de 5.000 millones de dólares, que se utilizarán principalmente para pagar los costes operativos de los servicios y los salarios de los empleados. y alquiler de oficinas. no incluye otros gastos importantes, como incentivos de capital para los empleados.

para resolver el problema de financiación, openai está promoviendo una nueva ronda de financiación. a principios de septiembre, salió a la luz la noticia de que openai podría recibir una inversión de 6.500 millones de dólares con una valoración de 150.000 millones de dólares. según las fuentes, esta valoración depende de si openai puede transformar su estructura corporativa en un modelo de ganancias similar al de sus competidores anthropic y xai.

sin embargo, la última noticia es que apple ha decidido no participar en la última ronda de financiación de 6.500 millones de dólares. además, la salida del director de tecnología, director de investigación y vicepresidente de investigación la semana pasada también ha añadido incertidumbre a openai.

aunque la directora financiera de openai, sarah friar, reveló a los inversores el 27 de septiembre que esta ronda de financiación ha tenido un exceso de suscripción y está previsto que se cierre antes de fin de mes, las negociaciones de financiación aún no han finalizado y los participantes y los montos específicos aún pueden cambiar. .

el enfoque en las api puede estar relacionado con la presión financiera que enfrenta openai.

según informes de investigación y datos relacionados publicados por futuresearch, los ingresos anuales de openai son de 3.400 millones de dólares, el 76% de los cuales provienen de usuarios pagos de chatgpt (suscripciones a chatgpt plus, chatgpt enterprise y chatgpt team), y los servicios de interfaz api contribuyen con el 15% de los ingresos de la empresa. ingresos aproximados de 510 millones de dólares.

el modelo de servicio impulsado por api alguna vez ayudó a plataformas como aws a crecer rápidamente. a medida que más y más empresas utilizan las api de amazon para desarrollar nuevos productos o servicios, generando así efectos de red, el valor de su ecosistema continúa creciendo.

aunque los ingresos directos actuales de openai provenientes de las api no son altos, en el contexto de la desaceleración de chatgpt y de que openai está tomando medidas más incrementales para desarrollar ia generativa, es posible que se puedan proporcionar mejores api para la empresa, lo que abre nuevas oportunidades de mercado y promueve la colaboración con otras empresas. .

sin gpt-5, los ejecutivos se fueron y se transformaron en una empresa con fines de lucro. esta serie de eventos indica que la comercialización se ha convertido en un problema urgente que sam altman debe resolver y considerará las ganancias más que la obtención de agi.

durante mucho tiempo, sam altman ha utilizado excelentes habilidades para manipular el sentimiento del público mientras dirigía su propio negocio, lo que lo convirtió en el líder entre los directores ejecutivos de la industria tecnológica.

pero no se sorprenda si lo escucha hablar sobre los planes de openai de pasar a un "modelo de ganancias" en openai devday en san francisco.