mi información de contacto
correoadmin@información.bz
2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
autor|jessica
hoy, el primer devday de openai en 2024 se celebró de manera discreta en el gateway pavilion en el muelle 2 de san francisco.
a diferencia del turbulento anuncio oficial del año pasado, la noticia del día del desarrollador de este año solo apareció una vez en la cuenta x de openai developers hace dos meses, por lo que mucha gente no lo sabía.
los participantes son básicamente clientes invitados y desarrolladores de primera línea seleccionados. la ubicación se mantuvo en secreto hasta el último momento, el misterioso horario no se reveló hasta el día y no hubo transmisión en vivo.
antes de la reunión, sam altman tuiteó rápidamente:
“¡hoy se lanzan algunas herramientas nuevas para desarrolladores!
desde el último devday hasta este: el costo por token de gpt-4 a 4o mini se redujo en un 98%, la cantidad de tokens en nuestro sistema se multiplicó por 50, la inteligencia del modelo hizo un progreso excelente y hubo un pequeño dramatismo en el proceso.
espero con ansias el progreso de este devday al siguiente. el camino hacia agi nunca ha sido más claro. "
como informó anteriormente romain huet, director de experiencia de desarrollador de la compañía sobre la plataforma x, el devday de este año no lanzó ningún modelo nuevo y solo se centró en las mejoras de api.
y openai de hecho empaquetó una serie de api en tiempo real, almacenamiento en caché rápido, destilación de modelos, ajuste visual, optimización del área de juegos, además de expandir el alcance de la api o1 y aumentar el límite de velocidad para los desarrolladores en este verdadero "día del desarrollador". actualizaciones importantes de herramientas.
el precio de estas nuevas api no es absolutamente barato. muchos desarrolladores comentan que la combinación de precio y capacidades las hace atractivas. este sincero paquete de regalo para desarrolladores se presenta de inmediato y openai todavía quiere ganar la mayor cantidad de dinero vendiendo los mejores productos.
fuente de la imagen: @swyx | x.com
1
api en tiempo real: cree su propia aplicación "ella" en un solo paso
como característica más llamativa hoy en día, la api en tiempo real permite a los desarrolladores llamar a gpt-4o-realtime-preview, el modelo subyacente del modo de voz avanzado de chatgpt, para crear una experiencia de conversación de voz a voz rápida y natural en las aplicaciones. admite 6 voces preestablecidas para lograr una interacción de voz de baja latencia.
al crear asistentes de voz en el pasado, los desarrolladores necesitaban confiar en múltiples modelos para completar diferentes tareas: primero usar un modelo de reconocimiento de voz como whisper para transcribir audio en texto, luego pasar el texto a un modelo de lenguaje para inferencia y finalmente generar voz a través de un modelo de texto a voz. no sólo el proceso es complicado, sino que la emoción y el acento se pueden perder fácilmente y se producen retrasos importantes.
la api en tiempo real solo requiere una llamada para completar todo el proceso de conversación. mejore drásticamente la naturalidad y la capacidad de respuesta de las conversaciones mediante la transmisión de entrada y salida de audio. utiliza una conexión websocket persistente para intercambiar mensajes con gpt-4o y admite llamadas de funciones, que pueden responder rápidamente a solicitudes, realizar operaciones como realizar pedidos o brindar servicios personalizados. también puede manejar interrupciones automáticamente, como el modo de voz avanzado, para garantizar una experiencia de usuario más fluida. es muy adecuado para atención al cliente, aprendizaje de idiomas y otros escenarios que requieren alta interactividad.
en el lugar, el personal demostró el asistente de voz creado a través de api en tiempo real, ayudando a más de 100 desarrolladores en la audiencia a "llamar y realizar un pedido de 400 fresas para entrega".