mi información de contacto
correo[email protected]
2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
whip bulls informó que el 2 de octubre, según informes extranjeros, openai abrirá su motor de inteligencia artificial de voz a otros desarrolladores, que brinda soporte para el modo de voz avanzado de chatgpt.
los desarrolladores tendrán acceso en tiempo real a la tecnología, donde la ia podrá comprender comandos de voz y realizar conversaciones de voz en escenarios similares a los de un teléfono en vivo.
anteriormente, el proceso requería que los desarrolladores siguieran al menos tres pasos: primero transcribir el audio, luego ejecutar el modelo de texto generado para derivar una respuesta a la consulta y, finalmente, usar un modelo de texto a voz separado.
la medida allana el camino para una ola de aplicaciones de inteligencia artificial que ofrecen interfaces de voz conversacionales.
la nueva función de voz a voz es uno de varios anuncios que openai hizo en su evento devday en san francisco el martes.
los primeros probadores de la función incluyen la aplicación de nutrición y fitness healthify y la aplicación de aprendizaje de idiomas speak.
otras características nuevas disponibles para los desarrolladores incluyen la capacidad de ajustar modelos basados en imágenes.
en una demostración para periodistas, los ejecutivos de openai mostraron un ejemplo de la nueva función de audio combinada con la api de twilio, que permite a un asistente de ia llamar a una tienda de dulces ficticia y pedir 400 fresas cubiertas de chocolate.
entre las demostraciones de personalización de la herramienta se encontraba un ejemplo de cómo hablar con un sistema de inteligencia artificial para ayudar a encontrar productos locales, como fresas. luego, la ia llama al comerciante para que pida fresas y recibe instrucciones del usuario sobre cuánto pedir y cuánto espera gastar.
openai dice que cualquiera que use dicha tecnología no puede ocultar que se trata de inteligencia artificial y no de un ser humano, y solo ofrece seis ajustes preestablecidos a los desarrolladores en lugar de crear nuevos sonidos.
los desarrolladores sólo pueden utilizar sonidos proporcionados por openai, las mismas opciones que en chatgpt.
si bien los sonidos no tienen marcas de agua de ninguna manera y los desarrolladores no necesitan ser reconocidos por los sistemas de inteligencia artificial, openai dice que usar sus sistemas para enviar spam o engañar a las personas viola los términos de servicio de la compañía.
los anuncios se producen en medio de una avalancha de noticias sobre el fabricante de chatgpt, incluida su campaña masiva de recaudación de fondos en curso y la salida la semana pasada de la directora de tecnología mira murati y otros dos ejecutivos.