noticias

¡se lanza oficialmente el modo de voz avanzado chatgpt! admite más de 50 idiomas

2024-09-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

título original: ¡se lanza oficialmente el modo de voz avanzado chatgpt! admite más de 50 idiomas. en el vídeo de demostración, se dice "lo siento" en mandarín, pero la voz de scarlett no está.

el 25 de septiembre, openai anunció oficialmente que el modo de voz avanzado de chatgpt se lanzará oficialmente para usuarios individuales de chatgpt plus y usuarios de teams (teams) de pequeñas empresas esta semana. esta función se lanzará primero en el mercado de ee. uu.

además, openai dijo que abrirá esta función a los usuarios de openai enterprise y education edition la próxima semana. pero vale la pena señalar que la nueva función de voz está disponible para el modelo gpt-4o de openai y no para el modelo preliminar o1 lanzado recientemente.

fuente de la imagen: plataforma social x

esta actualización significa,a partir de esta semana, los usuarios individuales y los usuarios de equipos de pequeñas empresas de la versión plus de chatgpt pueden interactuar con el chatbot mediante “voz” en lugar del ingreso de texto tradicional.

los dos aspectos más destacados del modo de voz avanzado son particularmente llamativos: primero,ayudar a los usuarios a configurar "comandos personalizados" para asistentes de voz, para lograr operaciones personalizadas;equipado con una función de "memoria" que puede recordar el método de interacción preferido del usuario., que es similar a una función lanzada para la versión de texto de chatgpt a principios de este año.

fuente de la imagen: plataforma social x

en el vídeo publicado oficialmente, la directora de proyectos técnicos de openai, charlotte cole, y el ingeniero de investigación de openai, mike, dijeron:los usuarios no solo pueden personalizar la velocidad de la conversación, sino que también pueden hacer que el modelo se comunique por el nombre del usuario o el título preferido., haciendo la comunicación más cordial y natural.

también,los usuarios también pueden preestablecer el nombre personal y la información de dirección en el sistema.. al iniciar una nueva ronda de diálogo, como por ejemplo preguntar "el clima es muy agradable este fin de semana, ¿hay alguna actividad interesante al aire libre que pueda recomendar?", el asistente de voz avanzado llamará a la información de la dirección que el usuario ingresó anteriormente y recomendará de manera proactiva lugares cercanos para visitar. visitar, e incluso planificar cuidadosamente rutas de viaje.

fuente de la imagen: plataforma social x

para satisfacer las preferencias de diferentes usuarios,el modo de voz avanzado agrega cinco voces distintivas: arbor, maple, sol, spruce y vale, junto con los cuatro sonidos originales breeze, juniper, cove y ember, forman nueve opciones de altavoces. las voces tienen nombres inspirados en elementos naturales y están diseñadas para brindar una variedad de tonos y características.

vale la pena señalar queopenai elimina la voz en off de sky acusada de imitar a la actriz scarlett johansson. anteriormente, scarlett acusó a chatgpt de openai de usar ilegalmente su voz y solicitó que la voz fuera retirada de los estantes.

además, openai dijo que tambiénoptimicé la capacidad de conversación de algunos idiomas extranjeros, no solo mejorando la velocidad y fluidez de la conversación, sino también realizando ajustes detallados en el acento., esforzándonos por comunicarnos más cerca de la naturaleza.

drew, diseñador de modelos en openai, también compartió su experiencia. dijo que en el uso diario, los usuarios pueden dejar a un lado el asistente de voz avanzado y este esperará en silencio sin molestar al usuario. y cuando los usuarios tienen alguna pregunta o necesidad, pueden iniciar una conversación con él en cualquier momento. captará rápidamente los cambios en el tono de la conversación y desempeñará varios roles de manera flexible, de forma tan natural y fluida como hablar con un amigo real.

fuente de la imagen: plataforma social x

el modo de voz avanzado chatgpt ahora admite más de 50 idiomas, ampliando el alcance de la comunicación para los usuarios. lo que es particularmente interesante es que en el video de demostración publicado oficialmente, el usuario le pidió al asistente de voz que le expresara sus disculpas a su abuela por hacerla esperar tanto tiempo.el asistente de voz avanzado primero lo resumió con fluidez en inglés, y después de que el usuario dijo "la abuela solo habla mandarín", lo expresó nuevamente en mandarín estándar "lo siento, llego tarde"., como si openai se disculpara con los usuarios por retrasar repetidamente el lanzamiento de modos de voz avanzados.

cabe señalar queeste modo de voz avanzado no está disponible actualmente en la ue, el reino unido, suiza, islandia, noruega y liechtenstein.. openai aún no ha anunciado los horarios de apertura para estas regiones.

fuente de la imagen: plataforma social x

el director ejecutivo de openai, sam altman, no pudo ocultar su entusiasmo en las plataformas sociales y dijo: "espero que sientan que la espera vale la pena", añadiendo una mirada de agravio y simpatía.

fuente de la imagen: plataforma social x

el presidente de openai, greg brockman, que todavía está de vacaciones, también participó con entusiasmo en la promoción. dijo: "el lanzamiento de funciones de voz avanzadas le permite tener una conversación fluida y sin obstáculos con chatgpt. en ese momento, podrá darse cuenta. qué antinatural es la antigua forma de escribir en una computadora”.