nouvelles

openai ouvre le moteur d'ia vocale aux développeurs

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

whip bulls a rapporté que le 2 octobre, selon des rapports étrangers, openai ouvre son moteur d'ia vocale à d'autres développeurs, qui prend en charge le mode vocal avancé de chatgpt.

les développeurs auront accès en temps réel à la technologie, où l'ia pourra comprendre les commandes vocales et mener des conversations vocales dans des scénarios de type téléphone en direct.

le processus exigeait auparavant que les développeurs passent par au moins trois étapes : d'abord transcrire l'audio, puis exécuter le modèle de texte généré pour obtenir une réponse à la requête, et enfin utiliser un modèle de synthèse vocale distinct.

cette décision ouvre la voie à une vague d’applications d’intelligence artificielle proposant des interfaces vocales conversationnelles.

la nouvelle fonctionnalité de synthèse vocale est l'une des nombreuses annonces faites par openai lors de son événement devday à san francisco mardi.

les premiers testeurs de cette fonctionnalité incluent l'application de nutrition et de remise en forme healthify et l'application d'apprentissage des langues speak.

d'autres nouvelles fonctionnalités disponibles pour les développeurs incluent la possibilité d'affiner les modèles basés sur des images.

dans une démonstration destinée aux journalistes, les dirigeants d'openai ont présenté un exemple de la nouvelle fonctionnalité audio combinée à l'api de twilio, qui permet à un assistant ia d'appeler un magasin de bonbons fictif et de commander 400 fraises enrobées de chocolat.

parmi les démonstrations de personnalisation de l'outil, il y avait un exemple de conversation avec un système d'ia pour aider à trouver des produits locaux, tels que des fraises. l'ia appelle ensuite le commerçant pour commander des fraises et prend les instructions de l'utilisateur sur la quantité à commander et sur le montant qu'il prévoit dépenser.

openai affirme que quiconque utilise une telle technologie n'est pas autorisé à cacher qu'il s'agit d'une intelligence artificielle et non d'un humain, et ne propose que six préréglages aux développeurs plutôt que de créer de nouveaux sons.

les développeurs ne peuvent utiliser que les sons fournis par openai – les mêmes options que dans chatgpt.

bien que les sons ne soient en aucun cas filigranés et que les développeurs n'aient pas besoin de se faire reconnaître par les systèmes d'ia, openai affirme que l'utilisation de ses systèmes pour spammer ou induire les gens en erreur viole les conditions de service de l'entreprise.

ces annonces surviennent au milieu d'une vague d'actualités concernant le créateur de chatgpt, notamment sa campagne de collecte de fonds massive en cours et le départ la semaine dernière de la directrice de la technologie mira murati et de deux autres dirigeants.