le mie informazioni di contatto
posta[email protected]
2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
whip bulls ha riferito che il 2 ottobre, secondo rapporti esteri, openai aprirà ad altri sviluppatori il suo motore di intelligenza artificiale vocale, che fornisce supporto per la modalità vocale avanzata di chatgpt.
gli sviluppatori avranno accesso in tempo reale alla tecnologia, dove l’intelligenza artificiale potrà comprendere i comandi vocali e condurre conversazioni vocali in scenari simili a quelli telefonici.
il processo in precedenza richiedeva agli sviluppatori di eseguire almeno tre passaggi: prima trascrivere l'audio, quindi eseguire il modello di testo generato per ricavare una risposta alla query e infine utilizzare un modello di sintesi vocale separato.
la mossa apre la strada a un’ondata di applicazioni di intelligenza artificiale che offrono interfacce vocali conversazionali.
la nuova funzionalità di sintesi vocale è uno dei numerosi annunci fatti da openai martedì al suo evento devday a san francisco.
i primi tester della funzionalità includono l'app per nutrizione e fitness healthify e l'app per l'apprendimento delle lingue speak.
altre nuove funzionalità disponibili per gli sviluppatori includono la possibilità di mettere a punto modelli basati su immagini.
in una demo per i giornalisti, i dirigenti di openai hanno mostrato un esempio della nuova funzionalità audio combinata con l'api di twilio, che consente a un assistente ai di chiamare un negozio di caramelle immaginario e ordinare 400 fragole ricoperte di cioccolato.
tra le demo di personalizzazione dello strumento c'era un esempio di conversazione con un sistema di intelligenza artificiale per aiutare a trovare prodotti locali, come le fragole. l'intelligenza artificiale chiama quindi il commerciante per ordinare le fragole e riceve istruzioni dall'utente su quanto ordinare e quanto prevede di spendere.
openai afferma che chiunque utilizzi tale tecnologia non può nascondere che si tratta di intelligenza artificiale e non di un essere umano, e offre solo sei preimpostazioni agli sviluppatori anziché creare nuovi suoni.
gli sviluppatori possono utilizzare solo i suoni forniti da openai, le stesse opzioni di chatgpt.
sebbene i suoni non siano contrassegnati in alcun modo e gli sviluppatori non debbano farsi riconoscere dai sistemi di intelligenza artificiale, openai afferma che utilizzare i suoi sistemi per inviare spam o fuorviare le persone viola i termini di servizio dell'azienda.
gli annunci arrivano in mezzo a una raffica di notizie che circondano il produttore di chatgpt, inclusa la sua massiccia campagna di raccolta fondi in corso e la partenza, la scorsa settimana, del chief technology officer mira murati e di altri due dirigenti.