notizia

alla fiera dei servizi è stato presentato il primo modello domestico di grandi dimensioni con "occhi".

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

il grande modello domestico ha sbloccato con successo gli "occhi" e zhipu ai (beijing zhipu huazhang technology co., ltd.) ha dimostrato l'ultima versione chiara alla fiera internazionale cinese per il commercio di servizi del 2024 (denominata fiera), aperta il 12 settembre. funzione “videochiamata” dell'app yan. è stato riferito che questa è la prima funzione di videochiamata su larga scala al mondo aperta agli utenti pubblici.
secondo i rapporti, la funzione di videochiamata di qingyan abbraccia tre modalità principali: testo, audio e video e ha capacità di ragionamento in tempo reale. gli utenti possono accendere la fotocamera e comunicare con qingyan attraverso la finestra della videochiamata. qingyan non solo può "vedere" lo schermo dell'utente, ma anche comprendere le istruzioni ed eseguirle in modo accurato e può rispondere rapidamente anche se interrotto frequentemente. evidenziando i punti chiave sullo schermo, qingyan può anche capire su cosa l'utente vuole che si concentri.
fornire assistenza per i compiti.
zhipu ai ha dichiarato che gpt-4o aveva già lanciato la voce ma non aveva aperto la funzione video al pubblico. utilizzando qingyan, puoi sperimentare la tecnologia ai/modello di grandi dimensioni più all'avanguardia. in passato l’interazione con l’intelligenza artificiale avveniva principalmente sotto forma di testo. con la funzione video gli utenti possono dire addio a lunghi messaggi di testo e comunicare senza problemi con l’intelligenza artificiale. qingyan è come un assistente umano con visione e comprensione intorno all'utente. finché la fotocamera scatta una foto, l'intelligenza artificiale conosce l'ambiente dell'utente e cosa vuole che l'intelligenza artificiale faccia istruzioni.
il grande modello domestico sblocca con successo gli "occhi".
la funzione di videochiamata qingyan può anche essere trasformata in un traduttore inglese portatile, in grado di realizzare traduzioni istantanee tra cinese e inglese, condurre conversazioni in inglese basate sulle informazioni ambientali dell'utente e aiutare a correggere la pronuncia e gli errori grammaticali dell'utente. gli scenari di utilizzo di questa funzione includono raccontare storie di punti panoramici in qualsiasi momento durante il viaggio, identificare l'ambiente per i non vedenti, ecc. può anche fornire indicazioni sui compiti a casa e sui colloqui, completare verbali e riepiloghi nelle riunioni, analizzare dati complessi grafici e interpretare il codice dello schermo dei computer in tempo reale.
a questa fiera dei servizi, zhipu ai esporrà una varietà di prodotti più recenti. oltre alla funzione di videochiamata dell'app qingyan, include anche una funzione video generata dall'intelligenza artificiale. zhipu ha lanciato il modello di generazione video cogvideox all'inizio di quest'anno e ha lanciato la funzione "qingying" di generazione video sull'app zhipu qingyan. qingying è aperto a tutti gli utenti. basta inserire un testo o caricare un'immagine ed è possibile generare un video di 6 secondi entro 30 secondi. nel luglio di quest'anno, qingying ha lanciato l'app qingyan e gli utenti hanno generato più di 1 milione di video in sei giorni.
il giornalista del giornale zhang jing
(questo articolo è tratto da the paper. per informazioni più originali, scarica l'app “the paper”)
segnalazione/feedback