notizia

soundnet pubblica il nuovo libro "understanding real-time interaction" per registrare il passato, il presente e il futuro di rte

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

in quanto infrastruttura per la futura vita digitale, l'interazione in tempo reale rte è pienamente penetrata in tutti gli aspetti dell'interazione sociale, dell'intrattenimento, del lavoro, dello shopping, ecc. delle persone e ha sfruttato la crescita del valore di tutti i ceti sociali. anche nell’attuale mania dell’aigc, l’interazione in tempo reale gioca un ruolo importante, promuovendo l’aggiornamento dell’interazione tra esseri umani e intelligenza artificiale dal testo all’audio e video multimodale.
ma cos'è esattamente l'interazione in tempo reale? come si è evoluta dall'audio e dal video in tempo reale rtc? qual è il principio tecnico alla base? quanti scenari applicativi sono stati implementati finora? quali altri scenari esistono per realizzare l'interazione in tempo reale? tempo di dialogo vocale nei modelli di grandi dimensioni in futuro difficoltà tecniche?
pubblicato da machinery industry press il 27 agosto,istituto di ricerca di shengwangil libro di settore interattivo in tempo reale "understanding real-time interaction" compilato dal gruppo è ufficialmente in vendita. si tratta anche del primo libro di divulgazione tecnica del settore che introduce sistematicamente l'interazione in tempo reale.
jixun foo, socio amministratore senior di granite asia, jiang tao fondatore e presidente di csdn, liu qin socio fondatore di wuyuan capital, liu chengcheng fondatore e presidente di 36kr, li donghong, professore della tsinghua university, ma siwei, professore dell'università di pechino, xie lei, professore della northwestern polytechnical university, idc cina il vicepresidente e analista capo wu lianfeng e altri lo hanno raccomandato congiuntamente.
per comprendere l'interazione in tempo reale, questo libro è sufficiente
il libro "understanding real-time interaction" introduce in dettaglio il passato, il presente e il futuro dello sviluppo dell'interazione in tempo reale.copre la cronologia dello sviluppo, l'analisi concettuale, i principi tecnici, gli scenari applicativi e l'osservazione dei big data dell'interazione in tempo realeecc., è diviso principalmente in cinque parti.
·   capitolo 1: guardare indietro e acquisire informazioni sul passato, presente e futuro dell'interazione in tempo reale
dalla nascita del primo telefono voip al mondo in grado di effettuare chiamate nel 1996 fino ad oggi in cui gli esseri umani possono realizzare conversazioni vocali in tempo reale con l'intelligenza artificiale, quali evoluzioni di scenari, aggiornamenti tecnologici e innovazioni aziendali sono state sperimentate durante questo periodo dall'uccisione dei lupi mannari? e connessione di trasmissione in diretta da mai, formazione online, podcast interattivi, yuanverse, al popolare aigc di quest'anno, shengwang analizzerà gli aggiornamenti tecnologici e i cambiamenti del settore dell'interazione in tempo reale dal punto di vista di un fornitore di servizi audio e video di livello inferiore.
ad esempio, in che modo l'interazione in tempo reale è diventata una caratteristica standard delle applicazioni di pan-entertainment, con il supporto delle funzioni rtc, come possono i dispositivi iot rendere tutto interattivo? dalla prima apparizione del concetto di videoconferenza nel 1964 ad oggi, gli sviluppatori possono incorporare funzioni di videoconferenza in qualsiasi app. in che modo la videoconferenza è passata da un unico strumento di comunicazione a una funzionalità universale.
·   capitolo 2: interazione in tempo reale e analisi dei concetti correlati
parliamo sempre di rtc e rte, ma capisci davvero la differenza tra i due? aspetta, ci sono anche paas, saas, iaas e apaas? ti stai ancora scervellando perché non riesci a distinguere questi concetti?
credo che dopo aver letto questo capitolo avrai una comprensione sempre più chiara di questi concetti.
·   capitolo 3: analisi del processo tecnologico audio e video in tempo reale
l'evento principale è qui in quanto principiante del settore, questo capitolo è la scelta migliore per comprendere la tecnologia audio e video in tempo reale. dalla raccolta audio e video, pre-elaborazione, codifica, trasmissione, alla post-elaborazione audio e video, abbiamo collaborato con molti esperti tecnici di agora per trattarli uno per uno in uno spazio più lungo e con più parole.
in questo capitolo puoi vedere le migliori pratiche di elaborazione audio 3a e bel canto nella pre-elaborazione audio e video, come ottenere l'abbellimento in scenari come trasmissioni in diretta e videochiamate; 264, h.265 e av1, ecc. quali sono le differenze nell'applicazione degli standard dei codec video in rtc aspetta?
·   capitolo 4: approfondimentoanalizzare il recente200 scenari applicativi interattivi in ​​tempo reale
al momento, l’industria dell’aigc si sta sviluppando a pieno ritmo. con la benedizione dell’interazione in tempo reale, anche l’interazione uomo-intelligenza artificiale è passata dal testo all’audio e video multimodale. sono emersi anche molti scenari di intelligenza artificiale conversazionale, come la voce ai assistenti, insegnanti parlati dell'ia, npc del gioco ai, amanti virtuali dell'ia, ecc. prendendo come esempio l'assistente vocale ai, attraverso il modello multimodale di grandi dimensioni + rtc, gli utenti possono avere un dialogo vocale in tempo reale 1v1 con l'assistente ai. imposta ricche impostazioni personali per l'assistente tramite prompt (comando ai o parola di prompt ai) e collabora con la trasmissione a latenza ultra bassa di rtc per consentire all'ia di interagire e fornire aiuto come un vero assistente.
in questo tipo di scenario di intelligenza artificiale conversazionale, ci sono molte difficoltà tecniche. ad esempio, il dialogo vocale dell'intelligenza artificiale di solito ha un ritardo elevato, che influisce notevolmente sull'esperienza del dialogo. inoltre, mette alla prova la bassa latenza della trasmissione rtc. di solito il ritardo deve essere compreso tra 1 -2s. l'esperienza della conversazione telefonica sarà naturale e fluida. allo stesso tempo, nelle conversazioni in streaming, le voci umane e il rumore circostante possono facilmente interferire con le conversazioni uomo-macchina. sono necessarie funzioni audio come aivad, agc e ains per sopprimere efficacemente l'interferenza del rumore circostante e identificare meglio il parlato dell'utente. la semantica completa rende il riconoscimento vocale più completo e accurato.
oltre ai nuovi scenari emergenti di intelligenza artificiale conversazionale e agli scenari familiari come spettacoli dal vivo, chat room e karaoke online, il libro introduce anche molti scenari iot di cui non avete mai conosciuto, come la corsa al cloud nel campo del controllo parallelo, cloud racing basato sul cloud computing e sull'intelligenza artificiale, viene utilizzato principalmente per gare di guida a distanza tra appassionati e piloti professionisti. attraverso il controllo della piattaforma cloud, i piloti possono partecipare a gare di corse a distanza da casa.
in questo tipo di scenario, le difficoltà tecniche si concentrano principalmente sul ritardo e sulla trasmissione. ad esempio, le auto da corsa sono veloci e hanno requisiti di latenza elevati, oltre a dover soddisfare la bassa latenza e la stabilità di trasmissione delle immagini in tempo reale backhaul multipli ad alta definizione.
·   capitolo 5: osservazione interattiva di big data in tempo reale
gli utenti di tutto il mondo interagiscono in tempo reale? credo che, come operatore di app, o come collega attento a questo settore, per i big data audio e video in tempo reale, ad esempio, l'elenco dei modelli di utilizzo rtc nei popolari aree in tutto il mondo, la percentuale di reti comunemente utilizzate per i modelli e l'impatto di diversi modelli sui dati come la percentuale di utilizzo di audio e video, l'utilizzo di rtc in aree popolari, ecc. sono tutti aspetti interessati. inoltre, quale impatto ha la velocità di blocco di audio e video sul tempo di utilizzo e sulla fidelizzazione degli utenti? come ottimizzarlo? questi contenuti non devono mancare a nessun professionista del settore rtc?
questo libro prepara anche risorse di supporto ricche e pratiche, inclusi documenti elettronici come grafici, mappe, rapporti sullo sviluppo del settore e libri bianchi relativi all'interazione in tempo reale, è assolutamente pieno di informazioni utili e con un ottimo rapporto qualità-prezzo. il modo specifico per ottenerlo è scansionare il codice qr sul quarta di copertina per accedere all'esclusivo disco cloud di questo libro e scaricarlo.
da dove viene la "comprensione dell'interazione in tempo reale"?
nel contesto della rapida evoluzione dell'ambiente industriale interattivo in tempo reale e della diversificazione degli scenari di utilizzo, shengwang ha scoperto che non esiste alcun libro nel settore che introduca sistematicamente l'interazione in tempo reale dal punto di vista della storia dello sviluppo, degli scenari applicativi, delle tecniche architettura, ecc., e solo pochi libri trattano gli aspetti tecnici dell'interazione in tempo reale quando si introduce webrtc a livello architetturale, molte persone non conoscono la relazione e la differenza tra audio e video in tempo reale rtc e tempo reale rte. pertanto, una comprensione completa e la divulgazione dell’interazione in tempo reale sono particolarmente importanti ora.
quest'anno ricorre il decimo anniversario della fondazione di shengwang come pioniere del settore globale del cloud interattivo in tempo reale, shengwang è sempre statoaiuta le persone a interagire in tempo reale a distanza, ad esempio riunendosicome missione, ci impegniamo a migliorare in modo completo l'esperienza interattiva in tempo reale delle persone attraverso servizi tecnologici audio e video in tempo reale di alta qualità, potenziando i settori sociale, educativo, finanziario, medico e di altro tipo e promuovendo lo sviluppo economico e sociale. shengwang ha la responsabilità e l'obbligo di promuovere la divulgazione dell'interazione in tempo reale.
a questo proposito, shengwang ha lanciato il libro "comprendere l'interazione in tempo reale: interpretazione approfondita di tecnologia audio e video, scenari e dati" in occasione del suo decimo anniversario. questo libro inizia dastoria dello sviluppo, principi tecnici, scenari applicativi, osservazione dei big data e altre dimensioniuna spiegazione completa e sistematica dell'interazione in tempo reale. ci auguriamo che, leggendo questo libro, i lettori possano avere una comprensione approfondita dell'interazione in tempo reale e padroneggiare le conoscenze relative all'interazione in tempo reale e incoraggiare più persone a unirsi a questo settore e promuovere congiuntamente il progresso del settore.
attualmente,"understanding real-time interaction" è stato lanciato sulle principali piattaforme di e-commerce e librerie fisiche come jd.com e dangdang, quindi rimanete sintonizzati.
segnalazione/feedback