noticias

soundnet publica un nuevo libro "understanding real-time interaction" para registrar el pasado, presente y futuro de rte

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

como infraestructura para la vida digital futura, la interacción en tiempo real de rte ha penetrado completamente en todos los aspectos de la interacción social, el entretenimiento, el trabajo, las compras, etc. de las personas, y ha aprovechado el crecimiento del valor en todos los ámbitos de la vida. incluso en la actual locura de aigc, la interacción en tiempo real está desempeñando un papel importante, promoviendo la actualización de la interacción entre humanos y la ia del texto al audio y video multimodal.
sin embargo, ¿qué es exactamente la interacción en tiempo real? ¿cómo evolucionó a partir del audio y video en tiempo real de rtc? ¿cuál es el principio técnico detrás de esto? ¿cuántos escenarios de aplicación se han implementado hasta ahora? ¿tiempo de diálogo de voz en modelos grandes en el futuro?
publicado por machinery industry press el 27 de agosto deinstituto de investigación shengwangel libro industrial interactivo en tiempo real "comprensión de la interacción en tiempo real" compilado por el grupo está oficialmente a la venta. este es también el primer libro de divulgación científica técnica de la industria que presenta sistemáticamente la interacción en tiempo real.
jixun foo, socio gerente senior de granite asia, jiang tao, fundador y presidente de csdn, liu qin, socio fundador de wuyuan capital, liu chengcheng, fundador y presidente de 36kr, li donghong, profesor de la universidad de tsinghua, ma siwei, profesor de la universidad de pekín, xie lei, profesor de la universidad politécnica del noroeste, idc china el vicepresidente y analista jefe, wu lianfeng, y otros lo recomendaron conjuntamente.
para comprender la interacción en tiempo real, este libro es suficiente.
el libro "comprensión de la interacción en tiempo real" presenta en detalle el pasado, presente y futuro del desarrollo de la interacción en tiempo real.cubre el historial de desarrollo, el análisis de conceptos, los principios técnicos, los escenarios de aplicación y la observación de big data de la interacción en tiempo real.etc., se divide principalmente en cinco partes.
·   capítulo 1: mirar hacia atrás y comprender el pasado, el presente y el futuro de la interacción en tiempo real
desde el nacimiento del primer teléfono voip del mundo que puede realizar llamadas en 1996 hasta ahora que los humanos pueden realizar conversaciones de voz en tiempo real con ia, ¿qué evoluciones de escenarios, actualizaciones tecnológicas e innovaciones corporativas se han experimentado durante este período desde la matanza de hombres lobo? y conexión de transmisión en vivo desde mai, educación en línea, podcasts interactivos, yuanverse, hasta el popular aigc de este año, shengwang analizará las actualizaciones tecnológicas y los cambios de la industria de la interacción en tiempo real desde la perspectiva de un proveedor de servicios de audio y video de nivel inferior.
por ejemplo, ¿cómo se ha convertido la interacción en tiempo real en una característica estándar de las aplicaciones de entretenimiento general? con el soporte de funciones rtc, ¿cómo pueden los dispositivos iot hacer que todo sea interactivo? desde la primera aparición del concepto de videoconferencia en 1964 hasta ahora, los desarrolladores pueden integrar funciones de videoconferencia en cualquier aplicación. ¿cómo se ha actualizado la videoconferencia de una única herramienta de comunicación a una capacidad universal?
·   capítulo 2: interacción en tiempo real y análisis de conceptos relacionados.
siempre hablamos de rtc y rte, pero ¿realmente entiendes la diferencia entre los dos? espera, también existen paas, saas, iaas y apaas. ¿todavía te estás devanando los sesos porque no puedes distinguir estos conceptos?
creo que después de leer este capítulo, tendrá una comprensión cada vez más clara de estos conceptos.
·   capítulo 3: análisis del proceso de tecnología de audio y video en tiempo real.
el evento principal está aquí. como principiante en la industria, este capítulo es su mejor opción para comprender la tecnología de audio y video en tiempo real. desde la recopilación de audio y video, el preprocesamiento, la codificación, la transmisión hasta el posprocesamiento de audio y video, nos asociamos con muchos expertos técnicos de agora para cubrirlos uno por uno en un espacio más largo y con más palabras.
en este capítulo, puede ver las mejores prácticas de procesamiento de audio 3a y bel canto en el preprocesamiento de audio y video; cómo lograr el embellecimiento en escenarios como transmisiones en vivo y videollamadas; las diferencias entre vp8, vp9, ​​h. 264, h.265 y av1, etc. ¿cuáles son las diferencias en la aplicación de los estándares de códec de video en rtc?
·   capítulo 4: profundizandoanalizar los recientes200 escenarios de aplicaciones interactivas en tiempo real
en la actualidad, la industria aigc se está desarrollando en pleno apogeo. con la bendición de la interacción en tiempo real, la interacción entre humanos y ia también ha pasado del texto al audio y video multimodal. también han surgido muchos escenarios de ia conversacional, como la voz de ia. asistentes, profesores hablados de ia, npc de juegos de ia, amantes virtuales de ia, etc. tomando como ejemplo el asistente de voz ai, a través del modelo grande multimodal + rtc, los usuarios pueden tener un diálogo de voz 1v1 en tiempo real con el asistente ai. establezca configuraciones personales ricas para el asistente a través del mensaje (comando de ia o palabra de mensaje de ia) y coopere con la transmisión de latencia ultrabaja de rtc para permitir que la ia interactúe y brinde ayuda como un asistente real.
en este tipo de escenario de ia conversacional, existen muchas dificultades técnicas. por ejemplo, el diálogo de voz de ia suele tener un retraso elevado, lo que afecta en gran medida la experiencia del diálogo. también prueba la baja latencia de la transmisión rtc. -2s. la experiencia de la conversación telefónica será natural y fluida. al mismo tiempo, en las conversaciones en streaming, las voces humanas y el ruido circundantes pueden interferir fácilmente con las conversaciones entre humanos y máquinas. se necesitan funciones de audio como aivad, agc y ains para suprimir eficazmente la interferencia del ruido circundante e identificar mejor el habla del usuario. la semántica completa hace que el reconocimiento de voz sea más completo y preciso.
además de los escenarios de ia conversacionales emergentes y los escenarios familiares como shows en vivo, salas de chat y karaoke en línea, el libro también presenta muchos escenarios de iot que nunca ha conocido, como las carreras en la nube en el campo del control paralelo. carreras en la nube basado en computación en la nube e inteligencia artificial, se utiliza principalmente para competiciones de carreras de conducción remota entre entusiastas y corredores profesionales. a través del control de la plataforma en la nube, los conductores pueden participar en competiciones de carreras remotas desde casa.
en este tipo de escenario, las dificultades técnicas se centran principalmente en el retraso y la transmisión. por ejemplo, los coches de carreras son rápidos y tienen requisitos de alta latencia. deben cumplir con la baja latencia y la estabilidad de transmisión de las imágenes en tiempo real. múltiples backhauls de alta definición.
·   capítulo 5: observación interactiva de big data en tiempo real
¿los usuarios de todo el mundo interactúan en tiempo real? creo que, como operador de aplicaciones o colega que presta atención a esta industria, para big data de audio y video en tiempo real, por ejemplo, la lista de modelos de uso de rtc es popular. áreas de todo el mundo, la proporción de redes comúnmente utilizadas para los modelos y el impacto de diferentes modelos en los datos, como la proporción de uso de audio y video, el uso de rtc en áreas populares, etc., están todos preocupados. además, ¿qué impacto tiene la tasa de congelación de audio y video en el tiempo de uso y la retención del usuario? ¿cómo optimizarlo? ningún profesional de la industria de rtc debe perderse estos contenidos.
este libro también prepara recursos de apoyo ricos y prácticos., incluidos documentos electrónicos como gráficos, mapas, informes de desarrollo de la industria y documentos técnicos relacionados con la interacción en tiempo real, está absolutamente lleno de información útil y una excelente relación calidad-precio. la forma específica de obtenerlo es escanear el código qr en el. contraportada para ingresar al disco en la nube exclusivo de este libro y descargarlo.
¿de dónde viene "comprender la interacción en tiempo real"?
en el contexto de la rápida evolución del entorno industrial interactivo en tiempo real y la diversificación de los escenarios de uso, shengwang descubrió que no existe ningún libro en la industria que introduzca sistemáticamente la interacción en tiempo real desde las perspectivas de la historia del desarrollo, los escenarios de aplicación y la tecnología. arquitectura, etc., y solo unos pocos libros cubren los aspectos técnicos de la interacción en tiempo real. al introducir webrtc a nivel arquitectónico, muchas personas no conocen la relación y la diferencia entre audio y video en tiempo real rtc y rte en tiempo real. por lo tanto, una comprensión integral y la popularización de la interacción en tiempo real son particularmente importantes ahora.
este año se cumple el décimo aniversario del establecimiento de shengwang. como pionero de la industria global de la nube interactiva en tiempo real, shengwang siempre lo ha sido.ayudar a las personas a interactuar en tiempo real a través de distancias, como reunirsecomo misión, estamos comprometidos a mejorar integralmente la experiencia interactiva en tiempo real de las personas a través de servicios de tecnología de audio y video en tiempo real de alta calidad, potenciar las industrias sociales, educativas, financieras, médicas y otras, y promover el desarrollo económico y social. shengwang tiene la responsabilidad y la obligación de promover la popularización de la interacción en tiempo real.
en este sentido, shengwang lanzó el libro "comprensión de la interacción en tiempo real: interpretación en profundidad de la tecnología, escenarios y datos de audio y video" con motivo de su décimo aniversario. este libro comienza desdehistorial de desarrollo, principios técnicos, escenarios de aplicación, observación de big data y otras dimensiones.una explicación completa y sistemática de la interacción en tiempo real. esperamos que al leer este libro, los lectores puedan tener una comprensión profunda de la interacción en tiempo real y dominar el conocimiento relacionado con la interacción en tiempo real, y alentar a más personas a unirse a esta industria y promover conjuntamente el progreso de la industria.
actualmente,"comprensión de la interacción en tiempo real" se lanzó en las principales plataformas de comercio electrónico y librerías físicas como jd.com y dangdang, así que estad atentos.
informe/comentarios