en la feria de servicios se presentó el primer modelo nacional de gran tamaño "con ojos"

en la feria de servicios se presentó el primer modelo nacional de gran tamaño con "ojos"

2024-09-13

el modelo grande nacional abrió con éxito los "ojos", y zhipu ai (beijing zhipu huazhang technology co., ltd.) demostró la última versión clara en la feria internacional de comercio de servicios de china de 2024 (conocida como la feria del comercio de servicios). ), que se inauguró el 12 de septiembre. función “videollamada” de la aplicación yan. se informa que esta es la primera función de videollamada a gran escala del mundo abierta a usuarios públicos.

según los informes, la función de videollamadas de qingyan abarca tres modos principales: texto, audio y video, y tiene capacidades de razonamiento en tiempo real. los usuarios pueden encender la cámara y comunicarse con qingyan a través de la ventana de videollamada. qingyan no solo puede "ver" la pantalla del usuario, sino también comprender las instrucciones y ejecutarlas con precisión, y puede responder rápidamente incluso si se le interrumpe con frecuencia. al resaltar los puntos clave en la pantalla, qingyan también puede comprender en qué quiere que se centre el usuario.

proporcionar ayuda con la tarea.

zhipu ai declaró que gpt-4o lanzó anteriormente la voz pero no abrió la función de video al público. con qingyan, puede experimentar la tecnología de modelos grandes/ia más avanzada. en el pasado, la interacción con la ia se realizaba principalmente en forma de texto. con la función de vídeo, los usuarios pueden despedirse de las largas indicaciones de texto y comunicarse sin problemas con la ia. qingyan es como un asistente humano con visión y comprensión del usuario. siempre que la cámara tome una fotografía, la ia conocerá el entorno del usuario y lo que quiere que haga. el usuario solo necesita dar información verbal. instrucciones.

el modelo nacional grande desbloquea con éxito los "ojos".

la función de videollamada de qingyan también se puede transformar en un traductor de inglés portátil, que puede realizar traducciones instantáneas entre chino e inglés, realizar conversaciones en inglés basadas en la información ambiental del usuario y ayudar a corregir la pronunciación y los errores gramaticales del usuario. los escenarios de uso de esta función incluyen contar historias de lugares escénicos en cualquier momento durante el viaje, identificar el entorno para personas con discapacidad visual, etc. también puede proporcionar tutoría sobre tareas de asignaturas y orientación para entrevistas, completar actas y resúmenes en reuniones, analizar datos complejos. gráficos e interpretar el código de pantalla de las computadoras en tiempo real.

en esta feria de servicios, zhipu ai mostrará una variedad de productos más recientes. además de la función de videollamada de la aplicación qingyan, también incluye una función de video generada por ia. zhipu lanzó el modelo de generación de video cogvideox a principios de este año y lanzó la función "qingying" de generación de video en la aplicación zhipu qingyan. qingying está abierto a todos los usuarios. simplemente ingrese texto o cargue una imagen y se podrá generar un video de 6 segundos en 30 segundos. en julio de este año, qingying lanzó la aplicación qingyan y los usuarios generaron más de 1 millón de vídeos en seis días.

el periodista del periódico zhang jing

(este artículo es de the paper. para obtener más información original, descargue la aplicación “the paper”)

informe/comentarios

noticias

en la feria de servicios se presentó el primer modelo nacional de gran tamaño con "ojos"

introducción

mi información de contacto