notícias

o primeiro modelo nacional de grande porte com “olhos” foi apresentado na feira de serviços

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

o grande modelo doméstico desbloqueou com sucesso os "olhos", e a zhipu ai (beijing zhipu huazhang technology co., ltd.) demonstrou a versão transparente mais recente na feira internacional de comércio de serviços da china de 2024 (conhecida como feira), que foi inaugurada em 12 de setembro. função yan app “video call”. é relatado que esta é a primeira função de videochamada em grande escala do mundo aberta a usuários públicos.
segundo relatos, a função de videochamada de qingyan abrange três modos principais: texto, áudio e vídeo, e possui recursos de raciocínio em tempo real. os usuários podem ligar a câmera e se comunicar com qingyan por meio da janela de videochamada. qingyan pode não apenas "ver" a tela do usuário, mas também compreender as instruções e executá-las com precisão, e pode responder rapidamente, mesmo se interrompido com frequência. ao destacar os pontos-chave na tela, qingyan também pode entender no que o usuário deseja focar.
fornecer assistência com o dever de casa.
zhipu ai afirmou que o gpt-4o lançou anteriormente a voz, mas não abriu a função de vídeo ao público. usando qingyan, você pode experimentar a tecnologia de ia/modelo grande mais avançada. no passado, a interação com a ia era principalmente na forma de texto. com a função de vídeo, os usuários podem se despedir de longos prompts de texto e comunicar-se facilmente com a ia. qingyan é como um assistente humano com visão e compreensão do usuário. enquanto a câmera tirar uma foto, a ia conhecerá o ambiente do usuário e o que ele deseja que a ia faça. instruções.
grande modelo doméstico desbloqueia "olhos" com sucesso.
a função de videochamada qingyan também pode ser transformada em um tradutor portátil de inglês, que pode realizar tradução instantânea entre chinês e inglês, conduzir conversas em inglês com base nas informações ambientais do usuário e ajudar a corrigir a pronúncia e erros gramaticais do usuário. os cenários de uso desta função incluem explicar as histórias de pontos turísticos a qualquer momento durante a viagem, identificar o ambiente para deficientes visuais, etc. também pode fornecer aulas de lição de casa e orientação para entrevistas, completar atas e resumos em reuniões, analisar dados complexos gráficos e interpretar computadores em tempo real.
nesta feira de serviços, a zhipu ai exibirá uma variedade de produtos mais recentes. além da função de videochamada do aplicativo qingyan, ele também inclui uma função de vídeo gerada por ia. zhipu lançou o modelo de geração de vídeo cogvideox no início deste ano e lançou a função "qingying" de geração de vídeo no aplicativo zhipu qingyan. qingying está aberto a todos os usuários. basta inserir um texto ou enviar uma imagem e um vídeo de 6 segundos pode ser gerado em 30 segundos. em julho deste ano, qingying lançou o aplicativo qingyan e os usuários geraram mais de 1 milhão de vídeos em seis dias.
o repórter do jornal zhang jing
(este artigo é do the paper. para mais informações originais, baixe o app “the paper”)
relatório/comentários