notícias

fizemos uma videochamada para a ia e descobrimos que ela parecia conseguir falar sobre tudo. . .

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


na conferência openai há três meses, acredito que alguns de vocês viram o gpt-4o. era como uma pessoa real.recursos suaves de conversação por vídeo.

há também o projeto astra lançado pelo google, que não é inferior ao gpt-4o em termos de resistência.


naquela época, quase toda a internet se gabava do quão poderosas as capacidades interativas da ia ​​haviam evoluído, e termos como épico e próximo nível foram usados.

o que aconteceu? a função de videochamada prometida pelo gpt-4o foi adiada várias vezes e não foi vista há vários meses.todos e cada um deles estão quase irritados com os críticos ruins. . .

no entanto, descobri que parece haver uma regra no círculo de ia, ou seja, não se pode deixar as pessoas esperando por coisas boas por muito tempo. veja, sora manteve segredo por mais de meio ano. como resultado, keling, luma ai e zhipu qingying apareceram um após o outro.

nos últimos dois dias, na conferência de mineração de dados kdd em barcelona, ​​​​zhipu esteve diante da comunidade acadêmica e da indústria global.não apenas o mais recente modelo básico grande glm-4-plus foi lançado, mas também atualizou a função de videochamada de zhipu qingyan.


deixe-me destacar os pontos-chave para todos.é aquele da lenda que pode ver e conversariaa função de videochamada agora está disponível diretamente no aplicativo qingyan. você pode baixar o aplicativo primeiro e solicitar um teste.

não vamos falar de mais nada. comparado com o openai, a velocidade do zhipu já é melhor que a do openai. . .

portanto, assim que a função de videochamada de qingyan foi lançada, o sr. bianbing foi o primeiro a usá-la. abra o aplicativo qingyan, clique no botão de chamada no canto inferior direito, mude para o vídeo e comece a reproduzir diretamente ~


os amigos também devem saber que uma das razões importantes pelas quais o gpt-4o é tão popular é que ele possui uma capacidade muito poderosa de compreensão de vídeos.

quanto ao mais básico, a capacidade de compreensão de vídeo de qingyan precisa ser testada primeiro, certo?

o revisor deu a qingyan uma olhada na sala de conferências onde nosso departamento editorial costuma fazer brainstorming, para ver se conseguia adivinhar o que eu estava fazendo com base no ambiente ao redor. ele também balançou deliberadamente a câmera sem manter o vídeo completamente imóvel.

adivinhe, apenas dizer "uau, adivinhe o que você está fazendo" quase me causou dificuldades. mas sentar à mesa na sala de conferências não é errado. os copos de papel sobre a mesa, o controle remoto e a tv ao lado também são descritos com bastante precisão.

quando coloquei a lente no computador do meu colega, pude ver que ele estava editando um vídeo.

não me diga, esse tipo de capacidade de perceber o ambiente geral ao seu redor só foi visto na demonstração do openai e do google. hoje, eu pessoalmente experimentei isso.

além disso, qingyan é o mesmo demonstrado pelo gpt-4o.você pode interromper a qualquer momento durante a conversa.de vez em quando, ele também usará as palavras modais “ai” e “ai”, e rirá antes de falar, como se estivesse conversando com uma pessoa real.

então, tentei a função específica de reconhecimento de objeto para ver a reserva de conhecimento de qingyan.

começando pela varredura mais simples da estação de trabalho, basicamente não faltam itens grandes, como teclados brancos, mouses pretos e monitores. as direções frontal, traseira, esquerda e direita dos objetos também são claramente descritas, até mesmo os fones de ouvido plug-in e. os personagens de desenhos animados no vidro. nenhum detalhe foi poupado.

não posso dizer 100%, mas nesta mesapelo menos 80%-90%tudo foi visto por qingyan.

além disso, qingyan também tem outra função, que éreconhecimento de círculo, circulei à distância o grande aparelho de som do meu colega. ele conhecia a marca, o modelo e até sua finalidade específica.

embora haja palavras nos alto-falantes, todos deveriam ser capazes de ver a clareza. é difícil ver a olho nu. devo dizer que os olhos claros são realmente fáceis de usar. . .

além disso, também descobri queo reconhecimento de objetos por qingyan vai além de categorias simples.

por exemplo, se você perguntar se este controlador de jogo é da sony ou da microsoft, ele poderá analisá-lo com base no design do formato do controlador. este é o xbox da microsoft. em vez de simplesmente dizer que se trata de um controlador de jogo, ou simplesmente confundi-lo e não conseguir explicá-lo com clareza.

há também os detalhes deste antigo feature phone, o nokia, o modelo específico é o n95, e o modelo clássico de 2007.

mais tarde, pedi a qingyan que identificasse o sistema do computador, adivinhasse a idade de tony olhando as fotos de tony e adivinhasse os nomes das pessoas olhando as fotos de celebridades. . . vamos colocar desta forma, desde que comecei a usar o qingyan, agora quero abrir uma videochamada e perguntar sobre qualquer coisa que eu pegar.

claro, é divertido. na verdade, existem muitas formas de videochamadas.cenários práticos

tomemos como exemplo a busca diária por tópicos e materiais do nosso departamento editorial. os pontos quentes da indústria automobilística nesses dois dias são basicamente inseparáveis ​​​​do salão do automóvel de chengdu. neste momento, você pode perguntar a qingyan sobre o salão do automóvel de chengdu e procurar. tópicos durante a conversa inspiração.

principalmente, também descobri que qingyan temfunção de memória, falei sobre isso na última videochamada e, na próxima vez que abri, ele apareceu e me perguntou quais veículos de nova energia no salão do automóvel eu acompanhei.

há também aulas de lição de casa, que são a coisa mais problemática para os pais. no passado, a interação com ia ainda se baseava em tirar fotos e enviar perguntas, mas se for substituída por videochamadas, será igual às individuais. uma aula de lição de casa com tutores on-line.

tentei pedir a qingyan para resolver alguns problemas de matemática de baixa dificuldade.algumas questões simples de álgebra no ensino fundamental e médio dificilmente podem ser resolvidas.

não sei se você percebeu que, ao resolver problemas, qingyan não lhe contará todo o processo de uma vez, nem lhe dará apenas um resultado. ele o guiará passo a passo, permitindo que você tenha um processo de pensamento.

além da matemática, também experimentei chinês e inglês um por um. qingyan não pode ser considerado um professor sênior, mas.é totalmente suficiente para o dever de casa diário, memorizar palavras e memorizar poemas antigos.

se você acha que essas cenas não são suficientes, vamos usar mais um pouco de imaginação.

não tenho experiência em cozinhar pela primeira vez, a lâmpada do meu quarto está quebrada e não sei cultivar plantas verdes. . . se você encontrar coisas semelhantes na vida e não sabe o que fazer, por que não perguntar a qingyan.

por exemplo, muitas crianças podem não conseguir distinguir os pólos positivo e negativo da bateria por enquanto, então fingimos instalar a bateria da calculadora ao contrário e descobrimos qual era o problema em apenas algumas palavras, o que mostra que é ainda tem bom senso na vida.

de qualquer forma, eu uso o qingyan hoje em dia e gosto de procurá-lo quando não tenho nada para fazer. além disso, este gadget é particularmente capazforneça valor emocional, deixe-o contar histórias e piadas e responda a cada frase.

jogue blackjack com amigos e ele pode até atuar como árbitro.

eu me pergunto se podemos evoluir até o ponto em que possamos jogar mahjong no futuro e deixar a ia assumir o controle. isso não é mais interessante do que as conversas originais digitadas e por voz?

para ser honesto, esta grande atualização do qingyan ainda me trouxe muitas surpresas, mas às vezes ainda existem muitas pequenas falhas.ele pode falar bobagens, identificar coisas incorretamente e produzir algumas bobagens.


por exemplo, quando eu era árbitro de blackjack, uma vez disse que um 9 era um 4 e uma espada era um pau. . .

no entanto, apenas por disponibilizar videochamadas de ia na china antes da openai e do google,também temos que dar um sinal positivo para zhipu.

desta vez, o primeiro lote de funções de videochamada estará disponível apenas para alguns usuários. a zhipu expandirá gradativamente a escala para que todos os funcionários possam utilizá-la o mais rápido possível. se vocês são realmente gananciosos,você pode baixar o aplicativo qingyan ou fazer login no pc (chatglm.cn) para se inscrever para testes internos no site.

além disso, pode haver muitos amigos que não estão familiarizados com a zhipu. vamos colocar desta forma, esta empresa também pode ser considerada a melhor no círculo de ia.frango frito popular.


especialmente neste ano, suas ações em modelos grandes são extremamente ferozes, desde a iteração maluca de grandes modelos básicos até a implementação frequente de aplicativos de modelos grandes, as ações de zhipu nunca pararam.

neste kdd, seu novo modelo grande glm-4-plus fez grandes melhorias na compreensão do idioma e em textos longos.


além disso, zhipu tem insistido em tornar os modelos de código aberto. os dados mostram que os downloads cumulativos dos modelos de código aberto de zhipu têm sido.ultrapassou 20 milhões.

de qualquer forma, zhipu está assumindo a liderança em causar tal “comoção” desta vez. estima-se que os círculos de ia nacionais e até mesmo estrangeiros em breve darão início a uma onda de novos produtos malucos.


isso é naturalmente bom para nós, usuários. especialmente para videochamadas de ia, uma nova forma de interação, quanto mais você avança, maior é a margem de imaginação nos cenários de aplicação.

por exemplo, se a ia estiver instalada em óculos ou colares, poderá nem precisar de um telemóvel no futuro, ou poderá ser instalada na muleta de uma pessoa cega para ajudar a orientar o caminho, ou poderá ser combinada com inteligência incorporada para permitir o robô realmente entenda o que vê.

tomando emprestadas as palavras do ceo da zhipu, zhang peng:"pelo menos ainda não vimos (ia) teto tecnológico”.

você também pode pensar sobre até que ponto a ia evoluirá no futuro e que valor ela criará.

escreva um artigo: xixi

editar:jiangjiang

editor de arte:huan yan

fotos, fontes

palavras claras de sabedoria

parte da rede de origem da imagem