notícias

Conversa da senhorita A com Serge Belongie: Dê a você uma “bala” falsificável |

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


A falsificabilidade é tanto um anjo quanto um demônio; em última análise, a falsificabilidade é um aperto de mão que alinha o mundo.

Autor|Zhang Yijia Sukhoi‍‍

Há dez anos, um académico europeu disse-me: "Existem nada menos que cem pistas subdivididas em inteligência artificial, e os Estados Unidos definirão uma ou duas pistas populares. , e depois os empresários e investidores globais correram para acompanhar estas duas vias. "

Nos dez anos seguintes, a tendência da inteligência artificial mudou, e a inteligência artificial passou do não-consenso para o pequeno consenso, e do pequeno consenso para o grande consenso, mas esta frase nunca se destacou.

Esta conversa com Serge começou com a revisão de um artigo que ele co-escreveu há dois anos."Em busca de estrutura em afirmações infalsificáveis" interesse de. É uma pena que este artigo quase não tenha recebido atenção até agora, Google ScholarCitado apenas 2 vezes

Isto é surpreendente.

"Jiazi Guangnian" acredita que,este ensaiogrosseiramente subestimado

Razão 1: A questão enfrentada por este artigo é extremamente crítica (a narrativa subjacente de dados não falsificáveis ​​nas redes sociais);

Razão dois, este artigo traz inovações teóricas importantes (método de anotação ternária e conjunto SNaCK);

Razão três: este artigo fornece resultados práticos de engenharia (construção de conjunto de dados e comparação experimental detalhada).


Autores do artigo Peter Ebert Christensen, Frederik Warburg, Menglin Jia e Serge Belongie;

Este artigo não é difícil de entender. Começamos com.FalsificabilidadeO conceito começa a ser introduzido.

A falsificabilidade também é chamada de refutabilidade.As filosofias da ciência costumam usarmétodo de falsificaçãoPara determinar se uma teoria é científica, isto é"Estas conclusões devem permitirlógicaA existência de contra-exemplos para

Karl Popper propôs em 1934 que se uma teoria ou hipótese pode ser logicamente contradita por testes empíricos de técnicas existentes, então éFalsificável de. E se uma expressão for tão impecável que o mundo não tenha espaço para comentários, muitas vezes apenas manterá todos à distância, o que não ajuda a promover o progresso científico.

Os problemas que os cientistas podem ou devem estudar devem ser mais ou menos bloqueados, permitindo que outros tenham a oportunidade de os atacar ou mesmo de os derrubar. O objetivo da falsificabilidade é tornar a teoria preditiva e testável.portanto útil na prática

O jornal de Sérgio"Em busca de estrutura em afirmações infalsificáveis"discutidoA complexidade de interpretar afirmações infalsificáveis ​​nas redes sociais

A ideia principal do artigo:

As plataformas de redes sociais estão inundadas com publicações e comentários, e muitas afirmações não podem ser refutadas. No entanto,Ferramentas insuficientes de verificação de fatos, falta de estrutura nas discussões nas redes sociais, dificuldades na identificação de narrativas e falta de qualidade nas discussões públicasetc., causando muitos problemas.

O artigo examina como identificar e compreender aqueles que estão nas redes sociaisafirmações infalsificáveise resumir essas afirmações comoUm número limitado de narrativas, para melhor facilitar a discussão e o debate nas redes sociais.

Curiosamente, o autor construiu uma ferramenta chamadaPAPELUm conjunto de dados contendo o debate sobre métodos de secagem das mãos em banheiros públicos (toalhas de papel versus secadores de ar), 600 trechos de textos curtos, 31 narrativas e 4 supercategorias para compreender e descobrir narrativas dominantes em discussões online.

Este artigo apresentaUma nova abordagem que vai além das capacidades das tecnologias de verificação de factos existentes, fornece uma contribuição importante para gerenciar e compreender o impacto de afirmações infalsificáveis ​​em ambientes de comunicação digital - usando esse processo para descobrir narrativas dominantes e mostrando que esse processo supera modelos recentes de transformação em grande escala e assuntos não supervisionados de última geração Modelo .

através de experimentos,O autor encontrouUse um conversor de frases moderno(como modelo T5)Incorporação de frase inicialÉ a chave .Eles também descobriram que a estratégia de amostragem é crucial para gerar embeddings de alta qualidade, especialmenteEstratégia "Distância-Rnd"Melhor performance.

Resultados experimentais mostram que combinar anotações humanastrigêmeospode revelar conformidadenarrativa cristalizadaagrupamento interessante.

Apenas 2 citações

"Jiazi Guangnian" acredita que as possíveis razões pelas quais este artigo tem faltado atenção na indústria até agora incluem, mas não estão limitadas a:

(1) A análise teórica é relativamente fraca e a análise dos resultados experimentais permanece qualitativa (o texto de 11 páginas contém apenas meia página de fórmulas);

(2) Quase não há introdução aos vários algoritmos usados ​​para comparação;

(3) Pode ainda não existir um conjunto de dados unificado na comunidade académica neste domínio, resultando em nenhuma “fora do círculo” dentro da comunidade académica;

(4) O autor enfatizou a criticidade do T5, mas não descreveu claramente a superioridade do seu algoritmo.


Partilha acadêmica de Serge Belongie no CVPR2024, fonte: Fotografado por "Jiazi Guangnian"

Embora os artigos mencionados acima sejam pouco conhecidos, o próprio Serge é um cientista muito influente no campo da visão computacional e do aprendizado de máquina. Ele estuda principalmente reconhecimento de objetos e segmentação de imagens. Seus vários artigos foram citados um total de 1.789,71 milhões de vezes.

Serge Belongie é professor de ciência da computação na Universidade de Copenhague e diretor do Centro Pioneiro Dinamarquês de Inteligência Artificial. Anteriormente, ele atuou como reitor associado e professor Andrew H. e Ann R. Tisch de Ciência da Computação na Cornell Tech.

O mais digno de introdução éSerge é o autor principal do MSCOCO

O conjunto de dados MSCOCO é um dos conjuntos de dados de grande escala mais famosos para visão computacional.Em 2000, Serge e Jitendra Malik (agora professor de ciência da computação na Universidade da Califórnia, Berkeley, e um famoso estudioso na área de visão computacional)propuseram conjuntamente o conceito de “Contexto de Forma”,É um método de descrição de características de forma amplamente utilizado nas áreas de visão computacional e reconhecimento de objetos.

Em 2004, Serge foi nomeado Jovem Inovador Tecnológico com menos de 35 anos pela MIT Technology Review; em 2007, ele e Jitendra Malik receberam uma menção honrosa pelo Prêmio Marr, em 2015, Serge recebeu o Prêmio ICCV Helmholtz, este prêmio é concedido principalmente a autores; de artigos que fizeram contribuições fundamentais no campo da visão computacional.

Serge também é cofundador de várias empresas, incluindo Digital Persona (fundida com CrossMatch em 2014), CarCode (adquirida pela Transport Data Systems), Anchovi Labs (adquirida pela Dropbox em 2012) e Orpix.

Atualmente, a equipe SergeAbrindo novas dimensões na análise de redes sociais——Partindo de um grande número de observações triviais que não foram prestadas atenção antes e não são adequadas para a verificação tradicional de fatos,Analise a configuração do problema emanipulação narrativa

Isto tem um significado especial neste momento:

Após a Guerra Mundial Antifascista, independentemente da alternância de avanços tecnológicos ou gargalos, todos eles experimentaram altos e baixos no quadro histórico com o passar do tempo. Assim como “Ao longo do rio durante o Festival Qingming” desdobrado no sistema de coordenadas de tempo e espaço, ele é repleto de milhares de cenas e aparições de seres antigos e modernos.

A seguir está a conversa da senhorita A com Serge.

Siga a conta pública “Jiazi Guangnian” e responda “pode ser falsificado” em segundo plano para obter as informações mencionadas no artigo"Em busca de estrutura em afirmações infalsificáveis"eConjunto de dados MSCOCODois papéis.

1. A falsificabilidade está sendo desafiada

Na prática, os pesquisadores são frequentemente influenciados por narrativas de que gostam ou não – algo semelhante aos trending topics do Instagram.

Senhorita A: “Se não pode ser falsificado, não pode ser científico” tornou-se um consenso geral na comunidade científica. Mas muitos filósofos questionaram isto, argumentando que o princípio da falsificabilidade pode levar a debates científicos intermináveis.A falsificabilidade é uma condição necessária para o progresso científico?

SarjaSegundo a opinião popular, uma teoria científica deve ser falsificável.

Senhorita A:Esta é a visão popular, mas será a falsificabilidade o paradigma predominante?

Sarja: A literatura sobre aprendizado de máquina explodiu nos últimos 15 anos, com um grande número de artigos publicados e citados todos os dias. Nestes artigos, as seções de trabalho relacionadas frequentemente citam outra literatura, mas as citações não são necessariamente a literatura mais relevante para o seu trabalho. Isto acontece porque a quantidade de literatura é enorme;Os pesquisadores estão, na verdade, respondendo à narrativa dominante na área.

Muitas vezes pensamos que somos cientistas na tradição de Karl Popper, sujeitos apenas a afirmações falsificáveis. No entanto, também existem tendências na pesquisa científica, como tecnologias como redes generativas adversárias generativas e transformadores. Embora esses artigos pretendam seguir a tradição científica,Os pesquisadores são frequentemente influenciados, na prática, por narrativas de que gostam ou não gostam——Mais ou menos como tópicos de tendência no Instagram

Senhorita A:Você quer dizer que, desde o aprendizado de máquina, os cientistas começaram a se desviar da norma da falsificabilidade?

Sarja:Os cientistas muitas vezes afirmam ser imunes a estas influências e consideram-se objectivos, mas afinal são seres humanos e serão influenciados por estas opiniões populares.Isso é algo que consideramos não científico e mais um pressentimento e opinião.

Senhorita A:Como você define afirmações infalsificáveis ​​nas redes sociais?

Sarja: Primeiro precisamos discutir a literatura sobre verificação de fatos. A professora Isabelle Augenstein, da Universidade de Copenhaga, por exemplo, desenvolveu um método que começa com a determinação do valor de verificação de uma declaração. Vamos verificar um extrato,e determine seu valor de verificação no intervalo de 0 a 1

Por exemplo, a afirmação de que a capital da Califórnia é Sacramento é ideal para verificação gramatical e sintática porque pode ser encontrada em diversas bases de conhecimento estruturadas. Poderíamos examinar uma afirmação como: “A capital da Califórnia é Sacramento” e atribuir-lhe uma pontuação de testabilidade provavelmente próxima de 0,99. Em seguida, o submetemos a uma base de conhecimento estruturada para confirmar a resposta. Este sistema de testabilidade baseado em aprendizagem profunda processa grandes quantidades de declarações e dados de treinamento para avaliar o valor de verificação de diferentes declarações.

Mas algumas declarações,Por exemplo, “Imigrar para a Califórnia é ruim” reflete opiniões mais pessoais e não é adequado para verificação de fatos.Em contraste, declarações como “Desde 2020, o número de imigrantes na Califórnia continuou a aumentar” têm alto valor de verificação.

entãoPrestamos especial atenção às alegações que são difíceis de verificar——Estas afirmações não podem ser verificadas diretamente, mas a discussão que suscitaram nas redes sociais é significativa.Múltiplas verificações podem nos ajudar a fazer julgamentos melhores.

Senhorita A:Na sua pesquisa, que técnicas ou ferramentas específicas são utilizadas para identificar e analisar afirmações infalsificáveis?

Sarja:Usamos técnicas de processamento de linguagem natural (PNL), algoritmos de agrupamento e agrupamento e métodos de aprendizado de máquina.

nosso alvo éCriando um Mecanismo Global de Informação Narrativa (GNIF), para pesquisar e organizar conteúdo de mídia social

A combinação destas tecnologias e ferramentas permite-nos compreender e processar melhor grandes quantidades de conteúdo narrativo,Ajuda indiretamente a identificar afirmações infalsificáveis

Somos capazes de analisar várias formas de texto.Seja um tweet ou um comentário do Reddit, usamos a tecnologia da PNL para extrair e compreender as narrativas e temas deste conteúdo.

Em segundo lugar, usamosAlgoritmos de agrupamento e agrupamento . Esses algoritmos nos ajudam a organizar grandes quantidades de conteúdo de mídia social em diferentes temas ou narrativas.

Por exemplo,Podemos encontrar milhares de tweets entre milhões de tweets que são muito semelhantes porque todos abordam a mesma narrativa subjacente.

passarAgrupamento narrativo e agrupamento de asserções , organizamos grandes quantidades de conteúdo em grupos menores, permitindo que os verificadores de fatos os processem com mais eficiência, sem a necessidade de verificar cada item individualmente. Desta forma, mesmo alegações não falsificáveis ​​podem ser identificadas e classificadas através de agrupamentos para facilitar análises e processamento adicionais.

Consideramos duas entradas, digamos, dois tweets, e medimos sua similaridade com base em diferentes aspectos narrativos -Estes podem abranger tópicos como o debate nuclear versus energia verde, ou discussões sobre fórmula infantil versus leite de vaca.

Existem muitos tópicos muito debatidos online, muitas vezes como resultado de campanhas de desinformação Essas atividades podem ser muito vagas. O que estamos tentando entender é como esses diferentes enunciados se manifestam na forma de linguagem ou memes, que podem conter imagens, textos, enunciados em áudio, etc.Parece um conteúdo completamente diferente . Você pode coletar milhões de discussões sobre um tópico em uma plataforma de mídia social, mas todos os dados podem representar apenas algumas dezenas de opiniões. Tentamos compreender esses fenômenos por meio de tecnologias como grandes modelos de linguagem e aprendizado métrico profundo.


Visualização de pares anotados por humanos, a subfigura (a) mostra pares positivos, ou seja, pares narrativos semelhantes ou consistentes anotados por humanos. A subfigura (b) mostra pares negativos, ou seja, pares narrativos diferentes ou inconsistentes rotulados por humanos. Fonte: "Em busca de estrutura em afirmações infalsificáveis"


2. Além do “verdadeiro e falso”

Nem todas as alegações merecem verificação de factos, e nem todas as verificações de factos produzem resultados verdadeiros ou falsos.

Senhorita A: O conjunto de dados MSCOCO que você criou é um dos mais famosos conjuntos de dados de visão computacional em grande escala. Como isso começou?

Sarja: Iniciamos a pesquisa de detecção de objetos há 15 anos, começando com um pequeno conjunto de dados CUB200 contendo mais de 200 espécies de aves. O conjunto de dados COCO foi originalmente um projeto de estágio de verão do meu aluno de doutorado Tsung-Yi Lin na Microsoft Research. Seu mentor na época era outro aluno de doutorado meu, Piotr Dollá. O projeto evoluiu para um consórcio de pesquisadores da academia e da indústria. Eles esperam criar um conjunto de dados que detalhe objetos do cotidiano no ambiente natural e anote com precisão seus nomes e localizações espaciais.

Senhorita A: Você nomeou o conjunto de dados como MSCOCO. Gosto muito de "Coco", e seu nome em inglês também é Coco.

Sarja:Sim, todos nós amamos o nome “COCO”, é divertido e fácil de lembrar.

Senhorita A:Após o surgimento do conjunto de dados MSCOCO, o desenvolvimento do campo da visão computacional foi como andar de foguete.

Sarja:Bem, organizamos cada vez mais comunidades de conhecimento em torno dele, e o COCO tem sido usado por milhões de pessoas.Começamos pequenos e eventualmente desenvolvemos um campo de pesquisa que teve um impacto profundo.

A primeira conferência de visão computacional da qual participei foi a CVPR 1994, também em Seattle. Isso foi há trinta anos e havia cerca de 300 pessoas presentes. Agora, no Seattle CVPR de 2024, há 12.000 pessoas participando da conferência.

Senhorita A:Já se passaram 30 anos, o que impulsiona sua paixão consistente pela visão computacional e pela pesquisa em inteligência artificial?

Sarja: Desde que me lembro, sempre me interessei por padrões e por categorizar coisas. No ensino médio, fiz um projeto de aula sobre classificação de parafusos, porcas e outros fixadores. Enquanto estava na faculdade, me interessei por padrões de áudio, especificamente bioacústica, como sons de pássaros ou baleias.Em termos de imagens, foram as impressões digitais e os rostos que me atraíram.

Eu pesquisei como ler lábios em vídeos. Todos os aspectos deste problema me fascinam: a fusão de áudio e visão, as diferenças entre diferentes alto-falantes e os desafios computacionais. No início da década de 1990, as câmeras digitais estavam apenas sendo lançadas, mas ainda não tinham qualquer forma de compreensão computacional. Hoje, você pode presumir que possui molduras de detecção de rosto em seu visor ou software de álbum de fotos que pode organizar de forma inteligente fotos de toda a sua família, mas isso não existia naquela época.

Senti naquela altura que a procura por esta tecnologia seria muito grande e, ao mesmo tempo,Também gosto da matemática por trás da tecnologia . Eu gostava da tecnologia usada nessas áreas, mas não queria me formar em matemática ou física. Como usar métodos matemáticos complexos para resolver problemas de processamento de som, vídeo e imagem.

Sempre sinto que minha missão neste mundo é fazer esse tipo de trabalho.

Senhorita A:Que partilha acadêmica você fez na CVPR este ano?

Sarja: Minha equipe apresentou vários artigos na conferência principal do CVPR e eu também os compartilhei em dois seminários. Um dos relatórios é sobre a história da pesquisa em visão computacional, principalmente para ajudar jovens estudiosos a compreender a tecnologia clássica de visão computacional, ou seja, a tecnologia antes do aprendizado profundo e dos transformadores. Também apresentei o projeto Visipedia, que começou com o lançamento de uma versão expandida do conjunto de dados CUB200 em 2011. Atualmente, o conteúdo de pesquisa da Visipedia expandiu-se para dezenas de milhares de plantas, animais e fungos, fornecendo uma importante base de pesquisa para o reconhecimento de objetos na natureza.

Outro relatório é o que quero focar na partilha da entrevista de hoje, que está relacionado com narrativa, opinião pública e informações falsas, especialmente no contexto do desenvolvimento das redes sociais.

Senhorita A:Que inovações seu trabalho trouxe para a área?

Serge: O problema clássico no mundo da desinformação e das redes sociais é a verificação de fatos Por exemplo, a Universidade de Copenhague tem muitos trabalhos relacionados. A abordagem geral é que, para certas observações que precisam ser verificadas, utilizamos sistemas de inteligência artificial para procurar fatos relevantes e prever uma pontuação de autenticidade entre 0 e 1 com base nos fatos.

Senhorita A:Quais são os desafios desta abordagem?

Sarja:Não há muitos problemas com este método em si, o desafio vem do próprio problema.Nem todas as alegações merecem verificação de factos, e nem todas as verificações de factos produzem resultados verdadeiros ou falsos. Por exemplo, “Os pandas são o tesouro nacional da China” é uma afirmação que pode ser usada para treinar modelos e verificar a autenticidade através de uma base de conhecimento estruturada e grandes quantidades de dados. O mesmo não acontece com a frase “mudança para a Califórnia”.

Senhorita A:Então você vê potencial de pesquisa em afirmações como esta?

Serge: Este último tipo de afirmação não foi extensivamente estudado, mas é uma questão igualmente importante. Essas afirmações podem não ter uma definição estrita de verdadeiro/falso, mas geram muita discussão nas redes sociais. Este desafio não existia numa época em que apenas os meios de comunicação precisavam de ser verificados. No entanto, nas redes sociais altamente desenvolvidas de hoje, um tipo de tema que desencadeia discussões acaloradas, é difícil de caracterizar cientificamente ou não pode ser falsificado, tornou-se muito comum. digno de pesquisa.

Senhorita A:Você pode me contar um caso que teve um impacto real ou até mesmo causou um conflito sério?

Sarja: Que bom que você fez essa pergunta, vamos dar um exemplo interessante. Depois de lavar as mãos em um banheiro público, você tem duas opções para secá-las. Não tenho certeza de qual método é comumente usado na China; na Europa, você pode retirar toalhas de papel ou usar um secador de ar quente.

Senhorita A:Esses dois métodos também são mais comuns na China.

Sarja: Os fabricantes de secadores e toalhas de papel podem ganhar muito dinheiro assinando contratos com qualquer rede de hotéis, e todo o mercado provavelmente gerará bilhões de dólares em receitas. Mas muitas pessoas na Europa têm agora opiniões muito fortes sobre a diferença entre os dois métodos. Muitas pessoas dizem que um destes métodos poderia espalhar doenças, enquanto outros dizem que usar muita eletricidade ou fabricar papel causaria danos ambientais ao desperdiçar árvores. A maioria das pessoas que defendem estas opiniões não são especialistas em saúde pública ou ambientais.

Senhorita A:As próprias afirmações são verdadeiras?

Serge: Na verdade, não nos importamos com a autenticidade das nossas declarações, porque muitos tópicos nas redes sociais não podem ser estritamente comprovados ou falsificados. Mas o tema é levantado porque um pequeno grupo de pessoas quer convencer as massas de que uma forma é melhor que outra. Eles provavelmente criaram centenas de milhares de conteúdo gerado por bots. Se você pesquisar discussões sobre toalhas de papel e secadores de ar nas redes sociais hoje em dia, encontrará milhões de comentários. Nosso estudo não se concentra em comparar rigorosamente os prós e os contras das duas abordagens e em apresentar resultados de verificação de fatos.Estamos mais preocupados em detectar esses problemas projetados.

3. Conjunto de dados “COCO” nas redes sociais

Evite tomar decisões precipitadas.

Sra. A: Sua pesquisa abriu outra dimensão.A verificação tradicional de fatos concentra-se na veracidade da semântica, enquanto sua pesquisa se concentra na veracidade de declarações ou afirmações.claropragmáticos——O objetivo da previsão não se limita a ser verdade ou não, mas se estende a discussões temáticas criadas por alguns usuários ou por um grande número de robôs nas redes sociais para atingir fins específicos.Você sabe o que este estudo significa?

Sarja: Sim, estamos criando algo completamente novo. A maioria dos estudos relevantes que conhecemos concentram-se apenas na verificação de fatos. Mas estamos tentando usar tecnologia de linguagem natural relacionada a tópicos para agrupar e agrupar discussões nas redes sociais para ajudar indivíduos, empresas e formuladores de estratégias a entender o que está acontecendo nas redes sociais.Não fazemos julgamentos de valor sobre esses temas e conteúdos de discussão, mas apenas apresentamos de forma objetiva a forma como cada questão é levantada.

Senhorita A: Para atingir esse objetivo, primeiro precisamos de um conjunto de dados. Construir este conjunto de dados deve ser um grande desafio. Quando você foi o pioneiro na pesquisa de visão computacional, expandiu de um conjunto de dados de pequenos pássaros para o COCO. Como você abordou desta vez?

Sarja: Esse tipo de comportamento nas redes sociais costuma ser caracterizado por uma coisa. Pode haver um milhão de tweets sobre um tópico, com aparentemente milhares de contas participando da discussão.Mas através da análise, podemos descobrir que cem mil desses tweets publicaram exactamente a mesma coisa, com narrativas muito semelhantes ou até idênticas. Ainda assim, tenha em mente que isso não significa que essas discussões estejam certas ou erradas. Permitimos que os usuários vejam clusters e agrupamentos de diferentes declarações, facilitando que verificadores de fatos e analistas de redes sociais processem e entendam grandes quantidades de conteúdo sem ter que lidar com um fluxo repentino de milhões de tweets.

Senhorita A:Este sistema pode lidar com vários tópicos polêmicos nas redes sociais em tempo real?

Sarja:Acho que pode, e espero que sim. Suponhamos que no Mediterrâneo se encontrem dois navios, um russo e um americano. Começam as discussões nas redes sociais e nasce uma narrativa. Novas informações aparecem a cada poucas horas, incluindo uma declaração de um capitão ou uma gravação de celular. Neste caso, algumas narrativas e questões ganham atenção enquanto outras podem tornar-se irrelevantes.

Senhorita A: Você esperatempo realPegue problemas

Sarja:e outras informações.Para ajudar os diplomatas profissionais, gostaríamos de criar umpainel(Painel) , fornece informações abrangentes e relevantes e também coloca esses eventos no contexto mundial.Este sistema podeEvite que as pessoas tomem decisões precipitadas . Gostaria de salientar que o próprio sistema não decide qual lado está certo, mas antes organiza a informação de forma abrangente.

Senhorita A:Quais pontos problemáticos precisam ser abordados para alcançar uma funcionalidade confiável?

Serge: Existem desafios tradicionais e novos . Os desafios tradicionais incluem o impacto do idioma, da cultura e do preconceito emocional.

por exemplo, "A Pequena Sereia" e "O Patinho Feio" são obras de escritores dinamarqueses, mas as versões das histórias nos filmes da Disney foram ajustadas para se adequar à cultura americana. Devido ao maior domínio da narrativa americana sobre a narrativa dinamarquesa nas redes sociais, a versão original da história de Andersen é quase desconhecida entre os internautas de muitos outros países.

No processo de anotação de dados, especialmente a anotação de dados de redes sociais, será afetado pelo idioma e pela cultura. Outro exemplo é que a análise de sentimento já é uma parte importante da verificação de fatos, e o próprio modelo de previsão de sentimento pode ter muitos preconceitos e estereótipos no treinamento.O treinamento do modelo de IA é um processo de entrada e saída de lixo. É difícil resolver os problemas causados ​​pelos dados de treinamento. Portanto, devemos entender quais dados de treinamento o modelo usa.Podemos dizer que a verificação de factos sem envolvimento humano é inexistente (não confiável).

Senhorita A:Quais são os novos desafios?

Serge: O conteúdo falso gerado por modelos de linguagem é um novo desafio que enfrentamos. Contas falsas anteriores de mídia social geralmente tinham padrões muito simples de seguir. Mas com GPT e modelos de geração de imagens, os criadores de contas falsas podem gerar perfis falsos mais complexos e naturais e, em seguida, contas falsas de mídia social que parecem reais. Essas contas não são facilmente encontradas pelos modelos tradicionais de identificação de contas falsas. Estes modelos generativos de IA também trazem desafios correspondentes às tarefas tradicionais de verificação de factos. portanto,A IA generativa cria e identifica informações falsas, o que será o jogo de gato e rato desta era.

4. Futuro da IA

Eles (OpenAI) podem não conhecer nossos planos ainda.

Senhorita A:Parece que estes desafios não podem ser resolvidos simplesmente através de modelos, mas podem atingir a dimensão da cooperação entre a IA e os humanos.vocêparecerSempre descubra novos problemas em novas dimensões e depois resolva-os de uma perspectiva simples.

Sarja:Sim.Nossa nova ideia pode ser comparada à Wikipedia. Antigamente, as pessoas pensavam que o mesmo nó da Wikipedia só precisava de páginas em idiomas diferentes com a mesma semântica. A realidade é que não é apenas o idioma que é diferente.

Língua, cultura, valores, tradições, todos os fatores estão misturados em diferentes páginas da mesma entrada. A energia atómica e os combustíveis fósseis, por exemplo, são abordados de forma muito diferente em diferentes línguas e em diferentes partes do mundo. Portanto, isso nos lembra que o sistema de IA que estamos tentando construir não é puramente automatizado, nem é um modelo independente. Este é um sistema envolvido por seres humanos, o que significa que são necessárias muitas comunidades humanas diferentes em todo o mundo para rotular e organizar os dados e contabilizar todas as diferentes peças.Este é um problema grande e profundo porque o preconceito sempre existirá.

Senhorita A:Assim como o MSCOCO, organizar dados tão abrangentes e justos quanto possível é em si a ambição desta investigação.

Sarja: Este é o processo de organização de todos os diferentes tipos de comunidades. Em diferentes partes do mundo, pessoas de diferentes idades estudam diferentes especialidades, como literatura, história, ciências, etc., e cada área tem sua própria história. Para que a pesquisa que descrevo tenha sucesso,Precisamos de muitas anotações que entendam uma variedade de tópicosPor Eles não precisam ser especialistas, mas precisam ter algum conhecimento do conteúdo a ser marcado, como energia nuclear, empreendedorismo ou criptomoeda, para conhecerem as semelhanças nas narrativas e nas questões. Portanto, o maior desafio é a organização da comunidade, não as instalações básicas de computação e armazenamento de IA.

Senhorita A:Sam Altman ou Yann Lecun comentaram o seu pensamento?

Serge: Talvez eles ainda não conheçam nossos planos.

Senhorita A:Parece que estou testemunhando as primeiras etapas de uma iniciativa:Descubra problemas numa dimensão superior e encontre o ponto de entrada mais direto.

Serge: Se desenvolvermos esta infraestrutura para detecção de problemas, como muitas tecnologias, ela poderá ser usada para o bem ou para o mal.Portanto, ao contrário de muitas IA comerciais,Tentamos desenvolver sistemas de gestão abertos, transparentes e auditáveis . Portanto, teremos uma base de conhecimento totalmente transparente, e os usuários poderão ver o histórico de edição dos dados, inclusive quando os dados foram incluídos e por quais anotadores foram anotados.

Senhorita A:Como garantir a precisão e objetividade dos dados?

Sarja:A resposta simples é:não podemos garantir

Mas o melhor que podemos fazer é criar um sistema que atraia dezenas de milhares de pessoas interessadas em diferentes áreas de discussão para anotar o sistema. Ter o maior número possível de anotadores pode nos ajudar a trazer objetividade estatística. A Wikipédia também possui mecanismos projetados para transparência e responsabilização, e faremos o mesmo.

Senhorita A:Como esta pesquisa impactará os formuladores de políticas, educadores e tecnólogos?

Serge: Pense no que estamos fazendo como um complemento ao raciocínio lógico ou factual.

Digamos que uma empresa queira melhorar a sua diversidade, equidade e inclusão. Assim, o conselho de administração realizou uma reunião para discutir a contratação de mais mulheres ou minorias. Esse tipo de discussão é comum em muitas empresas, e em uma universidade, por exemplo, pode não haver muitas mulheres estudando engenharia elétrica, e o departamento quer tomar medidas para mudar isso. Nessas reuniões pode haver muita discussão que não é sustentada por conhecimento ou informação.

Algumas pessoas expressam opiniões tendenciosas de que as mulheres não são boas em matemática. O que é necessário é um sistema que possa ajudar o chefe do departamento, o CEO ou o professor que precisa liderar essas discussões, e que eles possam extrair um conjunto de narrativas do sistema para estruturar a discussão. Além disso, quando o sistema começa a funcionar, ele indexa e analisa as declarações em narrativas pré-existentes. Dessa forma, um CEO, professor ou facilitador de reuniões pode evitar conversas confusas ou de baixa qualidade, ter uma estrutura e sistema de classificação eficazes, orientar as discussões e evitar conversas redundantes.

Senhorita A:Para futuras narrativas de mídia social e análise de questões, quais você acha que são as possíveis direções de pesquisa para o desenvolvimento tecnológico?

Sarja: Diferentes campos têm seus próprios desafios únicos. Alguns deles são problemas clássicos, como processar grandes quantidades de dados e como rotulá-los, como mitigar preconceitos, etc. Mas também enfrentamos grandes desafios quando se trata de visualização.

Acabamos de mencionar as diferenças enfrentadas por diferentes línguas e culturas. Cada tópico específico tem muitas perspectivas diferentes, e diferentes anotadores fornecerão anotações diferentes devido às suas próprias tendências. Do ponto de vista da teoria da informação, a tentativa de comprimir estes diversos relatos pode resultar na perda ou corrupção de informações. Esses tipos de perguntas ocorrerão ao longo do projeto e as encontraremos com frequência.

Senhorita A: Na sua opinião, quais os últimos desenvolvimentos na tecnologia visual que terão um impacto profundo no futuro?

Sarja: Agora, mais e mais pesquisadores estão começando a prestar atenção aos dados multimodais, processando vários tipos de dados, como imagens, texto e áudio, ao mesmo tempo em um modelo. Este método geralmente usa arquiteturas de modelo como o Transformer para resolver problemas práticos complexos. . Acredito que esta tendência continuará, e os futuros recém-chegados ao campo da inteligência artificial acharão mais natural dominar múltiplas competências profissionais ao mesmo tempo do que aprofundar-se apenas numa área, como o processamento de linguagem natural ou a visão computacional.

Pessoalmente, penso que embora algumas pessoas afirmem que a inteligência artificial substituirá completamente os médicos, esta afirmação é exagerada. Mas estou convencido de que em áreas como radiologia, dermatologia e histopatologia, os sistemas assistidos por IA serão difundidos e beneficiarão a todos.

Quanto aos carros autónomos, embora tenha havido previsões no passado de que os avanços na tecnologia de visão e na inteligência artificial permitirão a adopção generalizada de carros autónomos, penso que é pouco provável que isso aconteça. A menos que o governo tome medidas para restringir a circulação de carros convencionais em determinadas faixas ou proibi-los totalmente, é altamente improvável que os carros autônomos se tornem a norma nos Estados Unidos.

Senhorita A : Gosto do seu artigo. Meus pensamentos são semelhantes.O desenvolvimento tecnológico está simultaneamente a desbloquear novas dimensões cognitivas. A metodologia mais valiosa é aquela que tem um ponto de entrada minimalista, mas que pode irradiar a situação global.

Sarja:Em qual metodologia você está mais interessado?

Senhorita A:Dê um pequeno exemplo.Ao longo do caminho da falsificabilidade, a ciência embarcará no caminho iterativo da negação da negação... regressando à estrutura da revolução científica com a qual todos estamos familiarizados.

*Hang Zhou também contribuiu para este artigo.

Como este artigo envolve discussões acadêmicas, aqui está uma breve introdução ao autor:

  • Zhang Yijia, o fundador da Jiazi Guangnian, formou-se na Escola de Ciências Matemáticas da Universidade de Pequim em 2013 e recebeu um diploma duplo em economia do Instituto Nacional de Desenvolvimento. Ganhou uma medalha de ouro na Olimpíada Chinesa de Matemática e foi selecionado para o; equipe nacional de treinamento; seus interesses de pesquisa são matemática financeira e teoria dos jogos, e ele atua como diretor simultâneo da Escola de Ciências Matemáticas da Universidade de Pequim.

  • Zhou Hang, responsável pelo Jiazi Brain, formou-se na Escola de Ciências Matemáticas da Universidade de Pequim em 2019. Sua direção de pesquisa é otimização esparsa e otimização não convexa.


*Referências
  • Procurando por Estrutura em Alegações Não Falsificáveis.pdf

  • 978-3-319-10602-1_48.pdf "Microsoft COCO: Common Objects in Context" Conjunto de dados MSCOCO: o artigo mais citado de Serge.

  • Thomas Samuel Kuhn "A Estrutura das Revoluções Científicas"


Siga a conta pública “Jiazi Guangnian” e responda “pode ser falsificado” em segundo plano para obter as informações mencionadas no artigo"Em busca de estrutura em afirmações infalsificáveis"eConjunto de dados MSCOCODois papéis.

|Senhorita ARevisão da série de diálogos|