Conversación de Miss A con Serge Belongie: Darte una “bala” falsificable

Conversación de la señorita A con Serge Belongie: darle una “bala” falsificable |

2024-07-31

La falsabilidad es tanto un ángel como un demonio; en última instancia, la falsabilidad es un apretón de manos que alinea el mundo.

Autor｜Zhang Yijia Sukhoi‍‍

Hace diez años, un académico europeo me dijo: "Hay no menos de cien caminos subdivididos en inteligencia artificial, y Estados Unidos definirá uno o dos caminos populares. , y luego los empresarios e inversores globales se apresuraron a ponerse al día con estas dos vías. "

En los siguientes diez años, la tendencia de la inteligencia artificial ha cambiado, y la inteligencia artificial ha pasado del no consenso al pequeño consenso, y del pequeño consenso al gran consenso, pero esta frase nunca saltó a la vista.

Esta conversación con Serge comenzó con la revisión de un artículo que coescribió hace dos años."Búsqueda de estructura en afirmaciones infalsificables" interés de. Es una pena que este artículo casi no haya recibido atención hasta ahora, Google Scholar.Solo citado 2 veces。

Esto es sorprendente.

"Jiazi Guangnian" cree que,este ensayoextremadamente subestimado。

Razón 1: El problema que enfrenta este artículo es extremadamente crítico (la narrativa subyacente de datos no falsificables en las redes sociales);

Segunda razón: este artículo proporciona importantes innovaciones teóricas (método de anotación ternaria y conjunto SNaCK);

Razón tres: este artículo brinda resultados prácticos de ingeniería (construcción de conjuntos de datos y comparación experimental detallada).

Autores del artículo Peter Ebert Christensen, Frederik Warburg, Menglin Jia y Serge Belongie;

Este artículo no es difícil de entender. Empezamos con.FalsificabilidadEl concepto comienza a introducirse.

La falsabilidad también se llama refutación.Las filosofías de la ciencia a menudo utilizan estrictasmétodo de falsificaciónPara determinar si una teoría es científica, es decir"Estas conclusiones deben permitirlógicaLa existencia de contraejemplos。

Karl Popper propuso en 1934 que si una teoría o hipótesis puede contradecirse lógicamente mediante pruebas empíricas de técnicas existentes, entonces esFalsificable de. Y si una expresión es tan impecable que el mundo no tiene lugar para comentarios, a menudo sólo mantendrá a todos a distancia, lo que no ayuda a promover el progreso científico.

Los problemas que los científicos pueden o deben estudiar deben estar más o menos cerrados, permitiendo a otros la oportunidad de atacarlos o incluso revertirlos. El propósito de la falsabilidad es hacer que la teoría sea predictiva y comprobable.por lo tanto útil en la práctica。

El artículo de Serge"Búsqueda de estructura en afirmaciones infalsificables"discutidoLa complejidad de interpretar afirmaciones infalsables en las redes sociales。

La idea principal del artículo:

Las plataformas de redes sociales están inundadas de publicaciones y comentarios, y muchas afirmaciones no pueden refutarse. Sin embargo,Herramientas insuficientes de verificación de datos, falta de estructura en los debates en las redes sociales, dificultades para identificar narrativas y falta de calidad en los debates públicos.etc., causando muchos problemas.

Un artículo examina cómo identificar y comprender a quienes están en las redes socialesafirmaciones infalsables, y resumir estas afirmaciones comoUn número limitado de narrativas., para facilitar mejor la discusión y el debate en las redes sociales.

Curiosamente, el autor construyó una herramienta llamadaPAPELEROUn conjunto de datos que contiene el debate sobre los métodos de secado de manos en baños públicos (toallas de papel versus secadores de aire), 600 extractos de textos breves, 31 narrativas y 4 supercategorías para comprender y descubrir narrativas dominantes en debates en línea.

Este documento presentaUn nuevo enfoque que va más allá de las capacidades de las tecnologías de verificación de datos existentes, proporciona una contribución importante a la gestión y comprensión del impacto de afirmaciones infalsables en entornos de comunicación digital: utiliza este proceso para descubrir narrativas dominantes y muestra que este proceso supera a los modelos recientes de transformación a gran escala y al modelo de sujetos no supervisados de última generación. .

a través de experimentos,El autor encontróUtilice un conversor de oraciones moderno(como el modelo T5)Incrustación de oración iniciales la llave .También descubrieron que la estrategia de muestreo es crucial para generar incrustaciones de alta calidad, especialmenteEstrategia "Distancia-Rnd"Mejor actuacion.

Los resultados experimentales muestran que combinar anotaciones humanastrillizospuede revelar cumplimientonarrativa cristalizadainteresante agrupamiento.

Solo 2 citas

"Jiazi Guangnian" cree que las posibles razones por las que este documento no ha recibido atención en la industria hasta ahora incluyen, entre otras:

(1) El análisis teórico es relativamente débil y el análisis de los resultados experimentales sigue siendo cualitativo (el texto de 11 páginas sólo tiene media página de fórmulas);

(2) Casi no hay introducción a varios algoritmos utilizados para comparar;

(3) Es posible que aún no exista un conjunto de datos unificados en la comunidad académica en este campo, lo que resultará en que no haya "fuera del círculo" dentro de la comunidad académica;

(4) El autor enfatizó la importancia de T5, pero no describió claramente la superioridad de su algoritmo.

Intercambio académico de Serge Belongie en CVPR2024, fuente: Fotografiado por "Jiazi Guangnian"

Aunque los artículos mencionados anteriormente son poco conocidos, el propio Serge es un científico muy influyente en el campo de la visión por computadora y el aprendizaje automático. Estudia principalmente el reconocimiento de objetos y la segmentación de imágenes. Sus diversos artículos han sido citados un total de 1.789,71 millones de veces.

Serge Belongie es profesor de informática en la Universidad de Copenhague y director del Centro Pionero Danés para la Inteligencia Artificial. Anteriormente, se desempeñó como decano asociado y profesor Andrew H. y Ann R. Tisch de Ciencias de la Computación en Cornell Tech.

El más digno de presentación esSerge es el autor principal de MSCOCO.。

El conjunto de datos MSCOCO es uno de los conjuntos de datos a gran escala más famosos para visión por computadora.En 2000, Serge y Jitendra Malik (ahora profesor de informática en la Universidad de California, Berkeley, y famoso académico en el campo de la visión por computadora)propusieron conjuntamente el concepto de “Contexto de forma”,Es un método de descripción de características de forma ampliamente utilizado en los campos de la visión por computadora y el reconocimiento de objetos.

En 2004, Serge fue nombrado Joven Innovador Tecnológico menor de 35 años por MIT Technology Review; en 2007, él y Jitendra Malik recibieron una mención honorífica del Premio Marr; en 2015, Serge recibió el Premio ICCV Helmholtz, este premio se otorga principalmente a autores; de artículos que han hecho contribuciones fundamentales en el campo de la visión por computadora.

Serge también es cofundador de varias empresas, entre ellas Digital Persona (fusionada con CrossMatch en 2014), CarCode (adquirida por Transport Data Systems), Anchovi Labs (adquirida por Dropbox en 2012) y Orpix.

Actualmente, el equipo SergeAbriendo nuevas dimensiones en el análisis de redes sociales——A partir de una gran cantidad de comentarios triviales a los que no se les ha prestado atención antes y que no son adecuados para la verificación de hechos tradicional,Analizar la configuración de problemas y“manipulación narrativa”。

Esto es de especial importancia en este momento:

Después de la Guerra Mundial Antifascista, sin importar si se alternaron avances tecnológicos o cuellos de botella, todos experimentaron altibajos en el panorama histórico a medida que pasaba el tiempo. Al igual que "A lo largo del río durante el Festival Qingming" que se desarrolló en el sistema de coordenadas espacio-temporales, está lleno de miles de escenas y apariciones de seres antiguos y modernos.

La siguiente es la conversación de la señorita A con Serge.

Siga la cuenta pública "Jiazi Guangnian" y responda "puede ser falsificado" en segundo plano para obtener la información mencionada en el artículo."Búsqueda de estructura en afirmaciones infalsificables"yConjunto de datos MSCOCODos papeles.

1. Se cuestiona la falsabilidad

En la práctica, los investigadores a menudo se ven influenciados por narrativas que les gustan o no, algo similar a los temas de tendencia en Instagram.

Fallar un: "Si no puede ser refutado, no puede ser científico" se ha convertido en un consenso general en la comunidad científica. Pero muchos filósofos han cuestionado esto, argumentando que el principio de falsabilidad puede llevar a debates científicos interminables.¿Es la falsabilidad una condición necesaria para el progreso científico?

Sarga：Según la opinión popular, una teoría científica debe ser refutable.

Fallar un:Ésta es la opinión popular, pero ¿es la falsabilidad el paradigma predominante?

Sarga: La literatura sobre aprendizaje automático se ha disparado en los últimos 15 años, con una gran cantidad de artículos publicados y citados todos los días. En estos artículos, las secciones de trabajos relacionados a menudo citan otra literatura, pero las citas no son necesariamente la literatura más relevante para su trabajo. Esto se debe a que la cantidad de literatura es enorme;En realidad, los investigadores están respondiendo a la narrativa dominante en este campo.

A menudo nos consideramos científicos en la tradición de Karl Popper, sujetos sólo a afirmaciones falsables. Sin embargo, también hay tendencias en la investigación científica, como tecnologías como las redes generativas adversarias generativas y los transformadores. Aunque estos artículos pretenden seguir la tradición científica,Los investigadores a menudo se ven influenciados en la práctica por narrativas que les gustan o no les gustan.——Algo así como temas de tendencia en Instagram。

Fallar un:¿Quiere decir que desde el aprendizaje automático los científicos han comenzado a desviarse de la norma de falsabilidad?

Sarga:Los científicos a menudo afirman ser inmunes a estas influencias y se consideran objetivos, pero después de todo son seres humanos y se dejarán llevar por estas opiniones populares.Esto es algo que consideramos poco científico y más bien una intuición y una opinión.

Fallar un:¿Cómo se definen las afirmaciones infalsables en las redes sociales?

Sarga: Primero debemos discutir la literatura sobre verificación de hechos. La profesora Isabelle Augenstein de la Universidad de Copenhague, por ejemplo, ha desarrollado un método que comienza con la determinación del valor de verificación de una declaración. Comprobaremos una declaración,y determinar su valor de verificación en el rango de 0 a 1。

Por ejemplo, la afirmación de que la capital de California es Sacramento es ideal para comprobar la gramática y la sintaxis porque se puede encontrar en múltiples bases de conocimiento estructuradas. Podríamos examinar una afirmación como: "La capital de California es Sacramento" y darle una puntuación de comprobabilidad probablemente cercana a 0,99. Luego lo enviamos a una base de conocimiento estructurada para confirmar la respuesta. Este sistema de comprobabilidad basado en aprendizaje profundo procesa grandes cantidades de reclamos y datos de capacitación para evaluar el valor de verificación de diferentes reclamos.

Pero algunas declaraciones,Por ejemplo, "Inmigrar a California es malo" refleja opiniones más personales y no es adecuado para verificar hechos.Por el contrario, afirmaciones como "Desde 2020, el número de inmigrantes en California ha seguido aumentando" tienen un alto valor de verificación.

entoncesPrestamos especial atención a las afirmaciones que son difíciles de verificar.——Estas afirmaciones no pueden verificarse directamente, pero la discusión que han provocado en las redes sociales es significativa.。Varias comprobaciones pueden ayudarnos a tomar mejores decisiones.

Fallar un:En su investigación, ¿qué técnicas o herramientas específicas se utilizan para identificar y analizar afirmaciones infalsables?

Sarga:Utilizamos técnicas de procesamiento del lenguaje natural (NLP), algoritmos de agrupación y clustering y métodos de aprendizaje automático.

nuestro objetivo esCreación de un Fondo de Información Narrativa Global (GNIF), para investigar y organizar el contenido de las redes sociales.。

La combinación de estas tecnologías y herramientas nos permite comprender y procesar mejor grandes cantidades de contenido narrativo,Ayuda indirectamente a identificar afirmaciones infalsables。

Podemos analizar varias formas de texto.Ya sea un tweet o un comentario de Reddit, utilizamos tecnología de PNL para extraer y comprender las narrativas y los temas de este contenido.

En segundo lugar, utilizamosAlgoritmos de agrupación y clustering . Estos algoritmos nos ayudan a organizar grandes cantidades de contenido de redes sociales en diferentes temas o narrativas.

Por ejemplo,Podemos encontrar miles de tweets entre millones de tweets que son muy similares porque todos abordan la misma narrativa subyacente.

aprobarAgrupación narrativa y agrupación de afirmaciones. , organizamos grandes cantidades de contenido en grupos más pequeños, lo que permite a los verificadores procesarlo de manera más eficiente sin tener que verificar cada elemento individualmente. De esta manera, incluso las afirmaciones infalsables pueden identificarse y clasificarse mediante agrupaciones y agrupaciones para facilitar un mayor análisis y procesamiento.

Consideramos dos entradas, digamos dos tweets, y medimos su similitud en función de diferentes aspectos narrativos:Estos podrían cubrir temas como el debate sobre la energía nuclear versus la energía verde, o discusiones sobre la fórmula infantil versus la leche de vaca.

Hay muchos temas acaloradamente debatidos en línea, a menudo como resultado de campañas de desinformación.。 Estas actividades pueden ser muy vagas. Lo que intentamos entender es cómo estas diferentes declaraciones se manifiestan en forma de lenguaje o memes, que pueden contener imágenes, texto, declaraciones de audio, etc.Parece un contenido completamente diferente. . Puede recopilar millones de discusiones sobre un tema en una plataforma de redes sociales, pero es posible que todos los datos solo representen unas pocas docenas de opiniones. Intentamos comprender estos fenómenos a través de tecnologías como grandes modelos de lenguaje y aprendizaje métrico profundo.

Visualización de pares anotados por humanos, la subfigura (a) muestra pares positivos, es decir, pares narrativos similares o consistentes anotados por humanos. La subfigura (b) muestra pares negativos, es decir, pares narrativos diferentes o inconsistentes etiquetados por humanos. Fuente: "Búsqueda de estructura en afirmaciones infalsificables"

2. Más allá de “verdadero y falso”

No todas las afirmaciones merecen una verificación de los hechos, y no todas las verificaciones de los hechos arrojan resultados verdaderos o falsos.

Fallar un: El conjunto de datos MSCOCO que creó es uno de los conjuntos de datos de visión por computadora a gran escala más famosos. ¿Cómo comenzó?

Sarga: Comenzamos la investigación de detección de objetos hace 15 años, comenzando con un pequeño conjunto de datos CUB200 que contenía más de 200 especies de aves. El conjunto de datos COCO fue originalmente un proyecto de pasantía de verano de mi estudiante de doctorado Tsung-Yi Lin en Microsoft Research. Su mentor en ese momento era otro estudiante de doctorado mío, Piotr Dollá. El proyecto evolucionó hasta convertirse en un consorcio de investigadores del mundo académico y de la industria. Esperan crear un conjunto de datos que detalle objetos cotidianos en el entorno natural y anote con precisión sus nombres y ubicaciones espaciales.

Fallar un: Nombró el conjunto de datos MSCOCO. Me gusta mucho "Coco", y su nombre en inglés también es Coco.

Sarga:Sí, a todos nos encanta el nombre "COCO", es divertido y fácil de recordar.

Fallar un:Después de la aparición del conjunto de datos MSCOCO, el desarrollo del campo de la visión por computadora fue como viajar en un cohete.

Sarga:Bueno, hemos organizado cada vez más comunidades de conocimiento en torno a él y millones de personas han utilizado COCO.Empezamos poco a poco y finalmente desarrollamos un campo de investigación que ha tenido un profundo impacto.

La primera conferencia sobre visión por computadora a la que asistí fue la CVPR 1994, también en Seattle. Eso fue hace treinta años y asistieron unas 300 personas. Ahora, en el CVPR de Seattle de 2024, hay 12.000 personas que asisten a la conferencia.

Fallar un:Han pasado 30 años, ¿qué impulsa su constante pasión por la investigación en visión por computadora e inteligencia artificial?

Sarga: Desde que tengo uso de razón, me han interesado los patrones y la categorización de cosas. En la escuela secundaria hice un proyecto de clase sobre la clasificación de tornillos, pernos y otros sujetadores. Mientras estaba en la universidad me interesé por los patrones de audio, específicamente la bioacústica, como los sonidos de los pájaros o las ballenas.En cuanto a las imágenes, fueron las huellas dactilares y los rostros lo que me atrajo.

He investigado cómo leer los labios en videos. Todos los aspectos de este problema me fascinan: la fusión de audio y visión, las diferencias entre diferentes hablantes y los desafíos computacionales. A principios de la década de 1990, las cámaras digitales recién estaban apareciendo, pero aún no tenían ningún tipo de comprensión computacional. Hoy en día, puede dar por sentado que tiene marcos de detección de rostros en su visor o que tiene un software de álbum de fotos que puede organizar de manera inteligente las fotos de toda su familia, pero eso no existía en ese entonces.

Sentí en ese momento que la demanda de esta tecnología sería muy grande y al mismo tiempoTambién me gustan las matemáticas detrás de la tecnología. . Me gustaba la tecnología utilizada en estos campos, pero no quería especializarme en matemáticas o física. Como utilizar métodos matemáticos complejos para resolver problemas de procesamiento de sonido, vídeo e imágenes.

Siempre siento que mi misión en este mundo es hacer este tipo de trabajo.

Fallar un:¿Qué intercambio académico hiciste en CVPR este año?

Sarga: Mi equipo presentó varios artículos en la conferencia principal de CVPR y yo también los compartí en dos seminarios. Uno de los informes trata sobre la historia de la investigación de la visión por computadora, principalmente para ayudar a los jóvenes académicos a comprender la tecnología clásica de la visión por computadora, es decir, la tecnología anterior al aprendizaje profundo y los transformadores. También presenté el proyecto Visipedia, que comenzó con una versión ampliada del conjunto de datos CUB200 lanzado en 2011. En la actualidad, el contenido de investigación de Visipedia se ha ampliado a decenas de miles de plantas, animales y hongos, proporcionando una importante base de investigación para el reconocimiento de objetos en la naturaleza.

Otro informe es el que quiero centrarme en compartir en la entrevista de hoy, que está relacionado con la narrativa, la opinión pública y la información falsa, especialmente en el contexto del desarrollo de las redes sociales.

Fallar un:¿Qué innovaciones ha aportado su trabajo al campo?

Serge: El problema clásico en el mundo de la desinformación y las redes sociales es la verificación de datos。 Por ejemplo, la Universidad de Copenhague tiene muchos trabajos relacionados. El enfoque general es que, para ciertos comentarios que deben verificarse, utilizamos sistemas de inteligencia artificial para buscar hechos relevantes y predecir una puntuación de autenticidad entre 0 y 1 en función de los hechos.

Fallar un:¿Cuáles son los desafíos con este enfoque?

Sarga:No hay mucho problema con este método en sí, el desafío proviene del problema mismo.No todas las afirmaciones merecen una verificación de los hechos, y no todas las verificaciones de los hechos arrojan resultados verdaderos o falsos. Por ejemplo, "Los pandas son el tesoro nacional de China" es una afirmación que se puede utilizar para entrenar modelos y verificar la autenticidad a través de una base de conocimientos estructurada y grandes cantidades de datos. No ocurre lo mismo con la frase "mudarse a California".

Fallar un:¿Ve entonces potencial de investigación en declaraciones como ésta?

Serge: Este último tipo de afirmación no se ha estudiado exhaustivamente, pero es una cuestión igualmente importante. Es posible que estas afirmaciones no tengan una definición estricta de verdadero/falso, pero generan mucha discusión en las redes sociales. Este desafío no existía en la época en la que sólo era necesario verificar los datos de los medios de comunicación. Sin embargo, en las redes sociales altamente desarrolladas de hoy, un tipo de tema que desencadena discusiones acaloradas, es difícil de caracterizar científicamente o no puede ser falsificado se ha vuelto muy difícil. digno de investigación.

Fallar un:¿Puede darme algún caso que haya tenido un impacto real o incluso haya causado un conflicto grave?

Sarga: Me alegra que hayas hecho esta pregunta, demos un ejemplo interesante. Después de lavarte las manos en un baño público, tienes dos opciones para secarlas. No estoy seguro de qué método se usa comúnmente en China; en Europa puedes sacar toallas de papel o usar un secador de aire caliente.

Fallar un:Estos dos métodos también son los más comunes en China.

Sarga: Los fabricantes de secadoras y toallas de papel pueden ganar mucho dinero firmando contratos con cualquier cadena hotelera, y todo el mercado probablemente generará miles de millones de dólares en ingresos. Pero mucha gente en Europa tiene ahora opiniones muy firmes sobre la diferencia entre los dos métodos. Mucha gente dice que uno de estos métodos podría propagar enfermedades, mientras que otros dicen que usar mucha electricidad o fabricar papel causaría daños ambientales al desperdiciar árboles. La mayoría de las personas que sostienen estos puntos de vista no son expertos en salud pública o medio ambiente.

Fallar un:¿Son ciertas las afirmaciones mismas?

Serge: En realidad, no nos importa la autenticidad de nuestras declaraciones, porque muchos temas en las redes sociales no se pueden probar ni falsificar estrictamente. Pero el tema surge porque un pequeño grupo de personas quiere convencer a las masas de que una forma es mejor que otra. Probablemente crearon cientos de miles de contenido generado por bots. Si buscas debates sobre toallas de papel y secadores de aire en las redes sociales hoy en día, encontrarás millones de comentarios. Nuestro estudio no se centra en comparar rigurosamente los pros y los contras de los dos enfoques ni en presentar resultados de verificación de hechos.Estamos más preocupados por detectar estos problemas diseñados.

3. Conjunto de datos “COCO” en las redes sociales

Evite tomar decisiones apresuradas.

Sra. A: Su investigación ha abierto otra dimensión.La verificación de hechos tradicional se centra en la verdad de la semántica, mientras que su investigación se centra en la verdad de las declaraciones o afirmaciones.claropragmática——El objetivo de la predicción no se limita a si es cierto o no, sino que se extiende a temas de discusión creados por algunos usuarios o una gran cantidad de robots en las redes sociales para lograr propósitos específicos.¿Sabes lo que significa este estudio?

Sarga: Sí, estamos creando algo completamente nuevo. Los estudios más relevantes que conocemos se centran únicamente en la verificación de hechos. Pero estamos tratando de utilizar tecnología de lenguaje natural relacionada con temas para agrupar y agrupar debates en las redes sociales para ayudar a las personas, las empresas y los creadores de estrategias a comprender lo que está sucediendo en las redes sociales.No emitimos juicios de valor sobre estos temas ni sobre el contenido de las discusiones, sino que solo mostramos objetivamente la forma en que se plantea cada tema.

Fallar un: Para lograr este objetivo, primero necesitamos un conjunto de datos. Construir este conjunto de datos debería ser un gran desafío. Cuando fue pionero en la investigación de la visión por computadora, pasó de un conjunto de datos de aves pequeñas a COCO. ¿Cómo afrontaste este momento?

Sarga: Este tipo de comportamiento en las redes sociales suele caracterizarse por una cosa. Puede haber un millón de tweets sobre un tema, y aparentemente miles de cuentas participan en la discusión.Pero a través del análisis, podemos encontrar que cien mil de esos tweets en realidad publicaron exactamente lo mismo, con narrativas muy similares o incluso idénticas. Aún así, tenga en cuenta que esto no significa que estas discusiones sean correctas o incorrectas. Permitimos a los usuarios ver grupos y agrupaciones de diferentes declaraciones, lo que facilita que los verificadores de datos y los analistas de redes sociales procesen y comprendan grandes cantidades de contenido sin tener que lidiar con una afluencia repentina de millones de tweets.

Fallar un:¿Puede este sistema manejar varios temas controvertidos en las redes sociales en tiempo real?

Sarga:Creo que se puede y eso espero. Supongamos que en el Mediterráneo se encuentran dos barcos, el ruso y el estadounidense. Comienzan las discusiones en las redes sociales y nace una narrativa. Cada pocas horas aparece nueva información, incluida una declaración de un capitán o una grabación de un teléfono móvil. En este caso, algunas narrativas y cuestiones ganan atención mientras que otras pueden volverse irrelevantes.

Señorita A: usted esperatiempo realAgarrar problemas？

Sarga:y otra información.Para ayudar a los diplomáticos profesionales, nos gustaría crear unpanel(Panel) , proporciona información completa y relevante y también coloca estos eventos en el contexto mundial.Este sistema puedeEvite que la gente tome decisiones apresuradas . Me gustaría subrayar que el sistema por sí solo no decide quién tiene razón, sino que organiza la información de forma exhaustiva.

Fallar un:¿Qué puntos débiles deben abordarse para lograr una funcionalidad confiable?

Serge: Hay desafíos tradicionales y nuevos . Los desafíos tradicionales incluyen el impacto del idioma, la cultura y los prejuicios emocionales.

Por ejemplo, "La Sirenita" y "El patito feo" son obras de escritores daneses, pero sus versiones cinematográficas de las historias de Disney se han adaptado a la cultura estadounidense. Debido al mayor predominio de la narrativa estadounidense sobre la danesa en las redes sociales, la versión original de la historia de Andersen es casi desconocida entre los internautas de muchos otros países.

En el proceso de anotación de datos, especialmente la anotación de datos de redes sociales, se verá afectado por el idioma y la cultura. Otro ejemplo es que el análisis de sentimientos ya es una parte importante de la verificación de hechos, y el modelo de predicción de sentimientos en sí puede tener muchos sesgos y estereotipos en el entrenamiento.El entrenamiento del modelo de IA es un proceso de entrada y salida de basura. Es difícil resolver los problemas causados por los datos de entrenamiento. Por lo tanto, debemos comprender qué datos de entrenamiento utiliza el modelo.Podemos decir que la verificación de hechos sin participación humana es inexistente (poco confiable).

Fallar un:¿Cuáles son los nuevos desafíos?

Serge: El contenido falso generado por modelos lingüísticos es un nuevo desafío al que nos enfrentamos. Las cuentas falsas anteriores de redes sociales a menudo tenían patrones muy simples a seguir. Pero con GPT y los modelos de generación de imágenes, los creadores de cuentas falsas pueden generar perfiles falsos más complejos y naturales, y luego cuentas de redes sociales falsas que parecen reales. Estas cuentas no se encuentran fácilmente con los modelos tradicionales de identificación de cuentas falsas. Estos modelos generativos de IA también plantean los desafíos correspondientes a las tareas tradicionales de verificación de datos. por lo tanto,La IA generativa crea e identifica información falsa, lo que será el juego del gato y el ratón de esta era.

4.Futuro de la IA

Es posible que ellos (OpenAI) aún no conozcan nuestros planes.

Fallar un:Parece que estos desafíos no pueden resolverse simplemente a través de modelos, sino que pueden alcanzar la dimensión de la cooperación entre la IA y los humanos.túparecerDescubra siempre nuevos problemas en nuevas dimensiones y luego resuélvalos desde una perspectiva sencilla.

Sarga:Sí.Nuestra nueva idea se puede comparar con Wikipedia. Alguna vez la gente pensó que un mismo nodo de Wikipedia solo necesitaba páginas en diferentes idiomas con la misma semántica. La realidad es que no es sólo el idioma lo que es diferente.

Lengua, cultura, valores, tradiciones, todos los factores se mezclan en diferentes páginas de una misma entrada. La energía atómica y los combustibles fósiles, por ejemplo, se tratan de manera muy diferente en distintos idiomas y en distintas partes del mundo. Entonces esto nos recuerda que el sistema de inteligencia artificial que estamos tratando de construir no es puramente automatizado ni es un modelo independiente. Este es un sistema en el que participan seres humanos, lo que significa que se necesitan muchas comunidades humanas diferentes en todo el mundo para etiquetar y organizar los datos y dar cuenta de todas las diferentes piezas.Este es un problema grande y profundo porque los prejuicios siempre existirán.

Fallar un:Entonces, al igual que MSCOCO, organizar los datos de la manera más completa y justa posible es en sí misma la ambición de esta investigación.

Sarga: Este es el proceso de organizar todos los diferentes tipos de comunidades. En diferentes partes del mundo, personas de diferentes edades estudian diferentes carreras como literatura, historia, ciencias, etc., y cada campo tiene su propia historia. Para que la investigación que describo tenga éxito,Necesitamos muchas anotaciones que comprendan una variedad de temas.Por。 No es necesario que sean expertos, pero sí tener cierto conocimiento del contenido que se va a etiquetar, como la energía nuclear, el emprendimiento o las criptomonedas, para conocer las similitudes en las narrativas y los temas. Por lo tanto, el mayor desafío es la organización de la comunidad, no las instalaciones básicas de almacenamiento e informática de IA.

Fallar un:¿Sam Altman o Yann Lecun comentaron sobre su pensamiento?

Serge: Puede que aún no conozcan nuestros planes.

Fallar un:Me parece que estoy presenciando las primeras etapas de una iniciativa:Descubra problemas en una dimensión superior y encuentre el punto de entrada más directo.

Serge: Si desarrollamos esta infraestructura para la detección de problemas, como muchas tecnologías, podría usarse para bien o para mal.Por lo tanto, a diferencia de muchas IA comerciales,Intentamos desarrollar sistemas de gestión abiertos, transparentes y auditables . Por lo tanto, tendremos una base de conocimiento completamente transparente y los usuarios podrán ver el historial de edición de los datos, incluido cuándo se incluyeron los datos y qué anotadores los anotaron.

Fallar un:¿Cómo garantizar la exactitud y objetividad de los datos?

Sarga:La respuesta simple es,no podemos garantizar。

Pero lo mejor que podemos hacer es crear un sistema que atraiga a decenas de miles de personas interesadas en diferentes áreas de discusión para comentar el sistema. Tener tantos anotadores como sea posible puede ayudarnos a lograr objetividad estadística. Wikipedia también tiene mecanismos diseñados para la transparencia y la rendición de cuentas, y nosotros haremos lo mismo.

Fallar un:¿Cómo afectará esta investigación a los formuladores de políticas, educadores y tecnólogos?

Serge: Piense en lo que estamos haciendo como un complemento al razonamiento lógico o fáctico.

Digamos que una empresa quiere mejorar su diversidad, equidad e inclusión. Entonces su junta directiva celebró una reunión para discutir la contratación de más mujeres o minorías. Este tipo de discusión es común en muchas empresas y en una universidad, por ejemplo, puede que no haya muchas mujeres estudiando ingeniería eléctrica, y el departamento quiere tomar medidas para cambiar eso. Durante estas reuniones, puede haber mucha discusión que no esté respaldada por conocimientos o información.

Algunas personas expresan opiniones sesgadas de que las mujeres no son buenas en matemáticas. Lo que se necesita es un sistema que pueda ayudar al jefe de departamento, al director ejecutivo o al maestro que necesita liderar estas discusiones, y que puedan extraer un conjunto de narrativas del sistema para estructurar la discusión. Además, una vez que el sistema comienza a funcionar, indexa y analiza declaraciones en narrativas preexistentes. De esta manera, un director ejecutivo, un maestro o un facilitador de reuniones puede evitar conversaciones confusas o de baja calidad, tener una estructura y un sistema de clasificación efectivos, guiar las discusiones y evitar conversaciones redundantes.

Fallar un:Para la narrativa futura de las redes sociales y el análisis de problemas, ¿cuáles cree que son las posibles direcciones de investigación para el desarrollo tecnológico?

Sarga: Los diferentes campos tienen sus propios desafíos únicos. Algunos de ellos son problemas clásicos como procesar grandes cantidades de datos y cómo etiquetarlos, cómo mitigar sesgos, etc. Pero también nos enfrentamos a grandes desafíos en lo que respecta a la visualización.

Acabamos de mencionar las diferencias que enfrentan los distintos idiomas y culturas. Cada tema específico tiene muchas perspectivas diferentes y diferentes anotadores proporcionarán anotaciones diferentes debido a sus propios prejuicios. Desde una perspectiva de la teoría de la información, intentar comprimir estas diversas cuentas puede resultar en la pérdida o corrupción de información. Este tipo de preguntas surgirán a lo largo del proyecto y las encontraremos con frecuencia.

Fallar un: En su opinión, ¿qué últimos avances en tecnología visual tendrán un profundo impacto en el futuro?

Sarga: Ahora, cada vez más investigadores están comenzando a prestar atención a los datos multimodales y procesan múltiples tipos de datos, como imágenes, texto y audio, al mismo tiempo en un modelo. Este método generalmente utiliza arquitecturas modelo como Transformer para resolver problemas prácticos complejos. . Creo que esta tendencia continuará, y a los futuros recién llegados al campo de la inteligencia artificial les resultará más natural dominar múltiples habilidades profesionales al mismo tiempo que profundizar en un área sola, como el procesamiento del lenguaje natural o la visión por computadora.

Personalmente, creo que aunque algunas personas afirman que la inteligencia artificial sustituirá por completo a los médicos, esta afirmación es exagerada. Pero estoy convencido de que en campos como la radiología, la dermatología y la histopatología, los sistemas asistidos por IA se generalizarán y beneficiarán a todos.

En cuanto a los vehículos autónomos, si bien en el pasado ha habido predicciones de que los avances en la tecnología de visión y la inteligencia artificial permitirán la adopción generalizada de vehículos autónomos, creo que es poco probable que esto suceda. A menos que el gobierno tome medidas para restringir el funcionamiento de los automóviles convencionales en ciertos carriles o prohibirlos por completo, es muy poco probable que los automóviles sin conductor se conviertan en la norma en Estados Unidos.

Fallar un : Me gusta tu artículo. Mis pensamientos son similares.El desarrollo tecnológico está desbloqueando simultáneamente nuevas dimensiones cognitivas. La metodología más valiosa es aquella que tiene un punto de entrada minimalista pero que puede irradiar la situación general.

Sarga:¿Qué metodología te interesa más?

Fallar un:Da un pequeño ejemplo.En el camino de la falsabilidad, la ciencia se embarcará en el camino iterativo de la negación de la negación... regresando a la estructura de la revolución científica que todos conocemos.

*Hang Zhou también contribuyó a este artículo.

Dado que este artículo involucra discusiones académicas, aquí hay una breve introducción al autor:

Zhang Yijia, fundador de Jiazi Guangnian, se graduó en la Facultad de Ciencias Matemáticas de la Universidad de Pekín en 2013 y obtuvo una doble licenciatura en economía del Instituto Nacional de Desarrollo. Ganó una medalla de oro en la Olimpiada China de Matemáticas y fue seleccionado para la competencia; equipo de formación nacional; sus intereses de investigación son las matemáticas financieras y la teoría de juegos, y se desempeña como Director concurrente de la Facultad de Ciencias Matemáticas de la Universidad de Pekín.
Zhou Hang, el responsable de Jiazi Brain, se graduó de la Facultad de Ciencias Matemáticas de la Universidad de Pekín en 2019; su dirección de investigación es la optimización escasa y la optimización no convexa.

*Referencias

La búsqueda de la estructura en afirmaciones infalsificables.pdf
978-3-319-10602-1_48.pdf "Microsoft COCO: objetos comunes en contexto" Conjunto de datos MSCOCO: el artículo más citado de Serge.
Thomas Samuel Kuhn "La estructura de las revoluciones científicas"

|Fallar unRevisión de la serie de diálogos|

noticias

Conversación de la señorita A con Serge Belongie: darle una “bala” falsificable |

Introducción

Mi informacion de contacto