noticias

¡Todas las bellezas de la IA fueron eliminadas! Convertidos colectivamente en "fantasmas" bajo el espejo cibermágico, el código de IA interrumpió la producción de imágenes de la IA.

2024-08-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

  • Mingmin Kresi del templo de Aofei
    Qubits | Cuenta pública QbitAI

Bajo el espejo cibermágico, todas las bellezas de la IA se convirtieron en fantasmas.

Ven y mira sus dientes



Cuando la saturación de la imagen aumenta por completo, los dientes del retrato de IA se volverán muy extraños y los límites se volverán borrosos.

El color de la imagen general es normal, pero la parte del micrófono es aún más extraña.

contrasteFotos de personas reales., debería ser así.

Los dientes son claros y las manchas de color en la imagen son uniformes.



Esta herramienta está abierta y todos pueden probarla con fotos.

Un determinado fotograma del vídeo generado por IA no puede escapar de este método.



Las fotografías de dientes perdidos también pueden revelar problemas.



Pero por cierto, esta herramientapor Claude. Utilice la IA para descifrar la IA, un maravilloso circuito cerrado.



De hecho, los retratos de IA recientemente se han vuelto demasiado realistas y han causado mucha discusión. Por ejemplo, en una serie de "videos de oradores TED" populares, ninguno de ellos es en realidad personas reales.



No sólo es difícil distinguir las caras, sino que incluso la escritura, el defecto anterior de la IA, ahora puede ser completamente falsa.



Más importante aún, el costo de generar tales retratos de IA no es alto. Se puede realizar en tan sólo 5 minutos y 1,5 dólares estadounidenses (unos 10 yuanes) cada 20 segundos.



Ahora los internautas no podían quedarse quietos y comenzaron uno tras otro concursos de IA contra la falsificación.

Casi 5.000 personas vinieron a discutir cuál de estas dos imágenes es la persona real.



Las razones dadas variaron. Algunas personas encuentran el texto y los detalles del patrón muy abstractos, mientras que otros piensan que los ojos de los personajes están vacíos...

Las reglas mediante las cuales la IA más avanzada genera retratos se están descubriendo gradualmente.

Es difícil saberlo sin mirar los detalles.

En resumen, ajustar la saturación puede ser la forma más rápida de identificarla.

Los retratos grupales de IA quedan más completamente expuestos de esta manera.



Aunque hay un problema con eso. Es posible que este método no funcione si la imagen se comprime utilizando el algoritmo JPEG.

Por ejemplo, asegúrese de que la foto sea real.



Sin embargo, debido a problemas de iluminación y compresión de la imagen, los dientes del personaje también están un poco borrosos.



Por lo tanto, los internautas también enumeraron más formas de saber si un retrato es sintetizado por IA.

El primer método, en pocas palabras, consiste en confiar en el conocimiento y el juicio humanos.

Dado que la forma en que la IA aprende imágenes no es consistente con la de los humanos, es inevitable que no pueda captar el 100% de la información visual desde la perspectiva humana.

El resultado es que las imágenes generadas por IA a menudo contienenNo es consistente con el mundo real.Esto proporciona un punto de partida para la identificación de imágenes.

Utilice la imagen del principio como ejemplo.

En general, la piel del personaje es demasiado suave y no se ven poros. Esta característica demasiado perfecta en realidad aumenta la sensación de irrealidad.

Por supuesto, esta "sensación poco realista" no es completamente equivalente a "falso". Después de todo, los poros no se pueden ver en las imágenes procesadas mediante microdermoabrasión.

Pero este no es el único factor de juicio. Puede que la IA no deje en el panorama una sola desviación del sentido común.



De hecho, si observa los siguientes detalles de esta imagen, puede ver una característica relativamente obvia:El peculiar método de conexión del gancho encima de la placa de identificación.



También hay micrófonos que muestran fallas en el modo de alta saturación, y las pistas se pueden ver directamente a simple vista después de la amplificación.



Lo que es aún más sutil es que hay varios pelos al final del cabello que están en posiciones muy irrazonables, pero tal característica probablemente requeriría una visión del nivel de Leeuwenhoek para ver.

Sin embargo, con el avance de la tecnología de generación, las características que se pueden encontrar se vuelven cada vez más ocultas, lo cual es una tendencia inevitable.



Otra forma es mirar el texto. Aunque la IA está superando gradualmente el problema de los "caracteres fantasmas" en la representación de fuentes, todavía existen algunas dificultades para representar correctamente el texto con el significado real correcto.

Por ejemplo, algunos internautas descubrieron que en la insignia que usa la persona en la foto, las dos letras en la última línea debajo del logotipo de Google son "CA", que significa California, y la cadena larga al frente debería ser el nombre de la ciudad.

Pero, de hecho, no hay ninguna ciudad en California con un nombre tan largo.



Además de los detalles de los objetos en sí, también se puede utilizar información como luces y sombras para determinar la autenticidad.

Esta imagen está extraída de un video y hay un cuadro en el video donde se encuentra.

En el lado derecho del micrófono, hay una sombra muy extraña. Esta sombra corresponde a una de las manos del personaje. Obviamente falta el procesamiento de IA.



Cuando se trata de vídeos, debido a la coherencia del contenido antes y después, es más probable que la IA revele fallos que en las imágenes estáticas.



También hay algunas características que no son "errores de sentido común", pero que también reflejan algunas preferencias de la IA al generar imágenes.

Por ejemplo, estas cuatro imágenes son todas de "personas promedio" sintetizadas por IA. ¿Ha encontrado algo en común?



Algunos internautas dijeron que ninguna de las personas en estas cuatro imágenes tiene una cara sonriente, lo que parece reflejar algunas características de las imágenes generadas por IA.



De hecho, esto es cierto para estas imágenes, pero es difícil formar un sistema para este tipo de juicio. Después de todo, las diferentes herramientas de dibujo de IA tienen características diferentes.

En resumen, para hacer frente al avance gradual de la IA, por un lado, podemos aumentar la intensidad de "Leewenhoek" y, por otro lado, también podemos introducir técnicas de procesamiento de imágenes como el aumento de la saturación.

Pero si tales "cambios cuantitativos" se acumulan cada vez más, será cada vez más difícil juzgar a simple vista, y algún día la IA podrá romper la saturación de la imagen.

Por lo tanto, las personas también están cambiando su forma de pensar y el método "modelo por modelo", utilizando imágenes generadas por IA para entrenar modelos de detección y analizar más características de las imágenes.

Por ejemplo, las imágenes generadas por IA tienen muchas características en cuanto a espectro, distribución de ruido, etc. Estas características no se pueden capturar a simple vista, pero la IA puede verlas claramente.

Por supuesto, no descarta la posibilidad de que el método de detección se quede atrás y no pueda seguir el ritmo de los cambios del modelo, o que los desarrolladores de modelos incluso se especialicen en el desarrollo adversario.

Por ejemplo, en la imagen analizada anteriormente, una herramienta de detección de IA tiene solo un 2% de probabilidad de que sea sintetizada por IA.



Sin embargo, el proceso de juego entre el fraude de IA y la detección de IA es en sí mismo un "juego del gato y el ratón".

Por lo tanto, además de la detección, es posible que los desarrolladores de modelos también deban asumir algunas responsabilidades, como agregar marcas de agua invisibles a las imágenes generadas por IA para que el fraude por IA no tenga dónde esconderse.

La IA es un pie más alta

Vale la pena mencionar que muchos de los retratos de IA que han causado pánico como se mencionó anteriormente son del recientemente popularFlujoGenerar/participar en la producción.

Todo el mundo incluso ha empezado a suponer que los efectos que son demasiado buenos para distinguirlos son creados por Flux.



Fue creado por el equipo original de Stable Diffusion y causó revuelo en Internet solo 10 días después de su lanzamiento.

Estas hermosas fotos de charlas TED falsas están hechas por él.



Otros han utilizado Flux y Gen-3 juntos para crear hermosos anuncios de productos para el cuidado de la piel.



Y varios efectos de síntesis desde múltiples ángulos.



Resuelve muy bien problemas como los pintores de IA y el texto generado por IA en imágenes.



Esto lleva directamente al hecho de que los humanos ya no pueden mirar directamente las manos y las palabras para distinguir los dibujos de la IA, sino que solo pueden adivinar basándose en pistas.



Flux debería haber fortalecido la capacitación en mano, texto y otros indicadores.

Esto también significa que si la IA actual continúa trabajando duro en el entrenamiento de detalles de texturas, colores, etc., cuando salga el modelo de dibujo de IA de próxima generación, los métodos de reconocimiento humano pueden volver a ser ineficaces...

Además, Flux es de código abierto y se puede ejecutar en computadoras portátiles. Mucha gente se encuentra ahora en Forget Midjourney.

Fueron necesarios 2 años para pasar de Stable Diffusion a Flux.

Tomó 1 año pasar de "Will Smith comiendo fideos" a "orador de Tedx".

Realmente no sé qué trucos tendrán que idear los humanos en el futuro para distinguir la generación de IA...

Enlaces de referencia:
[1]https://x.com/ChuckBaggett/status/1822686462044754160
[2]https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/
[3]https://www.reddit.com/r/ChatGPT/comments/1epeshq/estos_son_todos_los_ai/
[4]https://x.com/levelsio/status/1822751995012268062