noticias

¡Más allá del valle inquietante! ¿Cinco millones de internautas en todo el mundo fueron engañados y ninguno de los oradores populares de TEDx era gente real?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



  Nuevo informe de sabiduría

Editor: Eneas tiene mucho sueño
[Introducción a la Nueva Sabiduría]Recientemente, estos ponentes de TED se han vuelto virales en Internet. Sin embargo, ¿no son personas reales? ! Después de que se reveló la respuesta, cinco millones de internautas simplemente quedaron impactados. ¿Cuántos bichos puedes encontrar en estas 5 imágenes?

Recientemente, estos "oradores TED" se han vuelto muy populares en Internet y pueden considerarse virales.

Mire más de cerca. ¿Puede encontrar algún problema?

La respuesta se revela: ¡ninguna de estas cinco personas es una persona real!

El chico que busca a alguien por internet va a llorar

Tan realista y casi impecable, este nivel de IA generadora de fotografías sorprendió directamente a los internautas.
Incluso el software de reconocimiento de IA no puede reconocer que se trata de una imagen generada por IA.

"Parece real, ¿no es así porque es una foto real?"

"¿Ninguno de ellos es gente real? ¡Es tan espeluznante!"

Los internautas comentaron: Esto ha superado el valle inquietante y ha llegado al "valle hiperreal".

En tan solo unas horas, la publicación que comparte esta imagen tuvo más de 5 millones de visitas en Twitter.

Más tarde, también se reveló el autor: era Leo Kadieff, un ex miembro del equipo de Stable Diffusion.

Reveló: Todos estos parlantes TEDx fueron producidos utilizando la última versión real Flux de LoRA.

En el pasado, las imágenes generadas por IA serían algo inconsistentes con el ojo humano, pero esta vez las imágenes son tan realistas. Es precisamente gracias al modelo mejorado que utiliza tecnología LoRA que el realismo aumenta considerablemente.

Además, el autor dijo que este flujo de trabajo también tiene la ventaja de simplificar enormemente las palabras clave complejas.

Esta noticia simplemente hace que los maestros de las palabras se sientan extasiados.

Este pequeño archivo de 22 MB nos ahorra la molestia de escribir un montón de tokens relacionados con la autenticidad en cada palabra.

Una frase, "Una foto RAW surrealista, UHD, 8k" es suficiente. Amantes del realismo, adoran esta herramienta.

El autor lo dice sin rodeos: ¿Todavía necesitamos perfeccionar nuestros modelos realistas?

- Estas imágenes son resultados sin procesar de Flux+LoRA sin ningún tipo de mejora ni posprocesamiento.

Lora: https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

Interfaz de usuario de Comfu: https://we.tl/t-zrC5tPFG17

Versión real de LoRA, efecto excepcional.

No es difícil ver en las dos imágenes a continuación que la comparación de los efectos de usar LoRA y no usar LoRA es realmente muy obvia.

Los internautas se divierten

Al mismo tiempo, Kyranio, quien comparte "TED Speaker", también intentó reproducirlo con Midjourney.

Las palabras iniciales son las siguientes:

Una mujer hablando en el escenario, de Google, fondo blanco, logotipo corporativo borroso, conferencia tecnológica --estilo crudo --v 6.1

Se puede ver que el efecto de generación no es malo, pero todavía hay una gran brecha con las imágenes generadas por Leo Kadieff.

Luego, el blogger hizo algunas mejoras:

Una mujer joven sonriendo y hablando en el escenario, de Google, fondo blanco, logotipo corporativo borroso, conferencia tecnológica --estilo crudo --v 6.1

Y después de varias generaciones, probé el resultado más cercano:

Al mismo tiempo, cuando Google Imagen 3 estuvo disponible públicamente, los internautas también probaron este conjunto de indicaciones por primera vez.

Durante un tiempo, la locura por la generación de fotografías mediante IA comenzó en Internet.

Imagen 3 está disponible para todos


Así es, como se acaba de mencionar, el modelo gráfico vicenciano más poderoso de Google, Imagen 3, está oficialmente disponible.

Aviso: Foto de un hombre sosteniendo un cartel que dice: "Imagen es ahora casi tan bueno como Midjourney" en la ciudad de Nueva York.

Fuente: Risfera

¡El internauta chrypnotoad dijo que nunca había visto una IA que pudiera hacer tan bien el Escudo de Aquiles!

Al poder retener indicaciones tan complejas con facilidad, Imagen 3 no puede subestimarse.

El conocido blogger "Guizang" dijo después de la experiencia:

El contenido generado es preciso pero la estética de la imagen es pobre. Siempre que haya personajes involucrados, debes considerar cuidadosamente cómo escribir las indicaciones; de lo contrario, existe una alta probabilidad de que la imagen no se produzca.

Afortunadamente, hicieron un buen trabajo al interactuar con palabras clave:

LLM analizará el tipo de palabra solicitada y le brindará palabras relacionadas que puede cambiar directamente.

Fuente: Guizang