За пределами зловещей долины! Пять миллионов пользователей сети по всему миру были обмануты, и ни один из популярных спикеров TEDx не был реальным человеком?

2024-08-10

Новый отчет мудрости

Монтажер: Эней такой сонный

[Введение в новую мудрость]Недавно эти спикеры TED стали вирусными в Интернете. Однако они не настоящие люди? ! После того, как ответ был раскрыт, пять миллионов пользователей сети были просто шокированы. Сколько ошибок вы можете найти на этих 5 картинках?

В последнее время эти «TED-спикеры» стали очень популярны в Интернете и их можно назвать вирусными.

Присмотритесь, можете ли вы найти какие-либо проблемы?

Ответ очевиден: ни один из этих пяти человек не является реальным человеком!

Парень, ищущий кого-то в Интернете, заплачет

Такой реалистичный и почти безупречный, этот уровень искусственного интеллекта, генерирующего фотографии, прямо шокировал пользователей сети.

Даже программное обеспечение для распознавания ИИ не может распознать, что это изображение, созданное ИИ.

«Оно выглядит настоящим, не потому ли, что это настоящая фотография?»

«Никто из них не настоящие люди? Это так жутко!»

Пользователи сети прокомментировали: «Это превзошло сверхъестественную долину и достигло «гиперреальной долины».

Всего за несколько часов пост с этой фотографией набрал более 5 миллионов просмотров в Твиттере.

Позже раскрылся и автор — им оказался Лео Кадиев, бывший член команды Stable Diffusion.

Он рассказал: Все эти динамики TEDx были созданы с использованием последней реальной версии LoRA Flux.

Раньше изображения, создаваемые искусственным интеллектом, несколько не соответствовали человеческому глазу, но на этот раз изображения настолько реалистичны, что улучшенная модель с использованием технологии LoRA значительно увеличивает ощущение реальности.

Более того, автор сказал, что этот рабочий процесс также имеет то преимущество, что значительно упрощает сложные слова-подсказки.

Эта новость просто приводит в восторг мастеров оперативного слова.

Этот небольшой файл размером 22 МБ избавляет нас от необходимости писать кучу токенов, связанных с подлинностью, в каждом слове подсказки.

Одного предложения: «Сюрреалистическая фотография в формате RAW, UHD, 8k» достаточно. Любителям реализма очень нравится этот инструмент.

Автор говорит прямо: нужно ли нам еще дорабатывать наши реалистичные модели?

- Эти изображения представляют собой необработанные результаты Flux+LoRA без какого-либо масштабирования или постобработки.

Лора: https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

ComfuUI: https://we.tl/t-zrC5tPFG17

Настоящая версия LoRA, выдающийся эффект

Из двух изображений ниже нетрудно увидеть, что сравнение эффектов использования LoRA и неиспользования LoRA действительно очень очевидно.

Пользователи сети веселятся

В то же время Киранио, соучастник «TEDдиктора», также пытался воспроизвести его с помощью Midjourney.

Начальные слова-подсказки следующие:

Выступающая на сцене женщина, из Google, белый фон, размытый корпоративный логотип, техническая конференция --style raw --v 6.1

Видно, что эффект генерации неплохой, но с картинками, сгенерированными Львом Кадиевым, все равно большой разрыв.

Затем блоггер внес некоторые улучшения:

Молодая женщина улыбается и говорит на сцене, из Google, белый фон, размытый корпоративный логотип, техническая конференция — стиль raw — v 6.1

И после нескольких поколений я попробовал наиболее близкий результат:

В то же время, когда Google Imagen 3 стал общедоступным, пользователи сети также впервые попробовали этот набор подсказок.

На какое-то время по всему Интернету началось увлечение созданием фотографий с помощью искусственного интеллекта.

Изображение 3 доступно каждому

Правильно, как только что упоминалось, официально доступна самая мощная модель графа Винсента от Google — Imagen 3.

подсказка: Фотография мужчины, держащего табличку с надписью: «Imagen теперь почти так же хорош, как Midjourney» в Нью-Йорке.

Источник: Рисфера

Пользователь сети хрипножаба сказал, что он никогда не видел ИИ, который мог бы так хорошо использовать Щит Ахилла!

Imagen 3 нельзя недооценивать, поскольку он легко справляется с такими сложными подсказками.

Известный блоггер Guizang сказал после этого опыта:

Сгенерированный контент является точным, но эстетика изображения оставляет желать лучшего. Пока задействованы персонажи, надо внимательно продумывать, как писать подсказки, иначе велика вероятность, что картинка не получится.

К счастью, они хорошо справились с взаимодействием с подсказками:

LLM проанализирует тип слова-подсказки и предоставит вам связанные слова, которые вы можете переключать напрямую.

Источник: Гуйзан

новости