Моя контактная информация
Почта[email protected]
2024-08-10
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Новый отчет мудрости
В последнее время эти «TED-спикеры» стали очень популярны в Интернете и их можно назвать вирусными.
Присмотритесь, можете ли вы найти какие-либо проблемы?
Ответ очевиден: ни один из этих пяти человек не является реальным человеком!
Парень, ищущий кого-то в Интернете, заплачет
«Никто из них не настоящие люди? Это так жутко!»
Пользователи сети прокомментировали: «Это превзошло сверхъестественную долину и достигло «гиперреальной долины».
Всего за несколько часов пост с этой фотографией набрал более 5 миллионов просмотров в Твиттере.
Позже раскрылся и автор — им оказался Лео Кадиев, бывший член команды Stable Diffusion.
Он рассказал: Все эти динамики TEDx были созданы с использованием последней реальной версии LoRA Flux.
Раньше изображения, создаваемые искусственным интеллектом, несколько не соответствовали человеческому глазу, но на этот раз изображения настолько реалистичны, что улучшенная модель с использованием технологии LoRA значительно увеличивает ощущение реальности.
Более того, автор сказал, что этот рабочий процесс также имеет то преимущество, что значительно упрощает сложные слова-подсказки.
Эта новость просто приводит в восторг мастеров оперативного слова.
Этот небольшой файл размером 22 МБ избавляет нас от необходимости писать кучу токенов, связанных с подлинностью, в каждом слове подсказки.
Одного предложения: «Сюрреалистическая фотография в формате RAW, UHD, 8k» достаточно. Любителям реализма очень нравится этот инструмент.
Автор говорит прямо: нужно ли нам еще дорабатывать наши реалистичные модели?
- Эти изображения представляют собой необработанные результаты Flux+LoRA без какого-либо масштабирования или постобработки.
ComfuUI: https://we.tl/t-zrC5tPFG17
Из двух изображений ниже нетрудно увидеть, что сравнение эффектов использования LoRA и неиспользования LoRA действительно очень очевидно.
Пользователи сети веселятся
В то же время Киранио, соучастник «TEDдиктора», также пытался воспроизвести его с помощью Midjourney.
Начальные слова-подсказки следующие:
Выступающая на сцене женщина, из Google, белый фон, размытый корпоративный логотип, техническая конференция --style raw --v 6.1
Видно, что эффект генерации неплохой, но с картинками, сгенерированными Львом Кадиевым, все равно большой разрыв.
Затем блоггер внес некоторые улучшения:
Молодая женщина улыбается и говорит на сцене, из Google, белый фон, размытый корпоративный логотип, техническая конференция — стиль raw — v 6.1
И после нескольких поколений я попробовал наиболее близкий результат:
В то же время, когда Google Imagen 3 стал общедоступным, пользователи сети также впервые попробовали этот набор подсказок.
На какое-то время по всему Интернету началось увлечение созданием фотографий с помощью искусственного интеллекта.
Изображение 3 доступно каждому
Правильно, как только что упоминалось, официально доступна самая мощная модель графа Винсента от Google — Imagen 3.
подсказка: Фотография мужчины, держащего табличку с надписью: «Imagen теперь почти так же хорош, как Midjourney» в Нью-Йорке.
Источник: Рисфера
Пользователь сети хрипножаба сказал, что он никогда не видел ИИ, который мог бы так хорошо использовать Щит Ахилла!
Imagen 3 нельзя недооценивать, поскольку он легко справляется с такими сложными подсказками.
Известный блоггер Guizang сказал после этого опыта:
Сгенерированный контент является точным, но эстетика изображения оставляет желать лучшего. Пока задействованы персонажи, надо внимательно продумывать, как писать подсказки, иначе велика вероятность, что картинка не получится.
К счастью, они хорошо справились с взаимодействием с подсказками:
LLM проанализирует тип слова-подсказки и предоставит вам связанные слова, которые вы можете переключать напрямую.
Источник: Гуйзан