новости

Статус Midjourney нестабильен? Появляется еще одна темная лошадка в рисовании ИИ: тестирование 4 продуктов из первых рук

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Круг искусственного интеллекта, снова генерация изображения открытой книги.

Ряд разработок собрались вместе:

21 августа,Идеограмма официально запускает версию 2.0, утверждая, что обладает более мощными возможностями рендеринга текста.

Да, это проект, который был основан в августе прошлого года четырьмя крупными ребятами из Google AI Painting, которые коллективно оставили свои рабочие места, чтобы начать свой бизнес. Он получил инвестиции от ряда крупных специалистов в области искусственного интеллекта.

На этот раз идеограмма такжеОткрытый вызов Flux, чиновник уверенно заявил, что его человеческая оценка значительно лучше, чем у Flux Pro.

Знаете, Flux был создан первоначальной командой Stable Diffusion, и в последнее время он стал популярен в крупных сетях для создания «фотографий» выступлений TED, которые выглядят как настоящие.

Кроме того, неделю назад Google официально выпустилаИзображение 3По официальным оценкам, он работает лучше, чем DALL-E 3, Midjourney v6, Stable Diffusion 3 и другие модели рисования.

Возможно, из-за стимуляции (doge) Midjourney тоже перешёл и был запущен сразу для всех пользователей 22 августа.Бесплатная веб-версия

Теперь есть что посмотреть!

Поскольку все утверждают, что они сильны, мы могли бы с таким же успехом собрать всех за один стол и провести ПК лицом к лицу.

Кто самый сильный ИИ рисования?

Давайте сначала пригласим наших четырех участников (все используют веб-версию):

Конкурсант №1: Идеограмма 2.0.Каждый день дается 10 бесплатных баллов, 1 балл может создать 4 изображения, а в день можно создать максимум 40 изображений;

Игрок №2: Флюкс.1.Black Forest официально предоставляет бесплатную демо-версию Hugging Chat (выберите версию FLUX.1 Schnell);

Конкурсант №3: Изображение 3.Бесплатное и неограниченное использование на Image FX;

Игрок № 4: Мидджорни.В течение бесплатного пробного периода у вас есть возможность создать всего 25 изображений;

Теперь мы официально вступаем в этап соревнований.

Черные обезьяны все перевернулись

Во-первых, чтобы протестировать эти зарубежные ИИВы понимаете китайские подсказки?, давайте также воспользуемся популярностью сегодняшних лучших черных обезьян.

Подсказка: Игровой персонаж — обезьяна, одетая в доспехи, с золотой короной с перьями феникса на голове и держащая в руке золотой обруч, стоящая на скале.

Как и ожидалось, произошел несчастный случай...

Думаю, всех с первого взгляда привлек большой красный крест на доме №3. Правильно, под этим же словом-подсказкой стоит только Imagen 3Запрос на сборку отклонен

Когда я увидел это, моей первой реакцией было то, вызывают ли наши подсказки защиту авторских прав. Поэтому я сначала удалил «игровой персонаж» в слове-подсказке, но в результате напоминание не удалось создать.

Это потому, что Google Imagen 3 не поддерживает китайский язык? Поэтому я случайным образом изменил слово-подсказку на более простое, и на этот раз там была картинка.

Просто в результате произошла большая ошибка: несколько китайских слов были изменены, и в итоге все они оказались нерелевантными текстурными изображениями.

КажетсяGoogle Imagen 3 действительно не поддерживает китайские слова-подсказки

После того, как номер 3 провалился в списке, если посмотреть на остальных, в нем остались толькоИдеограмма № 1 2.0 работает лучше всего

№ 2 все еще может видеть тень китайских комиксов, но № 4 Midjourney полностью отпустил себя ~ (основная тема совершенно не связана с ним)

Наконец, я хотел бы поблагодарить Ideogram 2.0 за то, что он точно отражает все ключевые элементы.

Хотя это не то, чего я хочу в своем сердце (я хочу Черную Мифологию), на самом деле нет ничего плохого в восстановлении подсказок.

Это реальный человек или ИИ? Глупый, я не вижу разницы

Затем войдите в зону комфорта каждого игрока——Генерация портретов

В те времена Midjourney стал популярен в Интернете благодаря фотографии парочки на крыше, сейчас Flux даже популярен в Интернете благодаря набору картинок с выступлениями на TED…

Кто лучше? Ответ скоро станет известен.

prompt:Молодой человек с каштановыми волосами, одетый в клетчатую рубашку в бирюзовых и кремовых тонах, снятый на 50-миллиметровый объектив для винтажного вида. Насыщенные цвета, четкий фокус и немного ретро-шарма.

Молодой человек с каштановыми волосами, одетый в рубашку в бирюзово-кремовую клетку, запечатлен объективом 50 мм в стиле ретро. Цвета насыщенные, акценты четкие, с оттенком винтажного шарма.

Глядя сначала на № 2 и № 4, становится очевидным, что Midjourney победил!

Глядя на детали, № 2Flux.1 немного отклоняется, есть еще два цвета одежды, которые особенно выделяются среди синих и зеленых клетчатых рубашек.

Кроме того, в начале мы также обнаружили Imagen 3.Уникальная маленькая изюминка: обведите ключевое слово до начала генерации.

Благодаря проделанной работе мы можем просто протестировать производительность нескольких игроков.ключевые элементы(Сине-зеленая клетчатая рубашка, объектив 50 мм и т. д.).

Видно, что в целом несколько игроков выступили хорошо (кроме №2), с высокой степенью восстановления и все смотрели в камеру.

Более того, если бы они не были созданы мной с помощью ИИ, я бы не смог сразу отличить их от реальных людей. (Стыдящийся)

Наконец, я хотел бы спокойно сказать, что участник № 4, Midjourney, выглядит лучше всех.

Большая сложность: отображение изображения и текста

После успешного обмана всех пришло время позволить ИИ немного пострадать——

Добавить текст к изображениям

Этот вопрос всегда был давней проблемой, а также стал одним из стандартов тестирования уровня рисования ИИ.

Без лишних слов, давайте просто позволим нескольким участникам сделать изысканный рекламный щит. Все читатели, пожалуйста, расскажите о своей роли отца партии А.

подсказка: Горизонтальная латунная вывеска с надписью «Праздничный сезон», выполненной стильным шрифтом, окруженная сосной и падубом на темном деревянном фоне, с крупным планом золотых букв.

Горизонтальная латунная вывеска со стильным шрифтом «Праздничный сезон» окружена сосновыми ветвями и падубом на фоне темного дерева, при этом крупный план фокусируется на золотых буквах.

После беглого взгляда, все ли они довольно хороши. Кажется, они в высокой степени восстановили подсказку?

Однако, как только зоркие глаза отца Партии А раскрываются, Номер 2 не может их скрыть.

Обратите внимание, номер 2.Flux.1 срезает углы, в слове «Сезон» отсутствует буква «С».

Но, за исключением №2, остальные довольно хороши. Похоже, у различных компаний, занимающихся искусственным интеллектом, дела идут хорошо.Функция рендеринга текстаВсе усилия были приложены.

Итак, следующий шаг заключается в том, что у каждого свои предпочтения в отношении редиса и зеленых овощей, и каждый делает выбор, исходя из личных предпочтений. (Лично голосовал за Midjourney)

Кстати, No. 1 Ideogram специально реализовала функцию «рендеринга текста» в этом обновлении модели. Возможно, вы захотите попробовать ее еще.

Обратитесь к McDonald’s, вся суть рекламы с использованием ИИ.

Недавно McDonald's нанял 11 красавиц с искусственным интеллектом, чтобы они кричали о картошке фри, что сделало ее очень популярной~

На самом деле принцип относительно прост: это не что иное, как использование искусственного интеллекта для создания изображений разных персонажей, рекламирующих картофель фри, а затем склейки их в видео.

Неожиданно эффект оказался ошеломляющим. Только в Твиттере соответствующее видео набрало почти 10 миллионов просмотров.

Освоив код богатства, мы официально начали работать как китайцы.ИИ помогает фермерамТебе придется ходить вверх и вниз~

подсказка:На фоне мегаполиса в стиле киберпанк девушка держит в руках рекламу органической сельскохозяйственной продукции.

В городском пейзаже в стиле киберпанк девушка рекламирует органические продукты, которые держит в своих руках.

Очень хорошо, игрок №3 снова «провалился». Однако эта волна действительно сбивает с толку. Подсказки не написаны на китайском языке и не являются чем-то явно запрещенным...

После вылета №3 участник №1 Идеограмма 2.0 привез самый широкий ассортимент товаров, включая китайскую капусту, помидоры, фиолетовую капусту и т. д.

И это единственный, кто напечаталтекстовый знакЯ пришел сюда, чтобы продвигать органические продукты питания, и вижу, что они очень усердно работают~

Кроме того, если присмотреться, то можно увидеть, что только №1 изо всех сил старается подражать реальному человеку, а №2 и №4 совершеннодвуиглая обезьяна

u1s1, если обратиться к рекламному стилю Маймая, то это кратковременное поколение не достигло желаемого эффекта. (Надеюсь, ближе к реальности)

Однако, к счастью, в настоящее время эти инструменты искусственного интеллекта доступны бесплатно. Опробовать их несколько раз невозможно. Основное внимание по-прежнему уделяется методологии. 🐶

Не уходите в спешке, на самом деле есть более надежный способ заработать деньги——

Используйте искусственный интеллект, чтобы легко управлять студийными снимкамиДеловые плакаты, не правда ли, неплохо бы сэкономить на фотографах, площадках и постпродакшене?

Гладкий тюбик помады сверкает на фоне изысканности, подчеркивая насыщенный пигмент и гладкое скольжение. Вызывайте роскошь с четким фокусом и намеком на мерцание.

Изящный тюбик помады сияет на изысканном фоне, подчеркивая интенсивный цвет и плавное нанесение. Вызовите ощущение роскоши с помощью четкого акцента и легкого мерцания.

Давайте проверим всех: если бы вам пришлось выбирать помаду для женщины вокруг вас, какую бы вы выбрали? (Приближается смертельное испытание)

Хе-хе, так кто-нибудь выбрал номер 4?

Хотя серый цвет Midjourney № 4 выглядит очень элитно, черный цвет может быть немного нишевым. (Выбирайте внимательно)

Помимо этого, следующими лучшими исполнителями являютсяИзображение 3Бархатная ткань под ней создает ощущение роскоши, и, что самое важное, текстура помады очень реалистичная.

Для сравнения, и № 1, и № 2 выглядят немного фальшиво, с ощущением «пластика».

Таким образом, в целом этот раунд выиграл игрок №3.

Подводя итог, можно сказать, что в целом игра четырех игроков была очень хорошей. По подсказкам китайцев, лучше всего показал себя игрок «темной лошадки» Идеограмма 2.0.

Кто такой Идеограмма?

В феврале этого года Ideogram выпустила версию 1.0. Всего за полгода она снова развилась и выпустила версию 2.0.

На самом деле Ideogram и Google тесно связаны.

Основанная в августе прошлого года, первые четыре члена команды основателей былиАвтор статьи Imagen об исследовании винсентианских графов Google.

Генеральный директор Мохаммад Норузи, соавтор статьи, он получил стипендию Google ML PhD во время учебы на степень доктора компьютерных наук в Университете Торонто.

После окончания учебы он присоединился к Google Brain и проработал 7 лет, дослужившись до должности старшего научного сотрудника. Его основными исследованиями были.Создать модель

Кроме того, он является одним из первых членов команды Google Neural Machine Translation и соавтором системы самоконтролируемого контрастивного обучения SimCLR, разработанной командой Hinton.

Технический директор Уильям Чан(Чэнь Джунлэ), соавтор статьи, учился в Университете Ватерлоо и Университете Карнеги-Меллон в Канаде.

Придя в Google в 2012 году, он сначала работал над рекламными проектами машинного обучения, а затем перешел в Google Brain, чтобы заниматься исследованиями НЛП.

Соучредитель Джонатан Хо, окончил Калифорнийский университет в Беркли со степенью доктора философии, год проработал в OpenAI, а затем присоединился к Google.

Помимо того, что он был одним из основных авторов статьи Imagen, он также заложил основу для модели диффузии шумоподавления.《Вероятностные модели шумоподавления диффузии》Питер Аббил, один из соавторов этой статьи, также является инвестором Ideogram AI.

Соучредитель Читван Сахария, соавтор статьи, окончил Бомбейский технологический институт со степенью бакалавра. Он присоединился к Google в 2019 году, где в основном отвечает за руководство работой над моделью диффузии изображений.

Остальные три человека из команды основателей,Шайан АбдуллаОн работал инженером по машинному обучению в Twitter. Он оставил свою работу в апреле прошлого года и позже присоединился к Ideogram AI.

Джейкоб ЛуИнженер-программист, до прихода в Ideogram он работал в таких компаниях, как Amazon;Дженни ЛейЯ стажер по разработке программного обеспечения и проходил стажировку в Google, прежде чем присоединиться к Ideogram AI.

Видно, что Ideogram состоит из ведущих исследовательских групп диффузионных моделей и с момента своего создания получила огромную поддержку.

Начальный раунд Ideogram финансировалсяа16зиИндекс предприятийВозглавил инвестиции на сумму 16,5 миллионов долларов США (примерно 120 миллионов юаней на тот момент).

Есть также индивидуальные инвесторы, такие как Андрей Карпати, гуру обучения с подкреплением Питер Аббил и соучредитель GitHub Том Престон-Вернер.

Кроме того, в феврале этого года несколько источников сообщили, что Ideogramновый раунд финансирования

как сообщается, успешно поднят80 миллионов долларов США(приблизительно 5,7 млрд юаней) Финансирование серии A под руководством Андриссена Горовица и других участвующих инвесторов включает Index Ventures, Redpoint Ventures, Pear VC и SV Angel.

Похоже, что Ideogram, у которой есть деньги и технологии, несомненно, является темной лошадкой в ​​области картографирования ИИ.

Катитесь, продолжайте катиться.