Новости

Официально объявлен первоначальный состав новой компании StableDiffusion!Постоянно новые модели обновляют ландшафт живописи с помощью искусственного интеллекта.

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Дом возник из храма Аофэй.
Кубиты | Публичный аккаунт QbitAI

только,Первоначальная команда Stable Diffusion официально объявила о создании новой компании.

Робин Ромбах, объявивший о своем уходе из Stability AI в марте, является одним из двух главных авторов Stable Diffusion, и дюжина его первоначальных партнеров по компании официально объявили о создании группы для начала бизнеса.

Новое название компанииЛаборатория Шварцвальда, Лаборатория Шварцвальда . Сразу после своего дебюта Kuku выпустила серию из трёх моделей генерации изображений, две из которых имеют открытый исходный код.

иПоддержка китайского ввода

Каков эффект? Пользователи сети, которые видели это, сказали, что это дико!

Введите слово-подсказку и сразу проверьте эффекты экрана, данные лица и другие меры безопасности:

Девочка-подросток в лыжной маске делает оригами в сарае. Внизу изображения имеется обозначенный желтый текст. На заднем плане рамка с изображением Обамы внутри.



Сразу после просмотра этого набора изображений и текстов некоторые пользователи сети посетовали, что это лучший эффект создания изображений, который он когда-либо видел.



Особенностью этой компании является то, что она не секретна.

Сегодня было официально объявлено о создании, сегодня была выпущена серия моделей, а также было объявлено о ходе финансирования——

Завершено финансирование на сумму 32 миллиона долларов США., под руководством a16z, с инвестициями соучредителя Oculus VR Брендана Ирибе, бывшего партнера YC Гарри Тана, Тимо Айлы, возглавляющего группу исследований компьютерной графики в NVIDIA Research, выдающегося ученого Apple (бывшего главного научного сотрудника Intel Intelligent Systems) Владлена Колтуна и другие.

Можно сказать, что Шварцвальд не только получил ставки на рынке капитала, но и завоевал расположение лидеров отрасли.

Мастер искусственного интеллекта Капаси также отправил поздравительное сообщение онлайн, а также похвалил новую модель Шварцвальда:

Варигуд! Модель генерации изображений FLUX.1 с открытым исходным кодом выглядит очень мощной.



Обратите внимание, что соглашение об открытом исходном коде представляет собой свободную версию Apache2.0.

Дебют модели генерации изображений Шварцвальда

Капаси взволнован. Давайте визуально испытаем модельный эффект Шварцвальда.

Здесь Qubit выбрал пять типов эффектов генерации для отображения. Все изображения предоставлены официальными лицами, и не уточняется, какая именно модель используется.

Первый уровень — генерация текста.

Подсказка: фотография старой классной доски. На доске мелом написано: «Давайте вместе сделаем что-нибудь по-настоящему красивое» с красным меловым сердечком после слов. Солнце светит в окно.



Второй уровень — нереальная сцена + генерация текста.

Подсказка: в подводной сцене две совы сидят за красивым обеденным столом. В центре стола зажжена свеча. Две совы вместе наслаждаются вкусным ужином. Сова слева одета в смокинг, а сова справа — в красивое платье. На заднем плане проходит подводная лодка с надписью «Какой хохот» на борту. На изображении под столом внизу плавает крошечная медуза — красивое кинематографическое цифровое произведение искусства.



Третий уровень — это настоящая сцена в реальном мире.

Подсказка: фотография красивой улицы во Фрайбурге, мимо проезжает трамвай, гуляют люди и ездят на велосипедах.



Четвертый уровень — генерация реальных персонажей и персонажей аниме.

Подсказка: Фотография трех женщин на улице в центре города, их руки тянутся к камере.



Подсказка: Красивое аниме-изображение милой девочки-кошки, выглядящей подавленной и держащей в руках лист бумаги с нарисованной на нем улыбкой, она вот-вот заплачет.



Пятый уровень – генерация изображений животных.

Подсказка: рысь в лесу, сфотографированная профессиональным фотографом при ярком свете.



Совет: крупный план мифического существа, состоящего из детальных спиральных фракталов и завитков, детализированной рекурсивной текстуры кожи.



Модели серии FLUX.1

На этот раз компания Black Forest выпустила три модели серии FLUX.1: pro, dev и schnell.



FLUX.1 [pro]: Самый сильный звук в серии.

Суть серии FLUX.1 заключается в обеспечении оптимальной производительности генерации изображений с лучшим в своем классе соответствием командам, визуальным качеством, детализацией изображения и разнообразием выходных данных.

Команда Шварцвальда постепенно улучшает возможности вычислений вывода FLUX.1 [pro] в API.

Эта версия доступна через Replication и fal.ai, предлагающие специализированные и индивидуальные корпоративные решения.

FLUX.1 [dev]: Кубок серии.

Модель, допускающая некоммерческое использование, является открытой и дистиллированной.

[dev] Созданный непосредственно из [pro], он предлагает такое же качество и быстрое соответствие требованиям, но при этом более эффективен, чем стандартные модели того же размера.

Вы можете опробовать это на Huhuface или прямо на Replication или fal.ai.

FLUX.1 [schnell]: Небольшой вихрь скорости.

Самая быстрая модель серии, созданная специально для локальных разработок и индивидуальных застройщиков.

FLUX.1 [schnell] общедоступен по лицензии Apache2.0. Веса моделей можно запросить на Huohuofian. Код вывода можно найти на GitHub.

Он поддерживается ComfyUI и может использоваться напрямую, его также можно использовать через Replication или fal.ai.

Давайте иметь интуитивное чувство!

Вот три фотографии, которые представляют собой эффекты вышеупомянутой большой чашки, средней чашки и маленькой чашки под разными подсказками на тему «торт».

△Слева направо используются модели больших, средних и маленьких чашек.

После многих тестов Qubit обнаружил, что если ввести простое слово-подсказку, время, необходимое для создания изображения в профессиональной версии, составляет от 15 до 25 секунд (время создания будет отображаться под диаграммой результатов).



Black Forest заявляет, что все модели FLUX.1Оба основаны на гибридной архитектуре мультимодальных и параллельных диффузионных блоков Transformer и расширяются до параметров 12B.

Среди трех моделей FLUX.1 [pro] и [dev] превзошли Midjourney v6.0 и DALL· с точки зрения визуального качества, быстрого реагирования, гибкости размера и соотношения сторон, набора текста и разнообразия вывода E 3 (HD) и Stable. Диффузия 3-Ультра.

Команда FLUX.1 [schnell] называет «самой продвинутой многошаговой моделью на сегодняшний день».

Он не только выделяется среди аналогичных конкурентов, но и превосходит более мощные модели без сжатия, такие как Midjourney v6.0 и DALL·E 3(HD).

Вся серия FLUX.1 была специально настроена, чтобы сохранить все разнообразие выходных сигналов на этапе предварительной тренировки.

По сравнению с существующими технологиями FLUX.1 имеет следующие преимущества:



Кто-то неизбежно спросит: вы ветераны OG и основные члены Stability AI.

Так,В чем разница между вашей новой моделью и их моделью стабильной диффузии?

Члены команды-основателя ответили на Reddit:

Даже наша самая слабая модель, Schnell, имеет лучшее качество сборки и более быстрое время сборки.

Основная цель — основать новую компанию и превзойти самого себя.



Создано командой основных авторов SD

После представления информации о модели пришло время официально познакомиться с этой новой компанией.

лаборатория Шварцвальда, только сегодня объявили.

На официальном сайте компании есть слоган: Новая эра творчества.

Миссия компании — продвигать современные высококачественные модели глубокого обучения для создания изображений и видео и делать их доступными для самой широкой аудитории.

Хуадянь появляется!ИхСледующая цель очевидна: выйти в сферу создания видео.

Кроме того, это должно быть «СОТА».



Основной членРобин Ромбах, бывший научный сотрудник Stability AI.

Работая в Stability AI, он был одним из основных разработчиков модели Stable Diffusion, а также участвовал в исследованиях SDXL, SVD и других проектов.

В марте этого года Робин покинул Stability AI.

Внешний мир отметил, что его уход нанес серьезный ущерб и без того хаотичной компании-единорога — в конце концов, он является одним из двух основных игроков SD.



Оглядываясь назад, можно сказать, что Робин получил степени бакалавра и магистра физики в Гейдельбергском университете.

В 2020 году он начал обучение на степень доктора компьютерных наук в группе компьютерного зрения в Гейдельберге под руководством Бьёрна Оммера, а в 2021 году перешёл с исследовательской группой в Мюнхенский университет.

Исследования сосредоточены на создании моделей глубокого обучения, особенно систем преобразования текста в изображение.

Google Scholar имеет около 15 000 ссылок.



Кроме того, среди участников, раскрытых на официальном сайте, Андреас Блаттманн, Аксель Зауэр, Доминик Лоренц, Дастин Подель, Фредерик Бозель, Патрик Эссер, Сумит Кулал, Тим Докхорн, Ям Леви, Сион ИнглишВсе они являются общедоступными первоначальными членами Stability AI.

(Энди Холмс и Йонас Мюллер пока не нашли точной информации)



Можно сказать, что Шварцвальд - это первоначальные основные члены СД, которые ушли и снова отправились в плавание.

Неудивительно, что Аксель Зауэр переслал официальный твит и громко крикнул:

Мы все еще живы!



Еще кое-что

Какое совпадение, в тот же день Stability AI предпринял новые шаги:

Запуск новых моделей ИИСтабильный быстрый 3D, чиновники говорят, что его можно использовать вСоздавайте 3D-изображения за полсекунды

В то время как предыдущей модели требовалось несколько минут для создания 3D-изображения с аналогичными эффектами, новая модель может выполнить ту же задачу в 1200 раз быстрее, чем существующая модель.



Этот Stability AI запущен в мартеСбежавший генеральный директор Эмад Мостак, что он делает?

В июне он официально объявил о своем местонахождении. Новая компания.Шеллинг ИИ, «будет создавать и поддерживать открытый исходный код, модели и наборы данных, поддерживаемые финансированием ИИ».

Основное внимание уделяется инновационным исследованиям и тщательно сконструированному искусственному интеллекту, учитывающему культурные особенности, научному, образовательному и творческому подходу.

Три дня назад Schelling AI опубликовала первую статью из серии «Как думать об искусственном интеллекте».

Статья немного длинная. Друзья, кому интересно, могут поискать и просмотреть ее самостоятельно. Здесь я упомяну основные идеи——.

ИИ быстро развивается, продвигая открытый исходный код и открытость, а также ускоряя инновации и сотрудничество.



А как насчет того, чтобы мы все были порядочными людьми!

Твит, объявляющий о создании Шварцвальдской лаборатории, был любезно переслан бывшим генеральным директором (поместите сюда собачью голову).

Справочные ссылки:
[1]https://blackforestlabs.ai
[2]https://news.ycombinator.com/item?id=41130620
[3]https://x.com/EMostaque
[4]https://www.reddit.com/r/StableDiffusion/comments/1eds0l9/does_anyone_have_an_update_on_when_stable/
[5]https://x.com/SchellingAI/status/1818600200232927721