소식

StableDiffusion의 새로운 회사의 원래 팀이 공식적으로 발표되었습니다!지속적인 새로운 모델이 AI 페인팅 환경을 새로 고칩니다.

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

집은 아오페이 사원(Aofei Temple)에서 유래되었습니다.
Qubits 공개 계정 QbitAI

단지,Stable Diffusion의 원래 팀은 공식적으로 새로운 회사를 발표했습니다.

지난 3월 Stability AI에서 탈퇴를 선언한 Robin Rombach는 Stable Diffusion의 주요 저자 두 명 중 한 명으로, 그의 원래 회사 파트너 십여 명이 사업을 시작하기 위해 그룹을 결성한다는 소식을 공식적으로 발표했습니다.

새로운 회사 이름블랙 포레스트 연구소, 블랙 포레스트 연구소 . Kuku는 데뷔하자마자 3개의 이미지 생성 모델 시리즈를 출시했으며 그 중 2개는 오픈 소스입니다.

그리고중국어 입력 지원

효과는 무엇입니까? 이를 본 네티즌들은 야하다고 하더군요!

프롬프트 단어를 입력하고 화면 효과, 얼굴 데이터 및 기타 보안 조치를 한 번에 테스트하십시오.

스키 마스크를 쓴 10대 소녀가 헛간에서 종이접기를 만들고 있습니다. 이미지 하단에 지정된 노란색 텍스트가 있습니다. 배경에는 오바마 사진이 담긴 액자가 있습니다.



이 사진과 글을 본 일부 네티즌들은 지금까지 본 것 중 최고의 이미지 생성 효과라고 한탄했다.



이 회사의 특징은 비밀을 숨기지 않는다는 점이다.

오늘 설립이 공식적으로 발표되었고, 오늘 일련의 모델이 출시되었으며, 자금 조달 진행 상황도 발표되었습니다.

3,200만 달러 자금 조달 완료a16z가 이끄는 Oculus VR 공동 창립자 Brendan Iribe, 전 YC 파트너 Garry Tan, NVIDIA Research에서 컴퓨터 그래픽 연구 그룹을 이끄는 Timo Aila, Apple 저명한 과학자(전 Intel 지능형 시스템 수석 과학자) Vladlen Koltun의 투자로 이루어졌습니다. 다른 사람.

블랙포레스트는 자본시장의 배팅을 받았을 뿐만 아니라 업계 리더들의 호감도 얻었다고 할 수 있다.

AI 마스터 카파시(Kapasi)도 온라인으로 축하 메시지를 보냈고 블랙 포레스트의 새로운 모델을 칭찬하기도 했습니다.

조심하세요! 오픈 소스 FLUX.1 이미지 생성 모델은 매우 강력해 보입니다.



그리고 오픈 소스 계약은 느슨한 Apache2.0이라는 점에 유의하십시오.

블랙 포레스트 이미지 생성 모델 데뷔

카파시는 검은 숲의 모형 효과를 시각적으로 경험해 보겠습니다.

여기에서 Qubit은 표시할 5가지 유형의 생성 효과를 선택했습니다. 사진은 모두 공식적으로 제공되었으며 어떤 모델이 사용되는지는 지정되지 않았습니다.

첫 번째 수준은 텍스트 생성입니다.

프롬프트 단어: 오래된 교실 칠판 사진. 칠판에 분필로 "우리 같이 정말 예쁜 걸 만들어보자"라고 적힌 뒤 빨간색 분필로 하트를 그렸다. 창문을 통해 햇빛이 들어옵니다.



두 번째 수준은 비실제 장면 + 텍스트 생성입니다.

프롬프트: 수중 장면에서는 올빼미 두 마리가 아름다운 식탁에 앉아 있고, 테이블 중앙에는 촛불이 켜져 있으며, 두 올빼미는 함께 맛있는 저녁 식사를 즐기고 있습니다. 왼쪽 부엉이는 턱시도를 입고 있고, 오른쪽 부엉이는 아름다운 드레스를 입고 있습니다. 배경에는 "What a Hoot"라는 글자가 그려진 잠수함이 지나가고 있습니다. 테이블 아래 이미지에는 바닥에서 수영하는 작은 해파리가 있는데, 이는 영화 같고 아름다운 디지털 예술 작품입니다.



세 번째 수준은 현실 세계의 실제 장면입니다.

프롬프트: 트램이 지나가고 사람들이 걷고 자전거를 타는 모습이 담긴 프라이부르크의 아름다운 거리 사진입니다.



네 번째 단계는 실제 캐릭터와 애니메이션 캐릭터의 생성이다.

프롬프트: 도심 거리에서 카메라를 향해 손을 뻗은 세 여성의 사진.



프롬프트: 귀여운 고양이 소녀가 우울해 보이고 미소가 그려진 종이를 들고 있는 아름다운 애니메이션 작품입니다. 그녀는 곧 울려고 합니다.



다섯 번째 단계는 동물 이미지 생성이다.

프롬프트: 밝은 조명 아래 전문 사진작가가 촬영한 숲 속의 살쾡이.



팁 단어: 상세한 나선형 도형과 덩굴손, 상세한 반복적 피부 질감으로 구성된 신화 속 생물의 클로즈업 렌더링



FLUX.1 시리즈 모델

이번에 블랙포레스트는 FLUX.1 시리즈의 3가지 모델인 pro, dev, schnell을 출시했습니다.



FLUX.1 [pro]: 시리즈 중 가장 강력한 사운드입니다.

FLUX.1 시리즈의 핵심은 동급 최고의 명령 준수, 시각적 품질, 이미지 디테일 및 출력 다양성을 통해 최적의 성능 이미지 생성을 제공합니다.

Black Forest 팀은 API에서 FLUX.1 [pro]의 추론 컴퓨팅 기능을 천천히 개선하고 있습니다.

이 버전은 전용 맞춤형 엔터프라이즈 솔루션을 제공하는 Replicate 및 fal.ai를 통해 액세스할 수 있습니다.

FLUX.1 [dev]: 컵 시리즈.

비상업적 사용을 허용하는 모델은 개방형 가중치 및 증류 모델입니다.

[dev] [pro]에서 직접 증류된 이 제품은 동일한 크기의 표준 모델보다 더 효율적이면서도 유사한 품질과 신속한 규정 준수를 제공합니다.

Huhuface에서 사용해 볼 수도 있고, Replicate나 fal.ai에서 직접 사용해 볼 수도 있습니다.

FLUX.1 [schnell]: 속도의 작은 회오리바람.

지역 개발 및 개인 개발자를 위해 맞춤 제작된 시리즈 중 가장 빠른 모델입니다.

FLUX.1 [schnell]은 Apache2.0 라이센스에 따라 공개적으로 사용 가능합니다. 모델 가중치는 Huohuofian에서 쿼리할 수 있습니다. 추론 코드는 GitHub에서 찾을 수 있습니다.

ComfyUI에서 지원되었으며 직접 사용할 수 있으며 Replicate 또는 fal.ai를 통해서도 사용할 수 있습니다.

직관적인 느낌을 가지자!

다음은 "케이크"를 주제로 다양한 프롬프트 단어 아래 위의 큰 컵, 중간 컵, 작은 컵의 효과를 생성한 세 장의 사진입니다.

△사용된 모델은 왼쪽부터 대형, 중형, 소형 컵이다.

많은 테스트 끝에 Qubit은 간단한 프롬프트 단어를 입력하면 프로 버전으로 사진을 생성하는 데 걸리는 시간이 15초에서 25초 사이라는 것을 발견했습니다(생성 시간은 결과 차트 아래에 표시됩니다).



Black Forest는 모든 FLUX.1 모델을 말합니다.둘 다 다중 모드 및 병렬 확산 변압기 블록의 하이브리드 아키텍처를 기반으로 하며 12B 매개변수로 확장됩니다.

세 가지 모델 중 FLUX.1 [pro]와 [dev]는 시각적 품질, 신속한 응답성, 크기/종횡비 유연성, 조판 및 출력 다양성 측면에서 Midjourney v6.0 및 DALL·을 능가했습니다. 디퓨전 3-울트라.

FLUX.1 [schnell]은 팀에서 "현재까지 가장 발전된 몇 단계 모델"이라고 불립니다.

유사한 경쟁사 중에서 단연 돋보일 뿐만 아니라 Midjourney v6.0 및 DALL·E 3(HD)와 같은 더욱 강력한 비압축 모델보다 성능이 뛰어납니다.

전체 FLUX.1 시리즈는 사전 훈련 단계의 전체 출력 다양성을 유지하도록 특별히 미세 조정되었습니다.

기존 기술과 비교하여 FLUX.1은 다음과 같은 장점이 있습니다.



누군가는 필연적으로 OG 베테랑이자 Stability AI의 핵심 멤버라고 묻습니다.

그래서,새로운 모델과 Stable Diffusion 모델의 차이점은 무엇입니까?

창립 팀원들은 Reddit에 다음과 같이 응답했습니다.

가장 약한 모델인 Schnell도 빌드 품질이 더 좋고 빌드 시간이 더 빠릅니다.

주된 목표는 새로운 회사를 설립하고 나 자신을 능가하는 것입니다.



SD 주요 작성자 팀이 제작함

모델 관련 정보를 소개한 뒤, 이번에는 새로운 회사에 대해 정식으로 알아가는 시간입니다.

검은 숲 실험실, 오늘 발표되었습니다.

회사 공식 홈페이지에는 '새로운 창조의 시대'라는 슬로건이 적혀 있다.

회사의 사명은 이미지 및 비디오 생성을 위한 최첨단 고품질 딥 러닝 모델을 발전시켜 가장 광범위한 청중이 사용할 수 있도록 하는 것입니다.

화디엔 등장!그들의다음 야망은 분명합니다. 그것은 비디오 생성 분야에 진출하는 것입니다.

또한 "SOTA"여야 합니다.



핵심멤버로빈 롬바흐, Stability AI의 전 연구 과학자.

Stability AI에서 근무하는 동안 그는 Stable Diffusion 모델의 주요 개발자 중 한 명이었고 SDXL, SVD 및 기타 프로젝트 연구에도 참여했습니다.

올해 3월 로빈은 Stability AI를 떠났습니다.

외부 세계에서는 그의 이탈이 이미 혼란스러운 유니콘 회사에 심각한 손상을 입혔다고 논평했습니다. 결국 그는 SD의 두 주요 플레이어 중 한 명입니다.



돌이켜보면 로빈은 하이델베르그 대학교에서 물리학 학사 및 석사 학위를 받았습니다.

2020년에 그는 Björn Ommer의 지도 하에 하이델베르그의 컴퓨터 비전 그룹에서 컴퓨터 과학 박사 과정을 공부하기 시작했고, 2021년에 연구 그룹과 함께 뮌헨 대학교로 옮겼습니다.

연구는 딥 러닝 모델, 특히 텍스트-이미지 시스템 생성에 중점을 둡니다.

Google Scholar에는 거의 15,000번의 인용이 있습니다.



이밖에 공식 홈페이지에 공개된 멤버 중에는 안드레아스 블랏만(Andreas Blattmann), 악셀 사우어(Axel Sauer), 도미니크 로렌츠(Dominik Lorenz), 더스틴 포델(Dustin Podel), 프레데릭 보젤(Frederic Boesel), 패트릭 에세르(Patrick Esser), 수미스 쿨랄(Sumith Kulal), 팀 독혼(Tim Dockhorn), 얌 레비(Yam Levi), 자이언 잉글리시(Zion English)가 있다.모두 공개적으로 이용 가능한 Stability AI의 원래 멤버입니다.

(Andi Holmes와 Jonas Müller는 아직 정확한 정보를 찾지 못했습니다)



블랙포레스트는 SD를 떠났다가 다시 출항한 원년 핵심 멤버들이라고 할 수 있다.

Axel Sauer가 공식 트윗을 전달하고 큰 소리로 외친 것도 당연합니다.

우리는 아직 살아있습니다!



하나 더

같은 날 Stability AI도 새로운 움직임을 보였습니다.

새로운 AI 모델 출시안정적이고 빠른 3D, 관계자는 그것이 다음에서 사용될 수 있다고 말합니다.0.5초 만에 3D 이미지 생성

이전 모델은 비슷한 효과의 3D 이미지를 생성하는 데 몇 분이 걸렸지만, 새 모델은 기존 모델보다 1,200배 빠르게 동일한 작업을 완료할 수 있습니다.



3월에 출시된 Stability AI탈출한 CEO 에마드 무스타크, 그는 무엇을 하고 있을까?

지난 6월 그는 새 회사의 소재지를 공식적으로 발표했다.셸링 AI, "AI 자금 지원으로 지원되는 오픈 소스 코드, 모델 및 데이터 세트를 구축하고 지원할 것입니다."

문화적으로 인식되고 과학적이고 교육적이며 창의적인 혁신적인 연구와 신중하게 구성된 AI에 중점을 두고 있습니다.

3일 전, Schelling AI는 "AI에 대해 생각하는 방법" 시리즈의 첫 번째 기사를 게재했습니다.

글이 좀 길어요. 관심 있는 친구들이 직접 검색해서 볼 수도 있어요. 여기서는 핵심 아이디어를 언급하겠습니다.

AI는 빠르게 발전하고 있으며 오픈 소스와 개방성을 촉진하고 혁신과 협업을 가속화하고 있습니다.



그리고 우리 모두 괜찮은 사람이 되는 건 어떨까요!

Black Forest Laboratory 설립을 알리는 트윗은 전 CEO가 친절하게 전달해주었습니다(여기에 개 머리를 넣으세요).

참조 링크:
[1]https://blackforestlabs.ai
[2]https://news.ycombinator.com/item?id=41130620
[3]https://x.com/EMostaque
[4]https://www.reddit.com/r/StableDiffusion/comments/1eds0l9/안정될 때 누구나 업데이트할 수 있나요/
[5]https://x.com/셸링AI/상태/1818600200232927721