소식

처음 나왔을 때는 최강이라 불렸는데, 이 이미지 AI가 바로 그런 것 같습니다. .

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


한때 DALL·E와 Midjourney만큼 유명했던 이미지 생성 AI인 Stable Diffusion을 아직도 다들 기억하고 계십니다.

경험이 풍부한사장님이 도망가셨어요핵심 개발 멤버 사임이미지 AI 시장을 들끓게 만들었던 안정성 AI가 내부적으로 난장판이 됐다.

최근 몇 달간 이에 대해자본 사슬이 무너져 자신을 팔려고 한다그 소식은 단 한 번도 깨지지 않았습니다.


전 동아리가 난감한 상황에 처해 스스로 구제할 방법을 모색하고 있을 때, 연초에 탈퇴한 일행이 바로 그 표적이 됐다.안정된 확산새로운 회사가 설립되었습니다.블랙 포레스트 랩(검은 숲 연구소).

이달 초 새로운 회사 설립을 발표하면서,다양한 볼륨의 Vincent 다이어그램 모델 FLUX.1.

화질에 초점을 맞춘 빅 컵 프로, 속도와 화질을 모두 고려한 중형 컵 개발, 그리고 "스피드 회오리바람"으로 알려진 소형 컵 슈넬이 있습니다.

공식 웹사이트에 따르면 Dazhong Cup의 FLUX는 모든 Picture AI의 주요 기능이 되었습니다.가장 강력한 존재


시각적 품질, 크기 가변성, 출력 다양성 등 분리된 다양한 기능도 다른 모델보다 훨씬 뛰어납니다.


관계자의 말뿐만 아니라 많은 네티즌과 언론의 입에서 새로 출시된 FLUX도 도착했습니다.펀치 미드저니(Punch Midjourney), DALL·E를 걷어차다정도.


인터넷의 댓글을 읽은 후 Shichao는 관심을 갖게 되었습니다. FLUX는 정말 모두가 말하는 것처럼 강력할까요? 이번에 우리가 가져왔습니다.중간 여행, 그것을 결합하다FLUX 큰 컵그것들을 하나로 모아서 테스트해 보았습니다.

처음에는 학생들에게 수묵화를 그리도록 요구하는 워밍업을 위한 정규 시험 문제부터 시작합니다.

결과도 꽤 괜찮고, 어부, 산, 갈대 등 프롬프트 단어에 담긴 내용이 모두 그려져 있다. 그런데 여기 Midjourney에서 그린 태양은 너무 커서 일몰 같은 느낌이 들지 않습니다.

프롬프트 단어:

중국 수묵화 스타일, 전통 목선을 탄 고독한 어부가 해질녘 고요한 호수 위를 부드럽게 표류하고, 중국 수묵화 스타일, 따뜻한 푸른 색조가 잔잔한 물을 반사하고, 부드러운 붓놀림이 저녁의 고요함을 포착합니다, 저 멀리 이곳의 산들은 점점 변하는 빛 아래 실루엣, 해안가의 전통 가옥, 바람에 흔들리는 갈대, 8K 해상도, 영화 같은 느낌, 향수를 불러일으키는 평화로운 분위기

FLUX(왼쪽), Midjourney(오른쪽)


그림AI를 주목하는 친구들은 알아두세요"텍스트 생성이 너무 열악합니다"거의 모든 AI가 실패하는 지점이 바로 여기입니다. DALL·E도 이 약점을 이전에 한 번 최적화했지만 여전히 가끔씩 실수를 저지릅니다.

그런데 이번에는 FLUX가 이미 이 분야에 매우 능숙하다고 해서 텍스트를 생성할 몇 가지 프롬프트 단어를 특별히 선택해서 FLUX와 Midjorney에 던졌습니다.

먼저 프라다 상표가 붙은 가방을 각자 생성하게 했고, 최종 답변은 텍스트에 오류 없이 꽤 좋았습니다.

사진의 전반적인 효과도각각의 장점이 있습니다, FLUX는 텍스트를 정확하게 썼을 뿐만 아니라 Prada의 역삼각형 로고까지 그렸는데 Midjourney의 로고가 더 패셔너블해 보입니다.

팁: 얼음으로 만들어지고 눈과 얼음으로 둘러싸인 작은 형상이 있는 대형 흰색 "프라다" 핸드백은 prouce 잡지 광고, 고해상도 사진 및 광고에서 영감을 받은 인쇄 디자인에서 영감을 받아 패션 광고처럼 스타일링되었습니다.

FLUX(왼쪽), Midjourney(오른쪽)


다음번난이도를 높이세요, 반팔 셔츠에 레트로한 이미지를 디자인하게 하고, 영어 단어 2개를 추가해 보겠습니다.

이번에는 둘 다 큰 실수를 하지 않았지만 전반적인 효과 측면에서 Shichao는 개인적으로 Midjourney가 더 좋다고 생각합니다.

팁: 이 복고풍 영감을 받은 티셔츠 디자인은 단색 배경에 체크무늬 깃발과 "Lagertha" 및 "Semper Fi"라는 텍스트가 있는 빈티지 드래그 레이서가 특징입니다. 깃발을 들고 있는 라게르타에게는 문신이 있다. 이 예술 작품의 스타일은 그녀가 액션 포즈를 취하는 모습을 포착하여 바이킹 힘의 속도와 힘을 보여줍니다. 스포츠웨어와 굵은 텍스트 타이포그래피를 강조하는 고대비 일러스트레이션입니다.

FLUX(왼쪽), Midjourney(오른쪽)


고전적인 문제인 이미지 모델의 능력을 살펴보세요"화가"확실히 우회할 수는 없습니다.

Midjourney는 아직 조금 불안정합니다. 생성된 손은 오른쪽 그림과 같이 비교하면 설명할 수 없습니다.여분의 새끼손가락

두 이미지 모두 Midjourney에서 생성되었습니다.


솔직히 말하면 클립아트 스타일이든 사실적인 스타일이든 FLUX의 효과는 꽤 놀랍습니다.손에 흠집이 거의 없습니다.

두 이미지 모두 FLUX에 의해 생성되었습니다.


지금까지 FLUX는 일부 사진 세부 사항과 사소한 문제를 꽤 잘 처리했습니다.

물론 이미지 AI는 어느 정도 모든 사람의 상상력을 실현하는 데 도움이 되는 도구이기도 하므로 Shichao는 좀 더 많은 것을 잃었습니다.사려 깊은 알림 단어

프롬프트: 빨간 드레스를 입은 어린 소녀가 거대한 이빨과 눈을 가진 용 옆에 앉아 있습니다. 그녀는 마치 친구인 것처럼, 좋은 경찰인 것처럼 정면으로 맞섰습니다. 이 장면은 산의 눈과 바위 사이에서 발생합니다. 70년대 영화 제임스 카메론 스타일로 촬영된 늑대의 은밀한 삶.

FLUX(왼쪽), Midjourney(오른쪽)


음. . . Shichao가 기본적으로 누가 좋고 누가 나쁜지에 대한 결론을 도출하도록 도울 필요는 없습니다.한눈에 AIMidjourney를 되돌아보면 정말 실제 특수효과와 약간 비슷하다는 느낌이 들 정도입니다.

그 후 Shichao는 FLUX에게 "현대 문명의 파괴"라는 간단한 메시지를 주어 자신의 상상력이 어떤 것인지 확인했습니다.

그 결과, 이번에는그것과 Midjourney는 모두 실패했습니다.

사진 효과만 보면 미드저니가 더 좋을 것 같네요. 정말 서사적인 느낌이 잘 담겨있지만, 앞뒤로 보면 이 건물은 현대문명과 전혀 관련이 없습니다. . .

FLUX(왼쪽), Midjourney(오른쪽)


흥미롭게도 FLUX는 유명인 초상화의 과장된 캐리커처를 생성하는 데 꽤 능숙합니다. 머스크나 잡스와 마찬가지로 생성 당시 얼굴 특징이 정확하게 포착됐다.

두 이미지 모두 FLUX에 의해 생성되었습니다.


전반적인 경험을 마친 후 Shichao는 FLUX의 실제 수준이 여전히 좋다고 생각합니다.완벽한 일치는 말할 것도 없고, 그러나 그다지 나쁘지는 않습니다.

결국 Stable Diffusion의 원팀이 만든 게임이고 Midjourney와 거의 같은 계층에 속합니다.

더욱이 신생회사인 블랙포레스트는 이달 초 FLUX를 출시하면서 자금 조달 진행 상황도 공식적으로 발표해 현재는 완료됐다.3,100만 달러자금조달.

더 중요한 것은 Black Forest의 모든 사람들이 Stability AI를 떠났음에도 불구하고 중소형 FLUX 모두 오픈 소스라는 전통적인 장점을 계승하고 있다는 것입니다.

아직 끝난 게 아니다. 픽쳐 AI 출시는 따라잡기 위한 노력의 일환인 것으로 보인다. 공식 웹사이트에서는 다음 단계에 대해서도 설명했습니다.비디오 AI의 SOTA


하지만 그렇다고 해도 이미지 AI의 상용화는 거의 논의되고 있는 주제다.

블랙포레스트의 전 소유주인 안정성 AI는 상용화 문제로 난리를 피웠다. 그 자체로는 이제 오픈 소스이며 이전 Stability AI와 기본적으로 동일한 유료 모델이 있습니다.

앞으로 상용화 측면에서 또 다른 새로운 움직임이 있을지 지켜볼 수 있을 뿐입니다.

Stability AI의 기존 경로를 따르지 말고 다시 시작하세요. . .

기사 쓰기:다람쥐

편집하다:장장(Jiangjiang)

아트 에디터:쉬안쉬안

사진, 출처

플럭스、미드저니