소식

미드저니 상태가 불안정한가요? AI 드로잉계 또 다른 다크호스 등장, 4개 제품 직접 테스트

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

AI 서클, 다시 오픈북 이미지 생성.

일련의 개발이 함께 모였습니다:

8월 21일Ideogram 공식적으로 버전 2.0 출시, 더 강력한 텍스트 렌더링 기능이 있다고 주장합니다.

맞습니다. Google AI Painting의 거물 4명이 모여 사업을 시작하기 위해 작년 8월에 설립한 프로젝트입니다. 수많은 AI 거물들로부터 투자를 받았습니다.

이번에도 표의문자Flux에 대한 공개 도전, 관계자는 Flux Pro보다 인간의 평가가 훨씬 낫다고 자신있게 밝혔습니다.

아시다시피 Flux는 Stable Diffusion의 원래 팀에 의해 만들어졌으며 최근 실제처럼 보이는 TED 강연의 "사진"을 생성하기 위해 주요 네트워크에서 인기를 얻었습니다.

게다가 일주일 전에 구글이 공식적으로 발표한이미지 3, 공식 평가에서는 DALL-E 3, Midjourney v6, Stable Diffusion 3 및 기타 도면 모델보다 더 나은 성능을 발휘한다고 주장됩니다.

자극(doge)으로 인해 Midjourney도 전환되어 8월 22일에 모든 사용자에게 직접 출시되었습니다.무료 웹 버전

지금 볼만한 좋은 콘텐츠가 있습니다!

모두가 강하다고 주장하기 때문에 모두를 한 테이블에 모아 대면 PK를 하는 것이 낫습니다.

가장 강력한 그림 AI는 누구일까요?

먼저 4명의 참가자를 초대하겠습니다(모두 웹 버전 사용).

참가자 1번: 표의문자 2.0.매일 10포인트가 무료로 제공됩니다. 1포인트로 4장의 사진을 생성할 수 있으며 하루 최대 40장의 사진을 생성할 수 있습니다.

2번 선수: Flux.1.Black Forest는 공식적으로 Hugging Chat에 대한 무료 데모를 제공합니다(FLUX.1 Schnell 버전 선택).

참가자 번호 3: Imagen 3.Image FX에서 무료로 무제한 사용 가능

4번 플레이어: Midjourney.무료 평가판 기간 동안에는 총 25장의 사진만 생성할 수 있습니다.

이제 공식적으로 경쟁 단계에 들어갑니다.

검은 원숭이들이 다 뒤집어졌어

첫째, 이러한 외국 AI를 테스트하기 위해서는중국어 프롬프트 단어를 이해합니까?, 오늘의 최고 검은 원숭이의 인기도 활용합시다.

프롬프트: 게임 캐릭터는 갑옷을 입고 머리에 봉황 깃털이 달린 황금 왕관을 쓰고 손에 황금 고리를 들고 절벽 위에 서 있는 원숭이입니다.

예상대로 사고가 났는데..

다들 첫눈에 3번의 커다란 적십자에 매료되셨을 거라 믿습니다. 맞습니다. 동일한 프롬프트 단어 아래에는 Imagen 3만 있습니다.빌드 요청이 거부되었습니다.

이것을 봤을 때 나의 첫 반응은 우리의 즉각적인 말이 저작권 보호를 유발하는지 여부였습니다. 그래서 먼저 프롬프트 단어에서 '게임 캐릭터'를 삭제했는데 결과적으로 알림이 생성되지 않는 결과가 나왔습니다.

Google Imagen 3가 중국어를 지원하지 않기 때문인가요? 그래서 프롬프트 단어를 좀 더 간단한 단어로 임의로 변경했는데, 이번에는 그림이 있었습니다.

단지 그 결과가 큰 실수였고, 중국어 프롬프트 단어가 여러 개 변경되어 결국 모두 관련 없는 질감 사진이 되었을 뿐입니다.

것 같다Google Imagen 3는 실제로 중국어 프롬프트 단어에 적합하지 않습니다.

3번이 목록에 실패한 후 나머지를 보면1위 표의 문자 2.0이 가장 잘 작동합니다.

2화는 아직 중국만화의 그림자가 남아있는데 4화 미드저니는 완전히 빠져버렸네요~ (주제는 전혀 관련이 없습니다)

마지막으로 모든 핵심 요소를 정확하게 구현한 Ideogram 2.0을 칭찬하고 싶습니다.

비록 마음속으로 원하는 것은 아니지만(Black Mythology를 원함) 프롬프트 단어를 복원하는 데에는 실제로 아무런 문제가 없습니다.

실제 사람인가요 아니면 AI인가요? 바보야, 난 구별을 못하겠어

다음으로, 각 플레이어의 편안한 영역에 들어가십시오.초상화 생성

예전에는 미드저니(Midjourney)가 옥상에 있는 커플 사진으로 인터넷에서 인기를 끌었지만, 지금은 플럭스(Flux)가 TED 연설 사진으로 인터넷을 휩쓸었습니다...

누가 더 낫나요? 답은 곧 공개됩니다.

프롬프트: 짙은 갈색 머리, 청록색과 크림색 체크 무늬 셔츠를 입은 젊은이, 빈티지 룩을 위해 50mm 렌즈로 촬영. 풍부한 색상, 선명한 초점, 레트로한 매력의 터치.

적갈색 머리에 청록색과 크림색 체크무늬 셔츠를 입은 청년이 복고풍 스타일의 50mm 렌즈로 포착되었습니다. 색상이 풍부하고 빈티지한 매력이 살짝 가미되어 초점이 선명합니다.

2번과 4번을 먼저 보면 Midjourney가 승리한 것이 확실합니다!

자세한 내용을 보면 2번Flux.1이 약간 꺼져 있음, 옷의 색상이 두 가지 더 있는데 파란색과 녹색 체크 무늬 셔츠 중에서 특히 눈에 띕니다.

게다가 우리는 처음에 Imagen 3도 발견했습니다.독특한 작은 하이라이트: 생성이 시작되기 전에 키워드에 동그라미를 치세요.

수행된 작업을 통해 우리는 여러 플레이어의 성능을 테스트할 수 있습니다.핵심 요소(청록색 체크무늬 셔츠, 50mm 렌즈 등).

전체적으로 몇몇 선수들이 좋은 성적을 냈고(2번 제외) 회복도가 높았으며 모두가 카메라를 바라보고 있었습니다.

더욱이 이것들이 제가 AI를 이용해 직접 생성한 것이 아니라면 실제 사람과의 차이를 단번에 구분할 수 없을 것입니다. (부끄러운)

마지막으로 4번 참가자 미드저니의 외모가 가장 멋지다고 조용히 말씀드리고 싶습니다.

큰 난이도: 그림 표시 텍스트

모두를 속이는 데 성공한 후에는 AI에게 조금 고통을 주어야 할 차례입니다——

그림에 텍스트 추가

이 문제는 늘 오랜 문제였으며, AI 드로잉 수준을 테스트하는 기준 중 하나가 되기도 했습니다.

더 이상 고민하지 말고 몇 명의 참가자가 멋진 광고판을 만들도록 합시다. 독자 여러분도 A당의 아버지로서의 자신의 역할을 가지고 오시기 바랍니다.

프롬프트: 세련된 글씨체로 '축제 시즌'이라고 적힌 수평 황동 간판. 어두운 나무 배경 위에 소나무와 홀리로 둘러싸여 있고, 금색 글자에 클로즈업이 초점이 맞춰져 있습니다.

세련된 문자로 '축제 시즌'이라고 적힌 수평 황동 간판은 어두운 나무 배경에 소나무 가지와 호랑가시나무로 둘러싸여 있으며, 금색 글자에 초점을 맞춘 클로즈업입니다.

얼핏 보면 다들 꽤 괜찮은 말을 많이 복원한 것 같죠?

하지만 A씨 아버지의 날카로운 눈빛이 한번 드러나면 2호는 이를 숨길 수 없다.

주목하세요, 2번Flux.1 컷 코너, "Season"이라는 단어에 문자 "S"가 없습니다.

하지만 2위를 제외하면 다른 회사들도 꽤 괜찮은 편인 것 같습니다.텍스트 렌더링 기능모든 노력이 이루어졌습니다.

따라서 다음 단계는 모든 사람이 무와 녹색 채소에 대한 자신만의 선호도를 갖고 있으며, 모두가 개인 취향에 따라 선택하는 것입니다. (개인적으로 Midjourney에 투표했습니다)

그런데 No.1 Ideogram은 이번 모델 업그레이드에서 "텍스트 렌더링" 기능을 특별히 홍보했습니다.

AI광고의 총체, 맥도날드 참고

최근 맥도날드는 인공지능 미녀 11명을 고용해 감자튀김을 불러내는데 큰 인기를 끌었어요~

사실 원리는 비교적 간단합니다. AI를 사용하여 감자튀김을 홍보하는 다양한 캐릭터의 사진을 생성한 다음 이를 비디오로 연결하는 것뿐입니다.

예상외로 그 효과는 놀라웠습니다. 트위터에서만 관련 동영상이 거의 천만 조회수를 기록했습니다.

부자 코드를 마스터한 후, 우리는 공식적으로 중국인으로서 일을 시작했습니다.AI가 농부를 돕는다위아래로 걸어야해요~

프롬프트: 사이버펑크 스타일의 대도시를 배경으로 한 소녀가 손에 유기농 농산물을 홍보하고 있습니다.

사이버펑크 스타일의 도시를 배경으로 한 소녀가 손에 든 유기농 농산물을 홍보하고 있습니다.

아주 좋아, 3번 선수가 또 "실패"했습니다. 하지만 이 물결은 정말 당혹스럽습니다. 프롬프트의 단어는 중국어도 아니고 명백하게 금지된 것도 아닙니다.

3번이 탈락한 후, 1번 참가자는 표의문자 2.0을 통해 배추, 토마토, 적양배추 등 가장 다양한 상품을 가져왔습니다.

그리고 그것은 입력한 유일한 것입니다텍스트 기호유기농식품 홍보하러 왔는데 정말 열심히 하시는 모습이 보이네요~

게다가 자세히 보면 1번만이 실제 인물을 흉내내기 위해 최선을 다하고 있는 반면, 2번과 4번은 완전히두 개의 가시를 가진 원숭이

u1s1, 마이마이의 광고 스타일을 참고로 하면, 이 단기 세대는 원하는 효과를 얻지 못했습니다. (현실에 더 가까워지길 바랍니다)

그러나 다행스럽게도 이러한 AI 도구는 현재 무료로 제공되므로 여러 번 사용해 보는 것이 불가능하지 않습니다. 🐾

서두르지 마세요. 실제로는 더 확실한 돈 버는 방법이 있습니다——

AI를 사용하여 스튜디오 촬영을 쉽게 제어비즈니스 포스터, 사진 작가, 장소 및 후반 작업에 드는 비용을 절약하는 것이 좋지 않을까요?

세련된 립스틱 튜브가 세련된 배경에 반짝이며 풍부한 색소와 매끄러운 글라이드를 강조합니다. 날카로운 초점과 약간의 쉬머로 고급스러움을 연출합니다.

매끈한 립스틱 튜브가 세련된 배경에 빛을 발하며 강렬한 컬러와 부드러운 발림성을 강조합니다. 선명한 초점과 반짝이는 터치로 럭셔리한 느낌을 불러일으킵니다.

여러분, 주변 여성에게 립스틱을 고른다면 어떤 립스틱을 선택하시겠습니까? (사망 테스트가 다가오고 있습니다)

ㅎㅎ 그럼 혹시 4번 선택하신 분 계신가요?

4호 미드저니의 그레이 컬러는 굉장히 고급스러워 보이지만, 블랙 컬러는 다소 틈새적일 수 있습니다. (신중하게 선택하세요)

그 외에도 다음으로 뛰어난 성과를 낸 사람은 다음과 같습니다.이미지 3, 밑에 벨벳 원단이 고급스러운 느낌을 주고, 무엇보다 립스틱의 질감이 정말 리얼해요.

이에 비해 1번과 2번은 모두 '플라스틱 느낌'이 있어 약간 가짜처럼 보입니다.

따라서 이번 라운드에서는 전체적으로 3번 선수가 승리했습니다.

정리하자면, 네 선수의 전반적인 경기력은 매우 좋았습니다. 중국어 프롬프트에서는 다크호스 플레이어 Ideogram 2.0이 가장 좋은 성능을 보였습니다.

표의문자는 누구입니까?

올해 2월 아이디오그램은 1.0 버전을 출시했고, 불과 반년 만에 다시 진화해 2.0 버전을 출시했다.

실제로 Ideogram과 Google은 밀접한 관련이 있습니다.

지난해 8월 창립된 창립팀의 초기 멤버는 4명이다.Google Vincentian 그래프 연구에 관한 Imagen 논문 작성자

CEO 모하마드 노루지논문의 공동 저자인 그는 토론토 대학에서 컴퓨터 과학 박사 과정을 공부하는 동안 Google ML 박사 장학금을 받았습니다.

졸업 후 구글 브레인(Google Brain)에 입사해 7년간 근무하며 수석 연구원으로 승진했다.모델 생성

또한 그는 Google 신경망 기계 번역 팀의 초기 멤버이자 Hinton 팀의 자기 지도 대조 학습 프레임워크 SimCLR의 공동 저자입니다.

CTO 윌리엄 찬논문의 공동 저자인 Chen Junle(첸 준러)은 캐나다 워털루 대학교와 카네기 멜론 대학교에서 공부했습니다.

2012년 Google에 합류하면서 처음에는 머신러닝 광고 프로젝트에 참여했고 그 후 Google Brain으로 옮겨 NLP 연구를 진행했습니다.

공동 창립자 조나단 호, UC Berkeley에서 박사 학위를 취득하고 OpenAI에서 1년 동안 근무한 후 Google에 합류했습니다.

그는 Imagen 논문의 핵심 기고자일 뿐만 아니라 노이즈 제거 확산 모델의 기초도 마련했습니다.《잡음 제거 확산 확률 모델》본 논문의 공동 저자 중 한 명인 Pieter Abbeel도 Ideogram AI의 투자자입니다.

공동 창업자 치트완 사하리아논문의 공동 저자인 그는 Bombay Institute of Technology에서 학사 학위를 취득했습니다. 그는 2019년에 Google에 입사하여 주로 이미지 간 확산 모델 작업을 주도하고 있습니다.

창립팀의 나머지 세 사람은샤얀 압둘라그는 트위터의 머신러닝 엔지니어였으며 지난해 4월 직장을 그만두고 나중에 Ideogram AI에 합류했습니다.

제이콥 루소프트웨어 엔지니어인 그는 Ideogram에 합류하기 전에 Amazon과 같은 회사에서 근무했습니다.제니 레이저는 소프트웨어 엔지니어링 인턴으로 Ideogram AI에 합류하기 전에 Google에서 인턴을 했습니다.

Ideogram은 상위확산모델 연구팀으로 구성되어 있으며, 창립 초기부터 자본의 호의를 받아왔음을 알 수 있다.

Ideogram의 시드 라운드는 다음에서 자금을 지원 받았습니다.a16z그리고인덱스 벤처스1,650만 달러(당시 약 1억 2,000만 위안)의 투자를 주도했습니다.

Andrej Karpathy, 강화 학습 전문가 Pieter Abbeel, GitHub 공동 창립자 Tom Preston-Werner와 같은 개인 투자자도 있습니다.

또한 올해 2월에는 여러 소식통을 통해 Ideogram이새로운 자금 조달

성공적으로 모금됐다고 한다미화 8천만 달러(약 57억 위안) Andreessen Horowitz가 주도하는 시리즈 A 파이낸싱과 기타 참여 투자자로는 Index Ventures, Redpoint Ventures, Pear VC 및 SV Angel이 있습니다.

AI 매핑 분야에서는 돈과 기술을 갖춘 아이디오그램이 의심할 여지 없이 다크호스인 것 같다.

굴러, 계속 굴러.