소식

Midjourney를 물리치기 위해 마법으로 수정된 "Black Myth: Wukong"입니다. 이 AI 그림 유물은 사람들을 중독시킵니다.

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

AI Ideograms가 현실감과 예술성을 놓고 경쟁할 때 Ideogram은 까다로운 길을 열었습니다. 즉, 그림에서 텍스트를 정확하게 생성할 수 있고 글꼴과 레이아웃이 아름답습니다.

이 수요는 틈새 시장이 아닙니다.P-픽처를 사용하지 않고 한 번의 클릭으로 포스터와 일러스트레이션을 생성할 수 있어 많은 수고가 줄어들고 디자인에 대해 전혀 모르는 일반 사람들에게 매우 적합합니다.

우리는 이전에 Ideogram 버전 1.0에 대해 글을 썼습니다. 8월 21일 버전 2.0이 나왔습니다. 현실감이 더 좋아졌고, 포스터 디자인도 더 좋아졌으며, 텍스트의 특수 능력도 더 강해졌습니다.

들어본 적도 없을 겁니다. 구글 출신 직원들이 개발한 AI 제품이라 부족한 점이 많지만, 코너에서는 롱보드가 미드저니를 '추월'할 수 있습니다.

AI는 당신이 말하는 오공이 누구인지 알고 싶어합니다.

Ideogram에는 특히 초보자에게 친숙한 기능인 "Magic Tips"가 있습니다.

중국어 프롬프트 단어를 직접 입력하시면, 이를 영어로 번역하는 동시에 최적화하는데 도움이 됩니다. 해외 제품으로서 이런 운영은 사람들의 마음을 사로잡을 수 있습니다.

동시에 Ideogram은 다섯 가지 스타일에 중점을 둡니다.평범,실감,디자인,3D,애니메이션, 모두 이해하기 쉽기 때문에 선택이 혼란스럽지 않습니다.

간단한 중국어 프롬프트 단어인 "황금 곤봉을 들고 있는 Sun Wukong", 애니메이션 스타일로 시작하겠습니다. AI가 이를 번역하고 최적화하는 데 도움을 주고 어떻게 자유롭게 사용할 수 있는지 살펴보겠습니다.

Shui Lingling의 "드래곤볼" 버전의 오공이 나왔을 때 프롬프트를 보고 충격을 받았습니다.AI는 손오공을 '손오공'으로 번역했다., 그러면 놀라운 일이 아닙니다.

게다가 로열티를 지불하는 것이 너무 노골적인 것인지도 Ideogram에 묻고 싶습니다.

AI의 추가 오해를 피하기 위해 프롬프트 단어를 입력할 때 게으름을 멈추고 '손오공'이 '손오공'이 아니라 '손오공'임을 강조했습니다.

이번에는 사실적인 스타일을 채택해 좀 더 디테일한 장면을 연출했습니다. 대현자는 갑옷을 입고 황금 고리를 손에 쥐고 있으며, 따뜻한 오렌지색 옷을 입고 엄숙하고 장엄한 표정을 짓고 있습니다. 톤, 사진 하단에 "Black Myth"라고 적혀 있습니다. : Wukong"(Black Myth: Wukong).

본문에 실수도 없고 대문자의 임팩트도 강하고 석굴의 분위기도 연출되고 있습니다만, '대현자'의 기질이 좀 어긋나고, 이미지도 좀 격세적이고, 그의 눈에는 빛이 없습니다.

동일한 프롬프트 단어를 사용하여 중간 여행일단 생성되면 텍스트에 오류가 있고 디자인 감각이 없지만 조금 더 잘 생긴 "몽키 킹"과 웹 게임 스타일이 이를 보완합니다.

중간에 생성됨

화해하기가 싫어서 3D 스타일을 다시 시도했습니다. 프롬프트 문구는 기본적으로 그대로 유지했지만, 하단의 텍스트는 "8월 20일 게임 출시"로 변경되었습니다.

결과적으로 Ideogram에서 생성된 결과는 블라인드 박스 시리즈의 특정 중국 스타일 Q 버전의 홍보 이미지와 매우 유사합니다. 그림은 매우 깨끗하지만 내 마음에는 전혀 3D 게임 스타일이 아닙니다. 원숭이 왕은 또한 얼랑 션(Erlang Shen)처럼 보이도록 그려져 있습니다.

그리고 AI도 자신을 드러냈다. 영어 텍스트 렌더링에는 매우 능숙했지만 중국어에 대해서는 전혀 몰랐습니다. 이 결함은 1.0에서 2.0까지 계속되었습니다.

해외제품은 국내 전통문화를 충분히 이해하지 못하는 것 같습니다. 1라운드에서의 Ideogram의 성과는 다소 실망스럽기도 했지만 흥미로웠습니다.

Ideogram 팀은 버전 2.0이 Flux 및 DallE만큼 훌륭하다고 말했습니다. 최근 플럭스의 LoRA 실제 버전으로 생성된 TED 연설 사진은 진짜인지 가짜인지 구별하기 어려워 많은 네티즌들을 속였습니다. 그럼 테스트해 보겠습니다.표의문자는 사진과 더 유사한 결과를 생성합니다.

플럭스 생성

사실적인 스타일을 선택한 후 중국어 프롬프트 단어와 TED 토크 사진을 입력했는데 슬라이드 제목이 "Ideogram 2.0 Release"였습니다. 거기에는 "정확한 텍스트", "디자인이 좋다", "더 현실적입니다"라는 세 가지 핵심 사항이 있었습니다. ". 여성 발표자가 섰습니다. 화이트보드 앞에는 배경에 몇 명의 사람들이 있습니다.

표의문자의 의미적 이해가 좋고, 필요한 요소를 모두 갖추고 있음을 알 수 있습니다. TED 로고는 거의 가짜이고, 발표자와 청중의 표정이 매우 생생하며, 머리카락과 피부가 비교적 자연스럽습니다.

하지만,생성해야 하는 텍스트에는 문제가 없지만 무작위로 나타나는 일부 작은 문자가 냄비를 망치고 문자의 손가락과 신체가 꽤 맞지 않지만 이미 많은 세부 사항이 충분히 처리되지 않았습니다. 이전 1.0 버전보다 좋아졌습니다.

포스터 디자인에 관해서는 Ideogram이 다른 Vincentian AI의 "컴포트 존"에 있다고 말할 수 있습니다.

흥행작 '에일리언: 죽음의 배'를 테스트 문제로 활용한다면, 그 형용할 수 없는 공포감을 AI가 설계할 수 있을까?

디자인 스타일을 선택하고, 그림의 요소를 설명하기 위해 즉각적인 단어를 사용했으며, 포스터 하단에 '미성년자는 주의해서 시청하세요'라는 문장을 썼다고 구체적으로 언급했습니다.

전체적인 효과가 눈길을 끌고, 긴 문자열이 성공적으로 생성되었습니다. 작은 오류가 하나 있지만 현실적이지 않고 실사 영화와 일치하지 않는 만화 스타일에 가깝습니다.

그러다가 나쁜 여름 영화 '붉은 저택의 꿈'을 영감으로 삼아 이디오그램에 포스터 제작을 요청했는데, 프롬프트 단어에 언급된 배경과 장식, 심지어 캐릭터까지 모두 포함되어 있어 추종성이 높다는 점을 다시 한 번 한탄했습니다. 즉각적인 말이 정말 좋습니다.

물론 영화 제목은 제대로 썼지만, 폰트는 반지의 제왕에서 빌려온 것 같고, 좀 드라마틱하고 전체적인 스타일은 뮬란 애니메이션 영화에 더 가깝습니다.

Ideogram의 "디자인 스타일"은 더욱 2차원적이고 독특하지만, 이는 반대로 포스터의 사용 시나리오를 제한하기도 합니다.

요약하자면,Ideogram은 AI 그래픽 제품으로 플럭스와 비슷하지만, 미드저니와는 예술적인 감각이 다릅니다.

"비오는 여름" 패턴

하지만고유한 텍스트 생성 수준을 가지며 포스터, 일러스트레이션, 광고, 이모티콘, 티셔츠 인쇄 등을 생성하는 데 더 적합합니다.

인간의 평가 결과, 신속한 단어 정렬, 전반적인 성능 및 텍스트 렌더링 품질 측면에서 Ideogram 2.0이 Flux Pro 및 DALL·E 3보다 우수한 것으로 나타났습니다.

하지만 이것은 Ideogram 자체의 진술입니다.

플레이 가능성이 높고 현실적이므로 이와 같은 AI "디저트"가 더 많을 수도 있습니다.

표의문자는 2.0이 출시된 지 정확히 1년 후인 지난해 8월 22일 발표됐다.

창립팀은 Google Brain, University of California, Berkeley, Carnegie Mellon University 및 University of Toronto 출신 총 7명으로 구성되어 있으며, 그 중 4명은 Google Vincent 그래프 확산 모델 Imagen 연구 논문의 저자입니다.

Ideogram은 이번 2.0 출시에 이어 중국에서도 직접 다운로드할 수 있는 iOS 앱도 출시했습니다. 추후 안드로이드 버전도 출시할 예정입니다. 웹페이지부터 모바일 단말기까지 언제 어디서나 이미지를 생성할 수 있습니다.

모바일 인터페이스

Ideogram은 현재 모든 사용자에게 무료로 공개되어 있지만 할당량이 매우 제한되어 있습니다. 총 20장의 사진을 5번 생성한 후 Ideogram에서 10포인트가 소진되었으니 내일 다시 방문해 주세요.(물론 옆집 미드저니(Midjourney)에서는 25장의 사진을 무료로 생성하는데, 그다지 인상적이지는 않은 것 같다.)

빈첸시안 사진을 접하는 일이 거의 없다면, 하나쯤 갖고 싶습니다.빈첸시안 다이어그램 AI 시작하려면 Ideogram이 좋은 선택입니다.

중국어 프롬프트 단어를 입력하고 "마법 프롬프트"를 사용하여 번역하고 최적화하는 것 또한 Ideogram에는 여러분이 원하는 것에 더 가까운 이미지를 생성하는 데 도움이 되는 많은 옵션이 있습니다.

사용자가 "클릭"할 수 있는 제한된 범위의 옵션을 제공합니다.빈 입력 상자에 "입력"을 완료하는 것에 비해 상호 작용이 더 간단합니다.원하는 그림 비율, 스타일, 톤이 무엇이든 Ideogram을 사용하면 선택할 수 있습니다.

"진주귀걸이를 하고 맥도날드를 먹는 소녀"의 다양한 모습

프롬프트 단어를 작성하는 방법을 모른다면 단어를 그려서 Ideogram을 사용하여 일상적인 단어를 마법으로 바꿀 수도 있습니다.

제 그림실력이 부족한게 아쉽지만 AI가 의미를 이해하고 선과 색상을 최적화하고 배경을 추가하면 스타일이 갑자기 좋아집니다. AI와 함께 마술 펜 Ma Liang이 아닌 사람은 누구입니까?

또한, 웹 버전의 입력란 아래에는 다른 사람이 생성한 작품이 있는데, 마음에 드는 작품이 있으면 프롬프트 단어를 보고 참조할 수 있습니다. Ideogram은 사용자들이 지난 해 공개적으로 볼 수 있는 이미지를 10억 ​​개 이상 생성했다고 밝혔습니다.

특정 객체를 생성하고 싶지만 프롬프트 단어를 어떻게 작성해야 할지 모르겠다면, 이번에도 Ideogram이 출시되었습니다.공개 저작 라이브러리를 텍스트로 검색하는 기능이 있지만 이 기능을 사용하려면 현재 멤버십이 필요합니다.

"고양이"에 대한 검색 결과입니다.

전체적으로 Ideogram은 플레이 가능한 Vincent 제품입니다.

사용자가 요구하는 텍스트 콘텐츠를 보다 정확하게 생성할 수 있으며 다양한 스타일의 사진에 적응할 수 있습니다. 채용 분야가 넓습니다.

이미지 출처: 표의문자 블로그

때로는 사진을 통해 감정적 가치를 가져오고 야망을 표현할 수도 있지만, 생산된 이모티콘은 유럽과 미국 인터넷의 미학에 너무 편향되어 있습니다.

"'흑신화:오공'을 플레이하고 싶어요" 이모티콘 패키지

Ideogram의 전반적인 품질은 나쁘지 않으며 텍스트 기능은 강력하고 초보자에게 친숙하며 사용하기 쉽고 상호 작용이 즐겁습니다. AI 도구에 창의성, 편의성, 공유 가치가 결합되면 사람들은 쉽게 매료될 수 있습니다.

틀을 깎아 만든 세상은 너무 지루합니다. 작은 요구 사항을 파악하고 업계 최초로 솔루션을 만드는 것도 매우 흥미롭습니다.

세상에는 많은 제품이 있고, 더 많은 청중이 있을수록 그러한 AI "디저트"도 더 많이 기대할 수 있습니다.