ニュース

ミッドジャーニーを倒すために魔法のように改造された「Black Myth: Wukong」は、人々を夢中にさせます。

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

AI Ideogram がリアリズムと芸術性を競うとき、Ideogram は難しい道を切り開きました。画像上にテキストを正確に生成でき、フォントとレイアウトが美しいのです。

この需要はニッチなものではありません。P ピクチャを使用せずにワンクリックでポスターやイラストを生成できるため、手間が大幅に節約でき、デザインについて何も知らない一般の人に非常に適しています。

以前、Ideogram のバージョン 1.0 について書きました。 8月21日にはバージョン2.0が登場し、よりリアルになり、ポスターのデザインもより強化され、テキストの特殊性も強化されました。

聞いたことがないかもしれませんが、これは元 Google 従業員によって開発された AI 製品です。多くの欠点がありますが、ロングボードはコーナーでミッドジャーニーを「追い抜く」ことができます。

AI は知りたいのですが、どの悟空について話しているのでしょうか?

Ideogram には、特に初心者向けの機能「Magic Tips」があります。

中国語のプロンプト単語を直接入力すると、それを英語に翻訳し、同時に最適化することができます。海外製品として、このようなオペレーションは人々の心をつかむことができます。

同時に、Ideogram は 5 つのスタイルに焦点を当てています。普通、リアル、デザイン、3D、アニメーション、どれもわかりやすいので選択に迷うことはありません。

アニメ風の「孫悟空が黄金のこん棒を持っている」という簡単な中国語のプロンプト単語から始めて、AI に翻訳と最適化を手伝ってもらい、どのように自由に使用できるかを見てみましょう。

シュイ・リンリンの「ドラゴンボール」バージョンの悟空が登場したとき、プロンプトを見たときは衝撃を受けました。AIが孫悟空を「孫悟空」に翻訳、それなら不思議ではありません。

さらに、印税を支払うのは露骨すぎるのではないかということもIdeogramに聞きたいです。

AIによるさらなる誤解を避けるために、プロンプトワードを入力するときに怠惰になるのをやめ、「孫悟空」は「孫悟空」ではなく「孫悟空」であることを強調しました。

今回は、より詳細なシーンを再現し、鎧を着て、仏教の洞窟の前に立つ厳かな表情を表現しました。トーン、写真の下部には「Black Myth : Wukong」(黒い神話:悟空)と書かれています。

文章に間違いはなく、大文字のインパクトも強く、仏窟の雰囲気も出ていますが、「大賢者」の気質は少しずれていて、イメージも少し隔世の感があります。彼の目には光がありません。

同じプロンプト単語を使用して、 旅の途中生成されると、テキストにはエラーがあり、デザインセンスがありませんが、少しハンサムな「猿王」と Web ゲームのスタイルがそれを補っています。

旅の途中で生成されました

和解する気はなく、もう一度 3D スタイルを試してみました。プロンプトの文言は基本的に変わりませんでしたが、下部のテキストが「8 月 20 日のゲーム発売」に変更されました。

その結果、Ideogram によって生成された結果は、某中国風の Q 版ブラインドボックス シリーズのプロモーション画像に非常に似ていますが、絵は非常にきれいですが、私の頭の中の 3D ゲームのスタイルではありません。猿王もアーラン・シェンに似て描かれています。

そして AI もまた、英語のテキストのレンダリングには優れていましたが、この欠陥は 1.0 から 2.0 まで続きました。

海外の製品は国内の伝統文化を十分に理解していないように思えますが、1回戦のIdeogramの出来は少し残念でしたが、面白かったです。

Ideogram チームは、バージョン 2.0 は Flux や DallE と同じくらい優れていると述べています。最近、Flux の LoRA の本物のバージョンによって生成された TED スピーチの写真は、本物か偽物かを区別するのが難しいため、多くのネチズンを騙しました。それではテストしてみましょう。Ideogram は、より写真に近い結果を生成します。

磁束の発生

リアルなスタイルを選択した後、中国語のプロンプト単語、TED トークの写真を入力し、スライドのタイトルは「Ideogram 2.0 Release」でした。そこには「正確なテキスト」、「優れたデザイン」、「よりリアル」という 3 つのポイントがありました。女性の発言者はホワイトボードの前に立っていました。背景には数人の人がいます。

Ideogram の意味理解は良好であり、TED のロゴはほとんど偽物であり、講演者と聴衆の表情は非常に鮮明で、髪と肌は比較的自然です。

しかし、細部の処理が十分ではありませんが、生成する必要があるテキストには問題ありませんが、ランダムに表示されるいくつかの小さな文字がポットを台無しにし、文字の指や体が完全に整っていませんが、それはすでに十分です。以前のバージョン 1.0 よりも優れています。

ポスターのデザインに関しては、Ideogram は他の Vincentian AI の「コンフォートゾーン」にあると言えます。

興行収入の高い映画『エイリアン: デス・シップ』をテスト問題として使用した場合、AI はその言葉では言い表せない恐怖感をデザインできるでしょうか?

私はデザイン スタイルを選択し、絵の要素を説明するために即効性のある言葉を使用し、ポスターの下部に「未成年者は閲覧注意」という一文が書かれていることにも特に言及しました。

全体的な効果は目を引くもので、長いテキスト文字列が正常に生成されました。小さなエラーが 1 つだけありますが、現実的ではなく、漫画スタイルのように見え、実写映画とは一致しません。

そこで私は、夏の映画「赤い屋敷の夢」をインスピレーションとして、背景、装飾、さらにはプロンプトの言葉に記載されているキャラクターまですべてが含まれていると、ポスターの作成を依頼しました。即興の言葉は本当に良いです。

もちろん映画のタイトルは正しく書かれていますが、フォントは『ロード・オブ・ザ・リング』から借用したようなもので、少しドラマチックで、全体的なスタイルはアニメーション映画『ムーラン』に似ています。

Ideogramの「デザインスタイル」はより平面的でユニークですが、これは逆に言えばポスターの利用シーンを限定することにもなります。

要約すると、Ideogram は独自の特徴を持つ AI グラフィック製品です。リアルさのレベルは Flux に似ていますが、芸術的センスは Midjourney とは異なります。

「梅雨夏」柄

しかし独自のテキスト生成レベルを備えており、ポスター、イラスト、広告、絵文字、T シャツの印刷などの生成に適しています。

人間による評価の結果、プロンプトワードアライメント、全体的なパフォーマンス、テキストレンダリング品質の点で、Ideogram 2.0 が Flux Pro や DALL・E 3 よりも優れていることがわかりました。

しかし、これは Ideogram 自身の声明です

非常にプレイしやすく、現実的であるため、このような AI の「デザート」をもっと増やしてもよいでしょう

Ideogram は、2.0 のリリースからちょうど 1 年後、昨年 8 月 22 日に発表されました。

創設チームにはGoogle Brain、カリフォルニア大学バークレー校、カーネギーメロン大学、トロント大学から計7人が名を連ねており、そのうち4人はGoogleのヴィンセントグラフ拡散モデルImagenの研究論文の著者である。

Ideogramは今回2.0をリリースしたほか、中国で直接ダウンロードできるiOSアプリもリリースする予定で、Webページからモバイル端末まで、いつでもどこでも画像を生成できる。

モバイルインターフェース

Ideogram は現在、すべてのユーザーに無料で公開されていますが、割り当ては非常に限られています。合計 20 枚の写真を 5 回生成した後、Ideogram は 10 ポイントを使い果たしたので、明日もう一度来てくださいと通知しました。(もちろん、隣の Midjourney では 25 枚の写真が無料で生成されますが、それほど印象的なものではないようです。)

ヴィンセントの写真にほとんど触れない人は、1 枚欲しいと思うでしょう。ヴィンセント図AI 始めるには、Ideogram が良い選択です。

中国語のプロンプト単語を入力したり、「マジック プロンプト」を使用して翻訳したり最適化したりすることもできます。また、Ideogram には、頭の中にあるものに近いイメージを生成するためのオプションも多数あります。

ユーザーが「クリック」できる限られた範囲のオプションを提供します。空白の入力ボックスに「入力」を完了する場合に比べて、操作が簡単になります。Ideogram を使用すると、画像の比率、スタイル、トーンを自由に選択できます。

「マクドナルドを食べる真珠の耳飾りの少女」の色違い

プロンプト単語の書き方がわからない場合は、単語を描いて、Ideogram を使って日常を魔法に変えることもできます。

絵が下手で申し訳ないのですが、 AIが意味を理解し、線や色を最適化し、背景を追加すると一気にスタイルが良くなります。 AIでは、マジックペンの馬良ではない人は誰ですか?

さらに、Web 版の入力ボックスの下には、他の人が作成した作品が表示され、気に入った作品があれば、表示して参照することができます。 Ideogram によると、ユーザーは過去 1 年間で 10 億以上の公開画像を生成したという。

特定のオブジェクトを生成したいが、プロンプト単語の書き方がわからない場合は、今回 Ideogram も起動しましたパブリック オーサリング ライブラリをテキストで検索する機能ですが、この機能には現在メンバーシップが必要です。

「猫」の検索結果

総じて、Ideogram はプレイ可能な Vincent 製品です。

ユーザーが必要とするテキストコンテンツをより正確に生成し、さまざまなスタイルの画像に適応できるため、幅広い活用分野があります。

画像出典: Ideogram Blog

場合によっては、感情的な価値をもたらし、写真を通じて野心を表現することもありますが、作成された絵文字はヨーロッパやアメリカのインターネットの美学に偏りすぎています。

「『黒神話:悟空』をプレイしたい」絵文字パッケージ

Ideogram の全体的な品質は悪くなく、テキスト機能は強力で初心者に優しく、使いやすく、インタラクションは快適です。 AI ツールが創造性、利便性、価値の共有を兼ね備えていると、人々は簡単に夢中になってしまいます。

型から削り出した世界では退屈すぎる 小さなニーズを見つけ出し、それを業界初のソリューションにすることも非常に興味深いです。

世界には多くの製品があり、視聴者が増えれば、そのような AI の「デザート」もさらに増えることが期待されます。