私の連絡先情報
郵便管理者@information.bz
2024-08-25
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
AIサークル、再びオープンブック画像生成。
一連の開発がまとめられました。
8月21日Ideogram がバージョン 2.0 を正式にリリース、より強力なテキストレンダリング機能を備えていると主張しています。
そう、これは Google AI Painting の 4 人の偉人たちがまとめて退職して起業したことで、昨年 8 月に設立されたプロジェクトであり、多くの AI の大物からの投資を受けています。
今度は表意文字もFlux へのオープンチャレンジ、関係者は人間の評価がFlux Proよりも大幅に優れていると自信を持って述べています。
ご存知のとおり、Flux は Stable Diffusion のオリジナル チームによって作成されたもので、最近、本物のような TED トークの「写真」を生成するため、大手ネットワークで人気になっています。
さらに、1週間前にGoogleは正式にリリースしました画像3, 公式評価では、DALL-E 3、Midjourney v6、Stable Diffusion 3 および他の描画モデルよりも優れたパフォーマンスを発揮すると主張されています。
おそらく刺激 (doge) のおかげで、Midjourney も移行し、8 月 22 日にすべてのユーザーに直接公開されました。無料のウェブ版。
今見るといいものがあるよ!
全員が強いと主張しているので、全員を同じテーブルに集めて対面でPKをした方が良いでしょう。
最強の描画AIは誰だ?
まずは 4 人の出場者を招待しましょう (全員 Web バージョンを使用):
出場者 No. 1: 表意文字 2.0。毎日無料で 10 ポイントがあり、1 ポイントで 4 枚の写真を生成でき、1 日に最大 40 枚の写真を生成できます。
プレイヤーNo.2:Flux.1。Black Forest は、Hugging Chat で無料のデモを公式に提供しています (FLUX.1 Schnell バージョンを選択)。
出場者No.3:イマージェン3。Image FX は無料で無制限に使用できます。
プレイヤー番号 4: 旅の途中。無料試用期間中は、合計 25 枚の写真のみを生成できます。
これから正式に競争フェーズに入ります。
黒猿たちは全部ひっくり返った
まず、これらの海外AIをテストするために中国語のプロンプト単語を理解できますか?、今日のトップブラックモンキーの人気も利用しましょう。
プロンプト: ゲームのキャラクターは猿で、鎧を着て、頭にはフェニックスの羽が付いた金色の冠をかぶり、手に金色の輪を持って崖の上に立っています。
予想通り、事故が起きてしまいました…。
誰もが一目見て3番の大きな赤十字に惹かれたと思います。そうです、同じプロンプトワードの下には Imagen 3 しかありません。ビルドリクエストが拒否されました。
これを見たとき、私たちの最初の反応は、私たちの即座の発言が著作権保護の引き金になるのではないかということでした。そこで、まずプロンプトワードの「ゲームキャラクター」を削除しましたが、結果はリマインダーを生成できませんでした。
Google Imagen 3 が中国語をサポートしていないためですか?そこで、プロンプトの言葉をより簡単なものにランダムに変更し、今度は写真を入れました。
ただ、結果は大失敗で、複数の中国語のプロンプトワードが変更され、結局は関係のないテクスチャ画像ばかりになってしまいました。
そうみたいですGoogle Imagen 3 は確かに中国語のプロンプト単語には対応していません。
3 位がリストに落ちた後、他のリストを見ると、No. 1 Ideogram 2.0 のパフォーマンスが最高。
2番はまだ中国漫画の影が見えますが、4番ミッドジャーニーは完全に手放してますね~(本題とは全く関係ありません)
最後に、Ideogram 2.0 がすべての重要な要素を正確に満たしていることを賞賛したいと思います。
それは私が心の中で望んでいることではありませんが(黒の神話が欲しいのです)、プロンプトワードの復元には実際には何の問題もありません。
それは本物の人間ですか、それともAIですか?バカ、違いが分からない
次に、各プレイヤーのコンフォートゾーンに入ります——ポートレート生成。
当時、『Midjourney』は屋上のカップルの写真でインターネットで人気を博しましたが、今では『Flux』は TED のスピーチの写真でさえインターネットで人気があります...
誰が優れていますか?答えはすぐに明らかになるでしょう。
プロンプト:赤褐色の髪の若い男性が、青緑とクリーム色のチェック柄のシャツを着て、50mm レンズで撮影し、ビンテージ感を演出しています。豊かな色彩、シャープなフォーカス、そしてレトロな魅力が漂います。
赤褐色の髪をした若者が、青緑とクリーム色のチェックのシャツを着て、レトロなスタイルで 50 mm レンズで撮影されました。色彩は豊かで、焦点はシャープで、ヴィンテージの魅力がほのかに漂っています。
まず2番と4番を見てみると、Midjourneyが勝っているのは明らかです。
詳細を見るとその2Flux.1はわずかにずれています, 服の色はあと 2 色あり、特に青と緑のチェック柄のシャツが目立ちます。
さらに、最初にImagen 3も発見しましたユニークなちょっとしたハイライト: 生成を開始する前にキーワードを丸で囲みます。
ここまでの作業が完了したので、あとは数人のプレーヤーのパフォーマンスをテストするだけです。主要な要素(青緑のチェックシャツ、50mmレンズなど)。
全体として、何人かの選手が(2 番を除いて)良いパフォーマンスを見せ、高度な回復を見せ、全員がカメラの方を向いていたことがわかります。
しかも、これがAIを使って自分で生成したものでなければ、本物の人間との違いはすぐには見分けられないでしょう。 (恥ずかしい)
最後に、出場者番号 4 のミッドジャーニーが最高のルックスを持っていると静かに言いたいと思います。
大難易度:画像表示テキスト
みんなを騙すことに成功したら、今度はAIを少し苦しめます——
写真にテキストを追加する。
この問題は長年の課題であり、AI描画のレベルを試す基準の一つにもなっている。
早速、数人の参加者に素晴らしい看板を作ってもらいましょう。読者の皆さんも、あなた自身が甲の父親役を演じてみてください。
プロンプト:ダークウッドの背景に松とヒイラギで囲まれた、スタイリッシュな文字で「Festive Season」と書かれた水平の真鍮看板。金色の文字にクローズアップで焦点が当てられています。
スタイリッシュな文字で「Festive Season」と書かれた真鍮製の水平看板が、暗い木の背景に松の枝とヒイラギに囲まれており、金色の文字に焦点を当てたクローズアップが描かれています。
ざっと見たところ、どれもかなりレベルの高いプロンプトワードが復元されているのではないでしょうか?
しかし、甲父の鋭い目つきが露見すると、2号はそれを隠すことができない。
気を付けろよ、その2Flux.1 角をカット、「Season」という単語に文字「S」がありません。
しかし、2 位を除いて、他の企業はかなり好調です。さまざまな AI 企業が好調のようです。テキストレンダリング機能あらゆる努力が払われました。
次のステップは、大根と緑の野菜については誰もが独自の好みを持っており、誰もが個人的な好みに基づいて選択することです。 (個人的にはミッドジャーニーに投票しました)
ちなみに、No.1 Ideogram は今回のモデルアップで「テキストレンダリング」機能を特別に宣伝しているので、ぜひ試してみるといいかもしれません。
マクドナルド、AI広告の要点を参照
最近、マクドナルドはフライドポテトを呼び出すために11人のAI美女を雇い、とても人気になりました~
実際、原理は比較的単純で、AI を使用してフライドポテトを宣伝するさまざまなキャラクターの写真を生成し、それをビデオにつなぎ合わせるだけです。
予想外に、その効果は驚くべきもので、Twitter だけでも、関連動画は 1,000 万回近く再生されました。
富のコードをマスターした後、私たちは正式に中国人として働き始めました。AI が農家を支援上下に歩かなければなりません〜
プロンプト:サイバーパンク風の大都市を背景に、少女が有機農産物を手に宣伝しています。
サイバーパンク風の都会的な背景の中で、少女が手にオーガニック農産物を宣伝しています。
非常に良かったです。プレーヤー番号 3 がまた「失敗」しました。しかし、この波は本当に不可解です。プロンプトの言葉は中国語でも、明らかに禁止されているものでもありません...
3 位が敗退した後、出場者 1 位の表意文字 2.0 が、白菜、トマト、紫キャベツなど、最も多様な品物をもたらしました。
そしてそれは入力した唯一のものですテキスト記号オーガニック食品を宣伝するためにここに来ましたが、彼らはとても熱心に取り組んでいるのがわかります〜
また、よく見てみると、1号だけが頑張って本人の真似をしているのに対し、2号と4号は完全に真似していることがわかります。双棘猿。
u1s1 さん、Maimai の広告スタイルで言えば、この短期間の世代では望ましい効果が得られませんでした。 (現実に近づけば幸いです)
ただし、幸いなことに、これらの AI ツールは現在無料で利用でき、何度か試すことは不可能ではありません。 🐶
急いで立ち去らないでください。実はもっと確実にお金を稼ぐ方法があります——
AIを活用してスタジオ撮影を簡単にコントロールビジネスポスター、写真家、会場、ポストプロダクションにかかる費用を節約できたら良いと思いませんか。
洗練された背景に、なめらかなリップスティックのチューブが輝き、豊かな色素と滑らかな伸びを際立たせます。シャープなフォーカスとほのかな輝きで高級感を演出します。
洗練された背景に洗練されたリップスティックのチューブが映え、強烈なカラーと滑らかな塗り心地を際立たせます。シャープなフォーカスとほんのりとしたきらめきが高級感を呼び起こします。
みなさんも試してみましょう。あなたの周りの女性に口紅を選ばなければならないとしたら、どれを選びますか? (死の試練がやってくる)
へへ、それで4番を選んだ人はいるの?
4番ミッドジャーニーのグレーは高級感がありますが、ブラックはちょっとニッチかもしれません。 (慎重に選んでください)
それとは別に、次に優れたパフォーマーは次のとおりです。イマージェン3、下のベルベット生地が高級感を醸し出しており、何より口紅の質感がとてもリアルです。
それに比べて、No. 1 と No. 2 はどちらも少し偽物っぽく、「プラスチック感」があります。
したがって、全体として、このラウンドは 3 番のプレーヤーが勝利しました。
要約すると、全体的に4人の選手のパフォーマンスは非常に良かった。中国語のプロンプトの言葉の下では、ダークホース プレイヤー Ideogram 2.0 が最高のパフォーマンスを発揮しました。
イデオグラムとは誰ですか?
今年 2 月に Ideogram はバージョン 1.0 をリリースしましたが、わずか半年後に再び進化してバージョン 2.0 をリリースしました。
実際、Ideogram と Google は密接な関係があります。
昨年 8 月に設立され、創設チームの最初の 4 人のメンバーは次のとおりです。Google Vincentian グラフ研究に関する Imagen 論文の著者。
CEO モハマド・ノルジ論文の共著者である彼は、トロント大学でコンピュータ サイエンスの博士号取得を目指して勉強しているときに、Google ML PhD Scholarship を受け取りました。
卒業後、Google Brain に入社して 7 年間勤務し、上級研究員に昇進しました。主な研究は次のとおりでした。モデルの生成。
さらに、彼は Google Neural Machine Translation チームのオリジナル メンバーであり、Hinton チームの自己教師あり対比学習フレームワーク SimCLR の共著者でもあります。
CTO ウィリアム・チャンこの論文の共著者であるChen Junle氏は、カナダのウォータールー大学とカーネギーメロン大学で学びました。
2012 年に Google に入社したとき、彼は最初に機械学習の広告プロジェクトに取り組み、その後 Google Brain に移り NLP 研究を行いました。
共同創設者ジョナサン・ホーカリフォルニア大学バークレー校で博士号を取得し卒業し、OpenAI で 1 年間働いた後、Google に入社しました。
彼は Imagen 論文の中心的な貢献者であることに加えて、ノイズ除去拡散モデルの基礎も築きました。《拡散確率モデルのノイズ除去》この論文の共著者の 1 人である Pieter Abbeel は、Ideogram AI への投資家でもあります。
共同創設者 チトワン・サハリア論文の共著者で、ボンベイ工科大学を卒業し、学士号を取得しました。2019 年に Google に入社し、主に画像間の拡散モデルの作業を主導しています。
創業チームの他の3人は、シャヤーン・アブドラ彼は Twitter で機械学習エンジニアを務めていましたが、昨年 4 月に退職し、その後 Ideogram AI に入社しました。
ジェイコブ・ルーソフトウェア エンジニアである彼は、Ideogram に入社する前は Amazon などの企業で働いていました。ジェニー・レイ私はソフトウェア エンジニアリングのインターンで、Ideogram AI に入社する前は Google でインターンをしていました。
Ideogram はトップクラスの普及モデル研究チームで構成されており、設立以来資本の恩恵を受けてきたことがわかります。
Ideogram のシードラウンドに資金提供されたのは、翻訳元そしてインデックスベンチャーズ1,650万米ドル(当時約1億2,000万元)の投資を主導した。
Andrej Karpathy 氏、強化学習の第一人者 Pieter Abbeel 氏、GitHub 共同創設者の Tom Preston-Werner 氏などの個人投資家もいます。
さらに、今年 2 月、複数の情報筋が、Ideogram が新しい資金調達ラウンド。
無事に育てられたと報告されています8,000万米ドル(約57億元) シリーズA資金調達はアンドリーセン・ホロウィッツ氏が主導し、他の参加投資家にはIndex Ventures、Redpoint Ventures、Pear VC、SV Angelが含まれる。
資金も技術もあるIdeogramがAIマッピングの分野では間違いなくダークホースであると思われる。
転がって、転がり続けてください。