私の連絡先情報
郵便管理者@information.bz
2024-08-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
新しい知恵のレポート
編集者:編集部
【新しい知恵の紹介】AI マッピング ツール Flux はインターネット全体を席巻しました。このカップルの写真は、照明、質感、髪のすべてが完璧で、リアルかつ繊細です。映像、音、口の形、AIの進化でますます完成度が高まっています!
理解できない場合は、「最近インターネット上で真実であることは他に何ですか?」と尋ねてください。
フラックスはネットワーク全体に衝撃を与えた
現在、オープンソースのヴィンセント グラフ モデル Flux がインターネット全体を席巻しています。
以下の集合写真はすべてAIが生成したものなのでしょうか?このブロガーは、自分の人生を疑うほどショックを受けました。
開口部を大きく開けた正面クローズアップでは、顔、筋肉の質感、髪の毛に欠陥は見られません。
背景の文字も非常に自然で、何の問題もないことに注意してください。
レンズが遠くなって光が暗くなったらどうなるでしょうか?それも自然なことです。
2 人の人物の明暗のコントラストが、世界的に有名な絵画の光と影の質感を生み出しています。
繊細かどうかだけで言うと、本当に非現実的ですよね?
たとえ人が増えてもフラックスは怖くない。
3 人であろうと、4 人であろうと、5 人であろうと、あるいはそれ以上であっても、その光景は紛れもないものです。
うるさいネチズンは今でも小さなバグを見つけようとしています。
一目で最も簡単に見分けられるのは AI であり、間違いなくロゴ上のテキストです。
AIの努力を感じます。
AIは人間の帽子やネックレスが何に使われるのかを理解していないなど、細かい点もいくつかあり、図面にはまだ抜け穴が存在します。
ちなみに、1年半前にネット上で話題になったMidjourney V5のカップルの写真はこんな感じ。
第二次イノベーションの波が到来
現在、インターネット全体が Flux 画像生成の嵐を巻き起こしており、人々は異口同音に「Flux は AI 画像生成を新たなレベルに引き上げた」と嘆いています。
AI マッピングがこれ以上改善されるはずがないと考えるたびに、私たちが間違いであることが再び証明されます。
このブロガーの言葉を借りれば、AI は制御不能になり、パンドラの箱が開かれつつあります。
特に、Flux の優れた画像生成機能とオープンソースのプレイアビリティは、さまざまな二次創作物、ビデオ、音声作品に優れたスペースを提供します。
話題になったこれらの TEDx スピーカーについて話す必要はありません。
このネチズンは、Flux、Kering AI、synclabs を使用して、有名な YouTube ブロガーのビデオを作成しました。
AIの痕跡はまだ残っていますが、画像や動画の進歩はすごいですね。
著者は、自分の目的は単にインターネット有名人を生み出すことではなく、自動広告、YouTube、TikTokビデオ、教育ビデオ、マーケティング、解説コースなどを制作することであると述べています。
AI が十分に高速化したとしても、リアルタイム生成が実現でき、FaceTime AI 友達や AI セラピストが現実になることが期待されています。
そう、AIの最も恐ろしいところはそのスピードだ。
AI 短編映画のレンダリングには数秒から数分しかかかりません。 AI が世界に普及することは間違いなく、誰もがそれについて楽観的です。
このネチズンは率直にこう言いました。Flux.1 と Midjourney を AI ビデオに導入した後、完璧ではありませんが、これまでに見た中で最高の AI 作品になりました。
このブロガーは Flux と LoRA を組み合わせたところ、LoRA がリアリズム画像や絵画/アート画像に対しても優れた処理効果を発揮することを発見しました。
Flux.1 と LoRA もアニメーション生成に非常に効果的で、1 台の 4090 で実行できます。
このネチズンは、1時間以内に2つの香水の広告を作成したと述べました。彼は率直にこう言いました。「私たちは AI ビデオの特異点に近づいています。」
AIの超進化はわずか18か月
ウォートン・ビジネス・スクールのAI分野の准教授は、AIが生成した最近のビデオを見て、AIは18カ月で進化を完了すると予測した。
このような見方ができる理由は、AIモデルの進化のスピードが想像を超えているからです。
たとえば、次の「飛行機内で Wi-Fi を使用しているカワウソ」の写真では、1 ~ 2 週間以内に目に見える進歩が見られます。
1 年以上経った今、AI がどのように進化しているかを見てみましょう—
カワウソの画像がよりリアルでかわいいだけでなく、携帯電話を操作するときの手の動きも完璧です。
同じ製品の進化速度を比較してみましょう。MidJourney v3 と v4 の間には非常に明らかな改善が見られます。
1秒で顔をマスクに変え、何も明かさずに口パクします
それだけでなく、最近人気のある GitHub の調査では、写真だけでライブ ストリーミングの顔を変更できると主張されています。
下のビデオでは、マスク氏が眼鏡をかけ、遅延のないリアルタイムのライブブロードキャストを開始します。
マスク氏の母親も騙されるしかなかった。
生放送のために顔を変えるためにネチズンによって使用されたボスのルカンもいます。
現在、このプロジェクトは GitHub で 14,000 個のスターを獲得し、トレンド リストに掲載されています。
プロジェクトアドレス: https://github.com/hacksider/Deep-Live-Cam
同時に、ReSyncer などのさまざまなリップシンク技術により、AI ビデオ キャラクターの口の形が非常に自然になります。
この時点で、AI がワークフロー全体を実行しました。今後、インターネット上でどんなにリアルな映像を見ても、私たちの心の中には疑問符が浮かぶかもしれない。
彩度を上げると、AI は写真に臆病さを表現します
では、AIの痕跡を鋭い目で特定する方法はあるのだろうか?
最近の AI 写真生成人気の波に乗って、Google 検索の元創設者の 1 人であるディーディは提案しました—
AI 画像を識別する最善の方法は、画像の彩度を高め、マイクのインターフェイスと歯の位置を注意深く確認することです。
たとえば、最近人気の TED スピーカーの写真では、彩度を 200% に設定すると、衝撃的な歯が見えます。
識別ツールのコードはクロードによって作成され、公開されていることに言及する価値があります。
ポータル: https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46
しかし、AI が生成した TED スピーカーの別の写真でテストしたところ、欠陥はありませんでした。
この画像では、歯は奇妙ではなく、対象の色領域でより一貫した色になっています。
Deedy 氏は、実際の画像に対して JPG 圧縮が実行されると、この一貫性が破壊される可能性があると述べました。
ネチズン:ネットワークケーブルを抜くことしかできない
AIに囲まれた「トゥルーマン・ショー」の中で暮らすとき、人類の最後の逃げ場はどこにあるのでしょうか?
おそらく、ネットワーク ケーブルを抜く時期が来たのかもしれません。
参考文献:
https://x.com/AngryTomtweets/status/1822203767728591350
https://x.com/deedydas/status/1822665923775611374
https://github.com/hacksider/Deep-Live-Cam?ContinueFlag=4be7aad2ca0a560d6f9019228a8b2d3e
https://x.com/emollick/status/1822774265390985401
https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/