2024-10-06
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
最新のaiヴィンセントグラフモデルフラックス1.1、一晩画面を更新しました。
たった 1 つの簡単なトリックで、次のことが可能になります。写真から「ai臭さ」を取り除く、人物も風景も写真品質の効果を実現できます。
コメント欄のネチズンの反応は、「違いが分からない、本当に違いが分からない」というものでした。
このテクニックはプロンプトワードでも非常に簡単に使用できます。一眼レフカメラのファイル命名形式を模倣するそれでおしまい。
例えば「cr2」これは、canon のカメラで使用される raw 画像ファイル形式です。「img」+乱数+「.cr2」、指定されたコンテンツを追加すると、リアルな画像を取得できます。
その後、それを試してソニーのカメラに切り替えたネチズンからもフィードバックがありました。「arw」、ニコンのカメラ「ネフ」、appleでも「ヘイック」形式にすると、良い結果が得られます。
モデルがトレーニング データから実際の写真をランダムに吐き出したのではないかと疑う人もいるほどです。
ただし、拡大して特定の詳細を見ると、たとえばナンバー プレートの文字が文字化けしていることが確かに ai によって生成されていることが簡単にわかります。
では、flux1.1 モデル自体は非常に強力なのでしょうか? このテクニックはその中でどの程度の役割を果たしているのでしょうか?
上級フォト レタッチ アーティストが、左側に img_1018.cr2 を追加した場合と、右側に img_1018.cr2 を追加しない場合の比較を投稿しました。
実際の測定結果からも、この手法を加えることで写真の忠実性が大幅に向上することがわかります。
この flux1.1 モデルを無料で試したい場合は、次の場所にアクセスしてください。一緒に.aiプラットフォームでは、サインアップ時に 5 米ドルのポイントを獲得できます。
万里の長城の観光客の自撮り写真をランダムに生成 一見それっぽく見えますが、キャラクターの肌の質感や背景の山や植物をよく見るとやはりaiの匂いがします。
「img_0314.cr2: selfie on the great wall」に置き換えると、すぐに変わりますか?
コードネーム blueberry、最新の sota vincent ダイアグラム モデル
flux1.1 の正式リリースにより、vincentian モデルのリストで繰り返し上位を占めてきた 2 つの未請求モデルが、"ブルーベリー"モデルの謎も解明され、まさにそれです。
公式はもはやそれを隠すことはなく、人工分析画像アリーナでデータを直接公開しています。flux1.1 [プロ]コードネーム「blueberry」は、他のすべてのモデルを上回り、最高の総合 elo スコアを達成しました。
それに比べて、flux1.1 [pro]さらに安くて早いです、様々な指標がmidjourney、sd3、ideogramなどを上回っています。
生成速度の点では、flux1.1 [pro] は画質、コマンド応答性、多様性の向上を維持しながら、前世代の flux.1 [pro] よりも 6 倍高速です。
ちなみに、現在はflux.1 [pro]もアップデートされており、以前より2倍、flux1.1 [pro]は3倍高速になっています。
さらに、関係者は、flux1.1 [pro] がネイティブでサポートできる種類の高速高解像度生成が間もなく開始され、コマンドの応答を犠牲にすることなく 2k 画像を生成できると述べました。
flux1.1 [pro] は、togetter.ai、replicate、fal.ai、freepik などのオンライン プラットフォームを通じて入手できます。
同時に、公式は、他の開発者が独自のアプリケーションに統合できる bfl api も開始しました。api の価格は次のとおりです。
flux.1 [dev]: 1枚あたり2.5セント(約0.18元)
flux.1 [プロ]: 1枚あたり5セント(約0.35元)
flux1.1 [プロ]: 1枚あたり4セント(約0.28元)
stable diffusion のオリジナル チームによって作成されました
flux1.1[pro]の背後にあるのは安定拡散オリジナルチーム, メンバーにはロビン・ロンバック、アンドレアス・ブラットマン、ドミニク・ロレンツなどが含まれます。
△ロビン・ロンバック
実際、安定拡散はもともと学術研究プロジェクトでした。
ビョルン・オマー教授が率いるミュンヘン大学のマシンビジョンおよび学習研究グループのメンバー数名には、ロビン・ロンバッハ氏、アンドレアス・ブラットマン氏、ドミニク・ロレンツ氏、滑走路研究者のパトリック・エッサー氏が含まれます。
研究論文が発表されてから 7 か月後、stability ai が介入して、テキストから画像への生成モデルをさらに開発するためのコンピューティング リソースを提供しました。 2022 年に、上記の論文の著者は stability ai に参加します。
チームは協力して、stable diffusion xl、stable video diffusion などを作成しました。
icml 2024 の最高の論文の 1 つである stable diffusion 3 技術論文の整流変圧器、および sdxl-turbo で使用される adversarial diffusion distillation メソッドも、このグループによって研究されています。
今年3月、これら中核研究チームメンバーが一斉に辞任したことが明らかになった。
その後、彼らは新しいチームを結成しました。黒い森の研究所(black forest laboratories) はドイツに本社を置きます。
今年の 8 月初旬に発表され、第 1 世代の vincent グラフ モデル flux.1 がリリースされました。flux.1 には、flux.1 [pro]、flux.1 [dev]、および flux.1 [schnell] の 3 つのバリエーションがあります。パフォーマンスとアクセシビリティ。
現在、black forest laboratory はシードラウンドの資金調達を完了しており、合計で3,100万米ドルを調達, アンドリーセン・ホロヴィッツが投資を主導し、他の投資家にはブレンダン・イリベ、マイケル・オーヴィッツ、ギャリー・タン、ティモ・アイラ、ヴラドレン・コルトゥンが名を連ねた。
general catalystやmätchvcからもフォローアップ投資を受けているという。
黒い森の研究所マスク氏との協力関係はまだある、その画像生成モデルを xai の grok アシスタントに導入します。
次に、チームはsotaレベルを開始することを明らかにしましたテキストからビデオへの生成モデル。
彼らはそう言われています10億ドルの評価額で1億ドルを調達中と、前回の評価額1億5,000万ドルから大幅に増加した。
pika 1.5 から meta movie gen まで、ビデオ生成トラックは今年下半期に爆発的に増加しましたが、black forest lab の追加は別のきっかけをもたらす可能性があります。