berita

Ia dijuluki sebagai yang terkuat saat pertama kali keluar, namun gambar AI ini tampaknya hanya itu. .

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Semua orang masih ingat Difusi Stabil, AI generasi gambar yang pernah setenar DALL·E dan Midjourney.

berpengalamanBos melarikan diriAnggota inti pembangunan mengundurkan diri, Stabilitas AI, yang dulunya mengobarkan citra pasar AI, kini menjadi berantakan secara internal.

Dalam beberapa bulan terakhir, tentang hal ituRantai modal putus, berusaha menjual diriBerita itu tidak pernah tersiar.


Ketika mantan klub berada dalam situasi yang memalukan dan berusaha mencari cara untuk menyelamatkan diri, kelompok anggota yang hengkang di awal tahun justru menjadi sasarannya.Difusi StabilSebuah perusahaan baru didirikanLaboratorium Hutan Hitam(Laboratorium Hutan Hitam).

Baru di awal bulan ini, ketika mereka mengumumkan pendirian perusahaan baru, mereka pun melepasnyatigaDiagram Vincent model FLUX.1 dengan volume berbeda.

Ada cup pro besar yang berfokus pada kualitas gambar; cup medium dev yang memperhitungkan kecepatan dan kualitas gambar; dan cup schnell kecil yang dikenal sebagai "kecepatan angin puyuh".

Menurut situs resmi mereka, FLUX Piala Dazhong telah menjadi fitur utama dari semua AI gambar.Eksistensi yang paling kuat


Berbagai kemampuan yang dipisahkan, seperti kualitas visual, variabilitas ukuran, keragaman keluaran, dll., juga jauh lebih baik dibandingkan model lainnya.


Tak hanya pejabatnya yang mengatakan demikian, namun di mulut banyak netizen dan media, FLUX yang baru dirilis juga telah hadir.Pukulan Tengah Perjalanan, tendang DALL·Ecakupan.


Membaca komentar di Internet menggelitik minat Shichao. Apakah FLUX benar-benar sekuat yang dikatakan semua orang? Kali ini kami menghadirkannyatengah perjalanan, gabungkan denganSecangkir besar FLUXSatukan semuanya dan ujilah.

Pada awalnya, kita akan mulai dengan soal tes biasa untuk pemanasan, meminta mereka menggambar lukisan tinta Cina.

Hasilnya lumayan bagus, dan semua isi kata-kata cepat seperti nelayan, gunung, alang-alang, dll tergambar. Namun, matahari yang dilukis di sini di Midjourney agak terlalu besar, dan tidak terasa seperti matahari terbenam.

Kata-kata cepat:

Gaya lukisan tinta Tiongkok, seorang nelayan sendirian di perahu kayu tradisional melayang lembut di danau yang tenang saat matahari terbenam, gaya lukisan tinta Tiongkok, warna biru hangat mencerminkan air yang tenang, sapuan kuas lembut menangkap ketenangan malam, jauh Pegunungan di sini adalah siluet dalam cahaya yang berangsur-angsur berubah, gubuk tradisional di tepi pantai, alang-alang bergoyang tertiup angin, resolusi 8K, perasaan seperti film, suasana nostalgia dan damai

FLUX (kiri), Tengah perjalanan (kanan)


Teman-teman yang memperhatikan gambar AI harus mengetahuinya"Pembuatan teks terlalu buruk"Di sinilah hampir semua AI gagal. DALL·E juga telah mengoptimalkan kelemahan ini sebelumnya, namun terkadang masih membuat kesalahan.

Tapi kali ini, dikatakan bahwa FLUX sudah sangat mahir dalam bidang ini, jadi saya secara khusus memilih beberapa kata cepat untuk menghasilkan teks dan melemparkannya ke sana dan Midjorney.

Pertama, biarkan mereka masing-masing membuat tas dengan merek dagang Prada, dan jawaban akhirnya cukup bagus, tanpa kesalahan teks.

Efek keseluruhan dari gambar juga demikianMasing-masing memiliki kelebihannya masing-masing, FLUX tidak hanya menulis teks dengan benar, tetapi bahkan menggambar LOGO segitiga terbalik Prada, sedangkan LOGO Midjourney terlihat lebih modis.

Tip: Tas tangan "Prada" putih besar dengan figur kecil yang terbuat dari es dan dikelilingi oleh salju dan es, ditata seperti iklan mode, terinspirasi oleh iklan majalah prouce, fotografi resolusi tinggi, dan desain tipografi yang terinspirasi iklan.

FLUX (kiri), Tengah perjalanan (kanan)


Lain kaliTingkatkan kesulitannya, biarkan mereka mendesain gambar retro untuk kemeja lengan pendek, dan menambahkan dua kata bahasa Inggris.

Tak satu pun dari mereka membuat kesalahan besar kali ini, tetapi dalam hal efek keseluruhan, Shichao secara pribadi merasa bahwa Midjourney lebih baik.

Tip: Desain kaos yang terinspirasi retro ini menampilkan drag racer vintage dengan bendera kotak-kotak dan teks "Lagertha" dan "Semper Fi" dengan latar belakang monokrom. Lagertha yang sedang memegang bendera memiliki tato. Gaya karya seni ini menangkap pose aksinya, menampilkan kecepatan dan kekuatan kekuatan Viking. Ini adalah ilustrasi kontras tinggi yang menonjolkan pakaian olahraga dan tipografi teks tebal mereka.

FLUX (kiri), Tengah perjalanan (kanan)


Melihat kemampuan seorang model gambar, masalah klasik"Pelukis"Hal ini tentu tidak bisa dilewati.

Midjourney masih sedikit labil, hand yang dihasilkan ada yang bagus dan jelek. Seperti gambar di sebelah kanan, tidak bisa dijelaskan jika dibandingkan.jari kelingking ekstra

Kedua gambar tersebut dihasilkan oleh Midjourney


Sejujurnya, efek FLUX cukup mengejutkan, baik itu gaya clip art maupun gaya realistis.Hampir tidak ada cacat di tangan.

Kedua gambar dihasilkan oleh FLUX


Sejauh ini, FLUX telah menangani beberapa detail gambar dan masalah kecil dengan cukup baik.

Tentu saja, sampai batas tertentu, AI gambar juga merupakan alat untuk membantu semua orang mewujudkan imajinasi mereka, jadi Shichao kehilangan lebih banyak lagi.Kata-kata pengingat yang bijaksana

Kata cepat: Seorang gadis muda berpakaian merah duduk di samping seekor naga dengan gigi dan mata besar. Dia menghadapinya secara langsung, seolah-olah mereka adalah teman atau polisi yang baik. Adegan ini terjadi di antara salju dan bebatuan di pegunungan. The Secret Life of Wolves, diambil dengan gaya James Cameron, film tahun 70-an.

FLUX (kiri), Tengah perjalanan (kanan)


emmm. . . Shichao tidak perlu membantu semua orang menarik kesimpulan tentang siapa yang baik dan siapa yang jahat pada dasarnyaSekilas AISejauh itu, melihat kembali Midjourney, rasanya seperti efek khusus di kehidupan nyata.

Setelah itu, Shichao memberikan FLUX petunjuk yang lebih sederhana: "Penghancuran peradaban modern" untuk melihat seperti apa imajinasinya.

Alhasil, kali ini,Baik itu maupun Midjourney gagal.

Melihat efek gambarnya saja, Midjourney memang lebih bagus. Benar-benar menangkap kesan epik, tapi kalau dilihat dari depan dan belakang, bangunan ini tidak ada sangkut pautnya dengan peradaban modern. . .

FLUX (kiri), Tengah perjalanan (kanan)


Menariknya, FLUX cukup pandai menghasilkan karikatur potret selebriti yang berlebihan. Seperti Musk dan Jobs, saat dibuat, fitur wajah ditangkap secara akurat.

Kedua gambar dihasilkan oleh FLUX


Setelah pengalaman keseluruhan, Shichao merasa level FLUX sebenarnya masih bagus.Belum lagi pasangan yang sempurna, tapi tidak lebih buruk.

Bagaimanapun, itu dibuat oleh tim asli Stable Diffusion, dan hampir satu eselon dengan Midjourney.

Apalagi saat perusahaan baru Black Forest meluncurkan FLUX di awal bulan, pihaknya juga secara resmi mengumumkan kemajuan pembiayaannya yang kini telah selesai.$31 jutapembiayaan.

Lebih penting lagi, meskipun semua orang di Black Forest telah meninggalkan Stability AI, mereka masih mewarisi keunggulan tradisional open source. Baik FLUX menengah dan kecil adalah open source.

Hal ini belum berakhir. Peluncuran AI gambar tampaknya hanya menjadi bagian dari upaya mereka untuk mengejar ketertinggalan. Di situs resminya, mereka juga menjabarkan langkah selanjutnya.SOTA dalam video AI


Namun demikian, komersialisasi AI gambar adalah topik yang hampir dibicarakan.

Stabilitas AI, mantan pemilik Black Forest, berantakan karena masalah komersialisasi. Sedangkan untuk dirinya sendiri, sekarang sudah open source dan memiliki model berbayar, yang pada dasarnya sama dengan Stability AI sebelumnya.

Kita hanya bisa menunggu dan melihat apakah akan ada langkah baru dalam hal komersialisasi di masa depan.

Jangan ikuti jalur lama Stability AI dan mulai dari awal lagi. . .

Tulis artikel:tupai

sunting:Jiangjiang

Editor Seni:Xuanxuan

Gambar, sumber

FLUX, Perjalanan Tengah