berita

Tim asli dari perusahaan baru StableDiffusion secara resmi diumumkan!Model-model baru yang berkelanjutan menyegarkan lanskap lukisan AI

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Rumah itu berasal dari Kuil Aofei
Qubit |. Akun publik QbitAI

hanya,Tim asli Stable Diffusion secara resmi mengumumkan perusahaan barunya

Robin Rombach, yang mengumumkan kepergiannya dari Stability AI pada bulan Maret, adalah salah satu dari dua penulis utama Stable Diffusion, dan selusin mitra perusahaan aslinya secara resmi mengumumkan berita pembentukan grup untuk memulai bisnis.

Nama perusahaan baruLab Hutan Hitam, Lab Hutan Hitam . Segera setelah debutnya, Kuku merilis serangkaian 3 model pembuatan gambar, 2 di antaranya bersifat open source.

DanMendukung masukan berbahasa Mandarin

Apa efeknya? Netizen yang melihatnya mengatakan itu liar!

Masukkan kata prompt dan uji efek layar dan data wajah serta tindakan keamanan lainnya sekaligus:

Seorang gadis remaja mengenakan topeng ski membuat origami di gudang. Ada teks kuning yang ditunjuk di bagian bawah gambar. Ada bingkai di latar belakang dengan gambar Obama di dalamnya.



Setelah melihat kumpulan gambar dan teks ini, beberapa netizen menyesalkan bahwa ini adalah efek pembuatan gambar terbaik yang pernah dia lihat.



Ciri khas perusahaan ini adalah tidak tertutup.

Pendiriannya diumumkan secara resmi hari ini, serangkaian model dirilis hari ini, dan kemajuan pembiayaan juga diumumkan——

Menyelesaikan pembiayaan sebesar US$32 juta, dipimpin oleh a16z, dengan investasi dari salah satu pendiri Oculus VR Brendan Iribe, mantan mitra YC Garry Tan, Timo Aila, yang memimpin kelompok riset grafis komputer di NVIDIA Research, ilmuwan terkemuka Apple (mantan kepala ilmuwan Intel Intelligent Systems) Vladlen Koltun dan lain-lain.

Dapat dikatakan bahwa Black Forest tidak hanya menerima taruhan dari pasar modal, tetapi juga memenangkan hati para pemimpin industri.

Master AI Kapasi juga mengirimkan pesan ucapan selamat secara online, dan juga memuji model baru Black Forest:

Hati-hati! Model gen gambar FLUX.1 open source terlihat sangat kuat.



Dan perlu diketahui bahwa perjanjian open source adalah Apache2.0 yang longgar.

Debut model pembuatan gambar Black Forest

Kapasi merasa bersemangat. Mari kita rasakan secara visual efek model hutan hitam.

Di sini, Qubit telah memilih lima jenis efek generasi untuk ditampilkan. Semua gambar disediakan oleh resmi, dan tidak ditentukan model mana yang digunakan.

Tingkat pertama adalah pembuatan teks.

Kata cepat: Foto papan tulis kelas tua. Tulisan dengan kapur di papan tulis adalah "mari kita membuat beberapa hal yang sangat cantik bersama-sama" dengan hati kapur merah setelah kata-katanya. Matahari bersinar masuk melalui jendela.



Tingkat kedua adalah pembuatan adegan + teks non-nyata.

Kata petunjuk: Dalam pemandangan bawah air, dua burung hantu sedang duduk di meja makan yang indah. Sebuah lilin menyala di tengah meja. Kedua burung hantu itu sedang menikmati makan malam yang lezat bersama. Burung hantu di sebelah kiri mengenakan tuksedo dan burung hantu di sebelah kanan mengenakan gaun yang indah. Ada kapal selam lewat di latar belakang dengan tulisan "What a Hoot" di sisinya. Gambar di bawah meja menampilkan ubur-ubur kecil yang berenang di bagian bawah, sebuah karya seni digital yang sinematik dan indah.



Tingkat ketiga adalah pemandangan nyata di dunia nyata.

Kata cepat: Foto jalan yang indah di Freiburg, dengan trem lewat dan orang-orang berjalan dan mengendarai sepeda.



Tingkat keempat adalah generasi karakter nyata dan karakter anime.

Kata singkat: Foto tiga wanita di jalan pusat kota, tangan mereka mengarah ke kamera.



Kata cepat: Karya seni anime yang indah dari seorang gadis kucing lucu yang tampak tertekan dan memegang selembar kertas dengan senyuman di atasnya, dia akan menangis.



Tingkat kelima adalah pembuatan gambar binatang.

Kata cepat: Seekor kucing hutan di hutan, difoto oleh fotografer profesional di bawah cahaya terang.



Kata tip: Rendering jarak dekat dari makhluk mitos yang terdiri dari fraktal dan sulur spiral yang mendetail, tekstur kulit rekursif yang mendetail



Model seri FLUX.1

Kali ini Black Forest merilis tiga model seri FLUX.1: pro, dev, dan schnell.



FLUX.1 [pro]: Suara terkuat di seri ini.

Inti dari seri FLUX.1, memberikan performa optimal dalam menghasilkan gambar dengan kepatuhan perintah terbaik di kelasnya, kualitas visual, detail gambar, dan keragaman keluaran.

Tim Black Forest secara perlahan meningkatkan kemampuan komputasi inferensi FLUX.1 [pro] di API.

Versi ini dapat diakses melalui Replikasi dan fal.ai; menawarkan solusi perusahaan yang berdedikasi dan disesuaikan.

FLUX.1 [dev]: Piala seri.

Model yang memungkinkan penggunaan non-komersial, berbobot terbuka dan disuling.

[dev] Disuling langsung dari [pro], model ini menawarkan kualitas serupa dan kepatuhan cepat sekaligus lebih efisien dibandingkan model standar dengan ukuran yang sama.

Anda bisa mencobanya di Huhuface, atau mencobanya langsung di Replikasi atau fal.ai.

FLUX.1 [schnell]: Kecepatan angin puyuh kecil.

Model tercepat dalam seri ini, dibuat khusus untuk pengembangan lokal dan pengembang individu.

FLUX.1 [schnell] tersedia untuk umum di bawah lisensi Apache2.0. Bobot model dapat ditanyakan di Huohuofian.

Telah didukung oleh ComfyUI dan dapat digunakan secara langsung; dapat juga digunakan melalui Replikasi atau fal.ai.

Mari kita rasakan perasaan intuitif!

Berikut tiga foto yang merupakan efek yang dihasilkan dari cangkir besar, cangkir sedang, dan cangkir kecil di atas dengan kata-kata cepat yang berbeda, dengan tema "kue".

△Dari kiri ke kanan model yang digunakan adalah gelas besar, sedang dan kecil.

Setelah banyak pengujian, Qubit menemukan bahwa jika kata prompt sederhana dimasukkan, waktu yang diperlukan untuk menghasilkan gambar dengan versi pro adalah antara 15 detik dan 25 detik (waktu pembuatan akan ditampilkan di bawah bagan hasil).



Black Forest menyebutkan semua model FLUX.1Keduanya didasarkan pada arsitektur hibrida blok Transformator difusi multi-modal dan paralel dan diperluas hingga parameter 12B

Di antara ketiga model tersebut, FLUX.1 [pro] dan [dev] melampaui Midjourney v6.0 dan DALL· dalam hal kualitas visual, respons cepat, fleksibilitas ukuran/rasio aspek, penyusunan huruf dan keragaman keluaran Difusi 3-Ultra.

FLUX.1 [schnell] disebut oleh tim sebagai "model beberapa langkah paling canggih hingga saat ini".

Tidak hanya menonjol di antara pesaing serupa, ia juga mengungguli model non-kompresi yang lebih bertenaga seperti Midjourney v6.0 dan DALL·E 3(HD).

Seluruh seri FLUX.1 telah disesuaikan secara khusus untuk mempertahankan keragaman keluaran penuh pada fase pra-pelatihan.

Dibandingkan dengan teknologi yang ada, FLUX.1 memiliki keunggulan sebagai berikut:



Pasti ada yang bertanya, Anda adalah veteran OG dan anggota inti Stability AI.

Jadi,Apa perbedaan antara model baru Anda dan model Difusi Stabilnya?

Anggota tim pendiri merespons di Reddit:

Bahkan model terlemah kami, Schnell, memiliki kualitas pembuatan yang lebih baik dan waktu pembuatan yang lebih cepat.

Tujuan utamanya adalah mendirikan perusahaan baru dan melampaui diri saya sendiri.



Dibuat oleh tim penulis utama SD

Setelah memperkenalkan informasi terkait model, sekarang saatnya mengenal perusahaan baru ini secara formal.

laboratorium hutan hitam, baru saja diumumkan hari ini.

Di situs resmi perusahaan, terdapat slogan: Era baru penciptaan.

Misi perusahaan adalah untuk memajukan model pembelajaran mendalam yang canggih dan berkualitas tinggi untuk pembuatan gambar dan video serta menjadikannya tersedia bagi khalayak luas.

Huadian muncul!Milik merekaAmbisi selanjutnya sudah jelas, yaitu memasuki bidang pembuatan video.

Juga, itu harus "SOTA".



Anggota intiRobin Rombach, mantan ilmuwan peneliti di Stability AI.

Saat bekerja di Stability AI, dia adalah salah satu pengembang utama model Difusi Stabil dan juga berpartisipasi dalam penelitian SDXL, SVD, dan proyek lainnya.

Pada bulan Maret tahun ini, Robin meninggalkan Stability AI.

Dunia luar berkomentar bahwa kepergiannya telah sangat merugikan perusahaan unicorn yang sudah kacau balau - lagipula, dia adalah salah satu dari dua pemain utama SD.



Melihat ke belakang, Robin menerima gelar sarjana dan master di bidang fisika dari Universitas Heidelberg.

Pada tahun 2020, ia mulai belajar untuk mendapatkan gelar PhD di bidang Ilmu Komputer di Computer Vision Group di Heidelberg di bawah pengawasan Björn Ommer, dan pada tahun 2021 ia pindah ke Universitas Munich bersama kelompok penelitian tersebut.

Penelitian berfokus pada menghasilkan model pembelajaran mendalam, khususnya sistem text-to-image.

Google Cendekia memiliki hampir 15.000 kutipan.



Selain itu, di antara anggota yang diungkapkan di situs resminya, terdapat Andreas Blattmann, Axel Sauer, Dominik Lorenz, Dustin Podel, Frederic Boesel, Patrick Esser, Sumith Kulal, Tim Dockhorn, Yam Levi, Zion EnglishSemuanya adalah anggota asli Stability AI yang tersedia untuk umum.

(Andi Holmes dan Jonas Müller belum menemukan informasi akurat)



Bisa dibilang Black Forest adalah anggota inti asli SD yang keluar dan berlayar kembali.

Pantas saja Axel Sauer meneruskan tweet resminya dan berteriak lantang:

Kami masih hidup!



Satu hal lagi

Kebetulan sekali, di hari yang sama, Stability AI juga membuat langkah baru:

Meluncurkan model AI baruStabil Cepat 3D, para pejabat mengatakan itu dapat digunakanHasilkan gambar 3D dalam setengah detik

Meskipun model sebelumnya membutuhkan waktu beberapa menit untuk menghasilkan gambar 3D dengan efek serupa, model baru ini dapat menyelesaikan tugas yang sama 1.200 kali lebih cepat dibandingkan model yang sudah ada.



Stability AI diluncurkan pada bulan MaretCEO yang lolos, Emad Mostaque, apa yang dia lakukan?

Pada bulan Juni, dia secara resmi mengumumkan keberadaannya di perusahaan baruKecerdasan buatan Schelling, "akan membangun dan mendukung kode sumber terbuka, model, dan kumpulan data yang didukung oleh pendanaan AI."

Fokusnya adalah pada penelitian inovatif dan AI yang dibangun secara cermat dan sadar budaya, ilmiah, mendidik, dan kreatif.

Tiga hari lalu, Schelling AI menerbitkan artikel pertama dalam seri, "How To Think About AI".

Artikelnya agak panjang, Teman-teman yang berminat bisa mencari dan melihatnya sendiri.

AI berkembang pesat, mempromosikan open source dan keterbukaan, serta mempercepat inovasi dan kolaborasi.



Dan, bagaimana kalau kita semua menjadi orang baik!

Tweet yang mengumumkan pendirian Laboratorium Black Forest dengan baik hati diteruskan oleh mantan CEO (letakkan kepala anjing di sini).

Tautan referensi:
[1]https://blackforestlabs.ai
[2]https://news.ycombinator.com/item?id=41130620
[3]https://x.com/EMostaque
[4]https://www.reddit.com/r/StableDiffusion/comments/1eds0l9/does_anyone_have_an_update_on_when_stable/
[5]https://x.com/SchellingAI/status/1818600200232927721