berita

Apakah status Midjourney tidak stabil? Kuda hitam lain dalam gambar AI muncul, dengan pengujian langsung terhadap 4 produk

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Lingkaran AI, pembuatan gambar buku terbuka lagi.

Serangkaian perkembangan berkumpul:

21 Agustus,Ideogram resmi meluncurkan versi 2.0, mengklaim memiliki kemampuan rendering teks yang lebih kuat.

Benar sekali, ini adalah proyek yang didirikan pada Agustus tahun lalu oleh empat orang besar dari Google AI Painting yang secara kolektif meninggalkan pekerjaannya untuk memulai bisnis. Proyek ini telah menerima investasi dari sejumlah orang besar AI.

Kali ini Ideogram jugaBuka tantangan untuk Flux, pejabat tersebut dengan yakin menyatakan bahwa evaluasi manusianya jauh lebih baik daripada Flux Pro.

Anda tahu, Flux diciptakan oleh tim asli Stable Diffusion, dan baru-baru ini menjadi populer di jaringan besar karena menghasilkan "foto" pembicaraan TED yang terlihat seperti aslinya.

Apalagi seminggu lalu Google resmi merilisnyaGambar 3, dalam evaluasi resmi, diklaim memiliki performa lebih baik daripada DALL-E 3, Midjourney v6, Stable Diffusion 3 dan model gambar lainnya.

Mungkin karena rangsangan (doge), Midjourney pun bertransisi dan diluncurkan langsung ke semua pengguna pada 22 Agustus.Versi web gratis

Ada sesuatu yang bagus untuk ditonton sekarang!

Karena semua orang mengaku kuat, sebaiknya kita mengajak semua orang ke meja yang sama dan melakukan PK tatap muka.

Siapa AI gambar terkuat?

Mari kita undang dulu 4 kontestan kita (semuanya menggunakan versi web):

Kontestan No. 1: Ideogram 2.0.Ada 10 poin gratis setiap hari, 1 poin dapat menghasilkan 4 gambar, dan maksimal 40 gambar dapat dihasilkan per hari;

Pemain No.2: Fluks.1.Black Forest secara resmi menyediakan demo gratis di Hugging Chat (pilih versi FLUX.1 Schnell);

Kontestan No.3: Gambar 3.Penggunaan gratis dan tidak terbatas pada Image FX;

Pemain No. 4: Tengah perjalanan.Selama masa uji coba gratis, Anda hanya memiliki kesempatan untuk menghasilkan total 25 gambar;

Sekarang kami resmi memasuki tahap kompetisi.

Monyet hitam semuanya terbalik

Pertama, untuk menguji AI asing tersebutApakah Anda memahami kata-kata cepat berbahasa Mandarin?, mari kita manfaatkan juga popularitas monyet hitam top saat ini.

petunjuk: Karakter permainannya adalah seekor monyet, mengenakan baju besi, mahkota emas dengan bulu burung phoenix di kepalanya, dan memegang lingkaran emas di tangannya, berdiri di atas tebing.

Seperti yang diharapkan, kecelakaan terjadi...

Saya yakin semua orang tertarik dengan palang merah besar di No. 3 pada pandangan pertama. Betul sekali, di bawah kata prompt yang sama, hanya ada Imagen 3Permintaan pembangunan ditolak

Ketika saya melihat ini, reaksi pertama saya adalah apakah kata-kata cepat kami memicu perlindungan hak cipta. Jadi saya pertama kali menghapus "karakter permainan" di kata prompt, tetapi hasilnya pengingat tidak dapat dibuat.

Apakah karena Google Imagen 3 tidak mendukung bahasa Mandarin? Jadi saya secara acak mengubah kata prompt menjadi lebih sederhana, dan kali ini ada gambarnya.

Hanya saja hasilnya adalah kesalahan besar, dan beberapa kata cepat berbahasa Mandarin diubah, dan pada akhirnya semuanya menjadi gambar tekstur yang tidak relevan.

RasanyaGoogle Imagen 3 memang tidak cocok dengan kata-kata cepat berbahasa Mandarin

Setelah No. 3 gagal dalam daftar, melihat yang lain, hanya adaNo. 1 Ideogram 2.0 memiliki kinerja terbaik

Nomor 2 masih bisa melihat bayang-bayang komik China, tapi No. 4 Midjourney sudah benar-benar lepas~ (tema utamanya sama sekali tidak ada hubungannya)

Terakhir, saya ingin memuji Ideogram 2.0 karena secara akurat memenuhi semua elemen kunci.

Meskipun bukan itu yang saya inginkan di hati saya (saya ingin Mitologi Hitam), sebenarnya tidak ada salahnya memulihkan kata-kata cepat tersebut.

Apakah itu orang sungguhan atau AI? Konyolnya, saya tidak bisa membedakannya

Selanjutnya, masuki zona nyaman masing-masing pemain——Generasi potret

Dulu, Midjourney menjadi populer di Internet dengan foto pasangan di atap; sekarang, Flux telah menggemparkan Internet dengan serangkaian gambar pidato TED...

Siapa yang lebih baik? Jawabannya akan segera terungkap.

prompt:Seorang pria muda berambut pirang kemerahan, mengenakan kemeja kotak-kotak berwarna teal dan krem, difoto dengan lensa 50mm untuk tampilan vintage. Warna yang kaya, fokus yang tajam, dan sentuhan pesona retro.

Seorang pria muda dengan rambut pirang, mengenakan kemeja kotak-kotak berwarna teal dan krem, ditangkap dengan lensa 50mm dalam gaya retro. Warnanya kaya dan fokusnya tajam dengan sedikit pesona vintage.

Melihat No 2 dan No 4 terlebih dahulu, terlihat jelas bahwa Midjourney yang menang!

Melihat detailnya, No.2Flux.1 sedikit mati, ada dua warna pakaian lagi, yang paling menonjol di antara kemeja kotak-kotak biru dan hijau.

Selain itu, kami juga menemukan Imagen 3 di awalSorotan kecil yang unik: Lingkari kata kunci sebelum pembuatan dimulai.

Dengan pengerjaan yang sudah dilakukan, kita tinggal menguji performa beberapa pemain saja.elemen kunci(Kemeja kotak-kotak biru-hijau, lensa 50mm, dll.).

Terlihat bahwa secara keseluruhan, beberapa pemain tampil baik (kecuali No. 2), dengan tingkat restorasi yang tinggi dan semuanya melihat ke arah kamera.

Terlebih lagi, jika ini tidak saya hasilkan sendiri menggunakan AI, saya tidak akan bisa membedakannya dengan orang sungguhan sekaligus. (Malu)

Terakhir, saya ingin mengatakan dengan tenang bahwa Kontestan No. 4, Midjourney, memiliki penampilan terbaik.

Kesulitan Besar: Teks Tampilan Gambar

Setelah berhasil menipu semua orang, saatnya membiarkan AI sedikit menderita——

Tambahkan teks ke gambar

Hal ini selalu menjadi masalah yang sudah berlangsung lama, dan juga menjadi salah satu standar pengujian level gambar AI.

Tanpa basa-basi lagi, biarkan beberapa kontestan membuat papan reklame yang indah. Semua pembaca, mohon peran Anda sendiri sebagai ayah Partai A.

petunjuk:Tanda kuningan horizontal bertuliskan 'Musim Perayaan' dalam aksara penuh gaya, dikelilingi pohon pinus dan holly pada latar belakang kayu gelap, dengan fokus close-up pada huruf emas.

Tanda kuningan horizontal bertuliskan 'Musim Perayaan' dengan tulisan penuh gaya dikelilingi oleh cabang pinus dan holly dengan latar belakang kayu gelap, dengan fokus close-up pada huruf emas.

Setelah dilihat sekilas, apakah semuanya cukup bagus? Tampaknya mereka telah memulihkan kata-kata cepat ke tingkat yang tinggi?

Namun, begitu tatapan tajam ayah Partai A terungkap, No. 2 tidak bisa menyembunyikannya.

Perhatikan, nomor 2Flux.1 mengambil jalan pintas, pada kata "Season" tidak ada huruf "S".

Tapi kecuali No. 2, yang lainnya cukup bagus. Tampaknya berbagai perusahaan AI berjalan dengan baik.Fungsi rendering teksSegala upaya telah dilakukan.

Jadi langkah selanjutnya adalah setiap orang memiliki kesukaannya masing-masing terhadap lobak dan sayuran hijau, dan setiap orang membuat pilihan berdasarkan preferensi pribadinya. (Secara pribadi memilih Midjourney)

Omong-omong, Ideogram No. 1 secara khusus mempromosikan fungsi "render teks" dalam peningkatan model ini.

Lihat McDonald's, inti dari periklanan AI

Baru-baru ini, McDonald's mempekerjakan 11 wanita cantik AI untuk menyebut kentang goreng mereka, yang membuatnya sangat populer~

Sebenarnya, prinsipnya relatif sederhana. Ini tidak lebih dari menggunakan AI untuk menghasilkan gambar berbagai karakter yang mempromosikan kentang goreng, dan kemudian menggabungkannya menjadi sebuah video.

Tanpa diduga, efeknya sangat mencengangkan. Di Twitter saja, video terkait tersebut ditonton hampir 10 juta kali.

Setelah menguasai kode kekayaan, kami resmi mulai bekerja.AI membantu petaniAnda harus berjalan naik turun~

prompt:Dengan latar belakang kota metropolitan bergaya cyberpunk, seorang gadis sedang mempromosikan produk pertanian organik di tangannya.

Dalam latar perkotaan bergaya cyberpunk, seorang gadis sedang mempromosikan produk organik di tangannya.

Bagus sekali, pemain nomor 3 "gagal" lagi. Namun, gelombang ini benar-benar membingungkan. Kata-kata cepatnya tidak dalam bahasa Cina atau apa pun yang jelas-jelas dilarang...

Setelah No.3 tersingkir, Kontestan No.1 Ideogram 2.0 membawakan berbagai macam barang, antara lain sawi putih, tomat, kol ungu, dll.

Dan hanya itu satu-satunya yang mengetiktanda teksSaya datang ke sini untuk mempromosikan makanan organik, dan saya dapat melihat bahwa mereka bekerja sangat keras~

Selain itu, jika diperhatikan lebih dekat, Anda dapat melihat bahwa hanya No. 1 yang berusaha sekuat tenaga untuk meniru orang aslinya, sedangkan No. 2 dan No. 4 sepenuhnyaKera berduri dua

u1s1, jika mengacu pada gaya periklanan Maimai, generasi jangka pendek ini tidak mencapai efek yang diinginkan. (Semoga lebih dekat dengan kenyataan)

Namun untungnya, alat AI tersebut saat ini tersedia secara gratis. Bukan tidak mungkin untuk mencobanya beberapa kali. 🐶

Jangan terburu-buru pergi, sebenarnya ada cara yang lebih dapat diandalkan untuk menghasilkan uang——

Gunakan AI untuk mengontrol pengambilan gambar studio dengan mudahposter bisnis, bukankah menyenangkan menghemat uang untuk fotografer, lokasi, dan pasca produksi.

Tabung lipstik yang ramping berkilau dengan latar belakang kecanggihan, menonjolkan pigmen yang kaya dan gerakan yang halus. Bangkitkan kemewahan dengan fokus yang tajam dan sedikit kilau.

Tabung lipstik yang ramping bersinar dengan latar belakang yang canggih, menonjolkan warna yang intens dan pengaplikasian yang halus. Bangkitkan kesan mewah dengan fokus tajam dan sentuhan berkilau.

Mari kita tes semuanya, jika kamu disuruh memilih lipstik untuk wanita di sekitarmu, manakah yang akan kamu pilih? (Ujian kematian akan datang)

Hehe, jadi ada yang pilih no 4?

Meskipun warna abu-abu No. 4 Midjourney terlihat sangat mewah, warna hitam mungkin agak khusus. (Pilih dengan hati-hati)

Selain itu, pemain terbaik berikutnya adalahGambar 3, bahan beludru di bawahnya memunculkan kesan mewah, dan yang terpenting, tekstur lipstiknya sangat nyata.

Sebagai perbandingan, No. 1 dan No. 2 terlihat agak palsu, dengan "nuansa plastik".

Oleh karena itu, secara keseluruhan, pemain No. 3 memenangkan babak ini.

Kesimpulannya, secara keseluruhan performa keempat pemain tersebut sangat bagus. Di bawah kata-kata cepat Tiongkok, pemain kuda hitam Ideogram 2.0 berkinerja terbaik.

Siapa Ideogram?

Pada bulan Februari tahun ini, Ideogram meluncurkan versi 1.0. Hanya dalam waktu setengah tahun, Ideogram berevolusi lagi dan meluncurkan versi 2.0.

Faktanya, Ideogram dan Google berkaitan erat.

Didirikan pada Agustus tahun lalu, empat anggota pertama tim pendiri adalahPenulis makalah Imagen tentang penelitian grafik Google Vinsensian

Direktur Utama Mohammad Norouzi, salah satu penulis makalah ini, ia menerima Beasiswa PhD Google ML saat belajar untuk gelar PhD di bidang Ilmu Komputer di Universitas Toronto.

Setelah lulus, ia bergabung dengan Google Brain dan bekerja selama 7 tahun, menduduki posisi ilmuwan peneliti seniorHasilkan model

Selain itu, ia adalah anggota asli tim Google Neural Machine Translation dan salah satu penulis kerangka pembelajaran kontrastif SimCLR yang diawasi sendiri oleh tim Hinton.

Direktur Teknis William Chan(Chen Junle), salah satu penulis makalah ini, belajar di Universitas Waterloo dan Universitas Carnegie Mellon di Kanada.

Saat bergabung dengan Google pada tahun 2012, dia pertama kali mengerjakan proyek periklanan pembelajaran mesin, lalu pindah ke Google Brain untuk melakukan penelitian NLP.

Salah satu pendiri Jonathan Ho, lulus dari UC Berkeley dengan gelar Ph.D., bekerja di OpenAI selama satu tahun, dan kemudian bergabung dengan Google.

Selain menjadi kontributor inti makalah Imagen, ia juga meletakkan dasar bagi model difusi denoising.《Model Probabilistik Difusi Penghilang Derau》Pieter Abbeel, salah satu penulis makalah ini, juga merupakan investor di Ideogram AI.

Salah Satu Pendiri Chitwan Saharia, salah satu penulis makalah ini, lulus dari Bombay Institute of Technology dengan gelar sarjana. Ia bergabung dengan Google pada tahun 2019 dan bertanggung jawab memimpin pekerjaan model difusi gambar-ke-gambar.

Tiga orang lainnya di tim pendiri,Syaiful AbdullahDia adalah seorang insinyur pembelajaran mesin di Twitter. Dia meninggalkan pekerjaannya pada bulan April tahun lalu dan kemudian bergabung dengan Ideogram AI.

Yakub LuSebagai seorang insinyur perangkat lunak, dia bekerja di perusahaan seperti Amazon sebelum bergabung dengan Ideogram;Jenny LeiSaya magang rekayasa perangkat lunak dan magang di Google sebelum bergabung dengan Ideogram AI.

Terlihat bahwa Ideogram terdiri dari tim peneliti model difusi terkemuka dan telah menerima bantuan modal sejak awal.

Putaran unggulan Ideogram didanai oleha16zDanUsaha IndeksMemimpin investasi dengan jumlah US$16,5 juta (sekitar RMB 120 juta pada saat itu).

Ada juga investor individu seperti Andrej Karpathy, guru pembelajaran penguatan Pieter Abbeel, dan salah satu pendiri GitHub Tom Preston-Werner.

Selain itu, pada bulan Februari tahun ini, berbagai sumber melaporkan bahwa Ideogram telah melakukannyaputaran baru pembiayaan

kabarnya berhasil diangkatUS$80 juta(sekitar 5,7 miliar yuan) Pembiayaan Seri A, dipimpin oleh Andreessen Horowitz, dan investor lain yang berpartisipasi termasuk Index Ventures, Redpoint Ventures, Pear VC, dan SV Angel.

Tampaknya Ideogram yang punya uang dan teknologi tidak diragukan lagi menjadi kuda hitam di bidang pemetaan AI.

Gulung, terus bergulir.