berita

"Black Myth: Wukong" yang dimodifikasi secara ajaib untuk mengalahkan Midjourney. Artefak gambar AI ini membuat orang ketagihan.

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Ketika Ideogram AI bersaing untuk realisme dan seni, Ideogram telah membuka jalur yang rumit: Ideogram dapat menghasilkan teks pada gambar secara akurat, dan font serta tata letaknya indah.

Permintaan ini bukanlah permintaan khusus;Hasilkan poster dan ilustrasi dengan satu klik tanpa menggunakan P-gambar, yang dapat menghemat banyak kerumitan dan sangat cocok untuk orang awam yang tidak tahu apa-apa tentang desain.

Kami sebelumnya menulis tentang Ideogram versi 1.0. Pada tanggal 21 Agustus, versi 2.0 hadir. Realismenya lebih baik, posternya lebih didesain, dan keahlian khusus teksnya juga lebih kuat.

Anda mungkin belum pernah mendengarnya. Ini adalah produk AI yang dikembangkan oleh mantan karyawan Google. Produk ini memiliki banyak kekurangan, namun longboard dapat "menyalip" Midjourney di tikungan.

AI ingin tahu, Wukong yang mana yang kamu bicarakan?

Ideogram memiliki fitur yang sangat ramah bagi pemula: “Tips Ajaib”.

Anda langsung memasukkan kata perintah berbahasa Mandarin, dan ini akan membantu Anda menerjemahkannya ke dalam bahasa Inggris dan membantu Anda mengoptimalkannya pada saat yang bersamaan. Sebagai produk luar negeri, operasi semacam ini mampu merebut hati masyarakat.

Pada saat yang sama, Ideogram berfokus pada lima gaya:Biasa, realistis, desain, 3D, animasi, semuanya mudah dimengerti, sehingga pilihannya tidak membingungkan.

Mari saya mulai dengan kata sederhana dalam bahasa Mandarin, "Sun Wukong memegang gada emas", gaya anime, biarkan AI membantu saya menerjemahkan dan mengoptimalkannya, dan melihat bagaimana kata itu dapat digunakan secara bebas.

Ketika Wukong versi "Dragon Ball" Shui Lingling keluar, saya terkejut ketika saya melihat petunjuknya.AI menerjemahkan Sun Wukong menjadi "Son Goku", maka itu tidak mengherankan.

Selain itu, saya juga ingin bertanya kepada Ideogram apakah terlalu terang-terangan membayar royalti.

Untuk menghindari kesalahpahaman lebih lanjut oleh AI, saya berhenti bermalas-malasan saat memasukkan kata cepat dan menekankan bahwa "Sun Wukong" adalah "Sun Wukong", bukan "Son Goku".

Kali ini, kami mengadopsi gaya realistis dan memberikan pemandangan yang lebih detail. Sang bijak agung mengenakan baju besi dan memegang lingkaran emas di tangannya. Ekspresinya serius dan agung. Dia berdiri di depan gua Buddha nada, bagian bawah gambar bertuliskan "Mitos Hitam". : Wukong" (Mitos Hitam: Wukong).

Tidak ada kesalahan dalam teks, huruf kapital memiliki pengaruh yang kuat, dan suasana gua Buddha juga tercipta. Namun, temperamen "Sage Agung" agak melenceng, gambarnya agak atavistik, dan tidak ada cahaya di matanya.

Gunakan kata cepat yang sama untuk membiarkan tengah perjalananSetelah dibuat, teksnya memiliki kesalahan dan tidak ada desain yang sesuai, tetapi "Raja Kera" yang sedikit lebih tampan dan gaya permainan web menggantikannya.

Dihasilkan di tengah perjalanan

Tidak mau berdamai, saya mencoba gaya 3D lagi. Kata prompt pada dasarnya tetap sama, tetapi teks di bagian bawah diubah menjadi "Peluncuran game pada tanggal 20 Agustus."

Hasilnya, hasil yang dihasilkan oleh Ideogram sangat mirip dengan gambar promosi seri kotak buta versi Q gaya Cina tertentu. Gambarnya sangat bersih, tetapi sama sekali bukan gaya permainan 3D dalam pikiran saya. Raja Kera juga tertarik agar terlihat seperti Erlang Shen.

Dan AI juga mengekspos dirinya sendiri. Meskipun sangat baik dalam menerjemahkan teks berbahasa Inggris, ia tidak tahu apa-apa tentang bahasa Mandarin. Cacat ini berlanjut dari 1.0 hingga 2.0.

Tampaknya produk luar negeri kurang memahami budaya tradisional dalam negeri. Performa Ideogram di putaran pertama memang sedikit mengecewakan, namun juga menarik.

Tim Ideogram mengatakan bahwa versi 2.0 sama bagusnya dengan Flux dan DallE. Baru-baru ini, foto pidato TED yang dihasilkan oleh LoRA versi asli Flux telah menipu banyak netizen karena sulit untuk membedakan apakah itu asli atau palsu. Kalau begitu mari kita uji,Ideogram menghasilkan hasil yang lebih mirip foto.

Generasi fluks

Setelah memilih gaya realistis, saya memasukkan kata-kata cepat berbahasa Mandarin, foto TED talk, dan judul slide adalah "Rilis Ideogram 2.0". Ada tiga poin penting di dalamnya: "teks akurat", "bagus dalam desain" dan "lebih nyata ". Pembicara wanita berdiri di depan papan tulis, ada beberapa orang di latar belakang.

Terlihat pemahaman semantik Ideogram baik, dan memiliki semua elemen yang diperlukan. Logo TED hampir palsu, ekspresi pembicara dan penonton sangat jelas, serta rambut dan kulit relatif natural.

Tetapi,Detailnya kurang ditangani dengan baik. Meskipun tidak ada masalah dengan teks yang perlu dihasilkan, beberapa karakter kecil yang muncul secara acak merusak pot, dan jari serta badan karakter kurang tepat, namun sudah banyak. lebih baik dari versi 1.0 sebelumnya.

Sedangkan untuk desain poster, Ideogram bisa dikatakan mengalahkan “zona nyaman” AI Vincentian lainnya.

Jika film hit box office "Alien" digunakan sebagai pertanyaan ujian, dapatkah AI merancang perasaan teror yang tak terlukiskan itu?

Saya memilih gaya desain, menggunakan kata-kata cepat untuk mendeskripsikan elemen gambar, dan secara khusus menyebutkan bahwa saya menulis kalimat di bagian bawah poster: "Pemirsa di bawah umur menonton dengan hati-hati."

Efek keseluruhannya menarik, dan rangkaian teks yang panjang telah berhasil dibuat. Hanya ada satu kesalahan kecil, tetapi tidak realistis dan lebih terlihat seperti gaya buku komik, yang tidak cocok dengan film live-action.

Saya kemudian menggunakan film musim panas yang buruk "A Dream of Red Mansions" sebagai inspirasi dan meminta Ideogram untuk membuat poster. Latar belakang, dekorasi, dan bahkan karakter yang disebutkan dalam kata-kata cepat semuanya disertakan di dalamnya kata-kata cepatnya sangat bagus.

Tentu saja judul filmnya ditulis dengan benar, tapi fontnya sepertinya dipinjam dari The Lord of the Rings, agak dramatis, dan gaya keseluruhannya lebih mirip film animasi Mulan.

“Gaya desain” Ideogram lebih bersifat dua dimensi dan unik, namun sebaliknya, hal ini juga membatasi skenario penggunaan poster.

Untuk meringkas,Ideogram merupakan produk grafis AI dengan ciri khas tersendiri. Tingkat realismenya mirip dengan Flux, dan rasa artistiknya berbeda dengan Midjourney.

pola "musim panas hujan".

TetapiIni memiliki tingkat pembuatan teks yang unik dan lebih cocok untuk menghasilkan poster, ilustrasi, iklan, emotikon, pencetakan T-shirt, dll.

Hasil evaluasi manusia menunjukkan bahwa Ideogram 2.0 lebih baik daripada Flux Pro dan DALL·E 3 dalam hal penyelarasan kata yang cepat, kinerja keseluruhan, dan kualitas rendering teks.

Namun ini adalah pernyataan Ideogram sendiri

Sangat mudah dimainkan dan membumi, Anda mungkin juga memiliki lebih banyak “makanan penutup” AI seperti ini

Ideogram diumumkan pada 22 Agustus tahun lalu, tepat satu tahun setelah rilis 2.0.

Tim pendiri berjumlah total 7 orang dari Google Brain, University of California, Berkeley, Carnegie Mellon University dan University of Toronto, 4 di antaranya adalah penulis makalah penelitian Imagen model difusi grafik Google Vincent.

Selain merilis 2.0 kali ini, Ideogram juga telah meluncurkan aplikasi iOS yang bisa diunduh langsung di China. Versi Android rencananya akan dirilis nanti. Dari halaman web hingga terminal seluler, kita bisa menghasilkan gambar kapan saja dan di mana saja.

Antarmuka seluler

Ideogram saat ini terbuka untuk semua pengguna secara gratis, namun kuota sangat terbatas. Setelah menghasilkan total 20 foto sebanyak 5 kali, Ideogram mengingatkan saya bahwa 10 poin telah habis, silakan kembali lagi besok.(Tentu saja, Midjourney di sebelahnya menghasilkan 25 foto gratis, yang sepertinya tidak terlalu mengesankan.)

Jika Anda jarang melihat gambar Vinsensian, Anda pasti menyukainyaDiagram Vinsensian AI Untuk memulai, Ideogram adalah pilihan yang baik.

Memasukkan kata-kata cepat berbahasa Mandarin, menggunakan "perintah ajaib" untuk menerjemahkan dan mengoptimalkan adalah satu hal. Selain itu, Ideogram juga memiliki banyak opsi untuk membantu Anda menghasilkan gambar yang mendekati apa yang Anda inginkan.

Memberikan pilihan terbatas bagi pengguna untuk "mengklik",Dibandingkan dengan menyelesaikan "input" di kotak input kosong, interaksinya lebih sederhana.Apapun proporsi gambar, gaya, dan nada yang Anda inginkan, Ideogram memungkinkan Anda memilih.

Nuansa berbeda dari "Gadis dengan Anting Mutiara Makan McDonald's"

Jika Anda tidak tahu cara menulis kata-kata cepat, Anda juga dapat menggambarnya dan membiarkan Ideogram membantu kita mengubah hal biasa menjadi keajaiban.

Aku minta maaf atas kemampuan menggambarku yang buruk, tapi AI dapat memahami maknanya, mengoptimalkan garis dan warna, serta menambahkan latar belakang, dan gayanya tiba-tiba meningkat. Dengan AI, siapa yang bukan pena ajaib Ma Liang?

Selain itu, di bawah kotak masukan versi web, terdapat karya yang dihasilkan oleh orang lain. Ketika kita bertemu dengan karya yang kita sukai, kita dapat melihat dan merujuk pada kata-kata yang diminta. Ideogram mengatakan penggunanya menghasilkan lebih dari 1 miliar gambar yang dapat dilihat publik dalam satu tahun terakhir.

Jika Anda ingin menghasilkan objek tertentu tetapi tidak tahu cara menulis kata prompt, Kali ini Ideogram juga diluncurkanKemampuan untuk mencari perpustakaan penulis umum dengan teks, tetapi fitur ini saat ini memerlukan keanggotaan.

Hasil pencarian "kucing"

Secara keseluruhan, Ideogram adalah produk Vincent yang dapat dimainkan.

Ini dapat menghasilkan konten teks yang dibutuhkan oleh pengguna dengan lebih akurat dan beradaptasi dengan berbagai gaya gambar.

Sumber gambar: Blog Ideogram

Kadang-kadang dapat membawa nilai emosional dan mengekspresikan ambisi melalui gambar, meskipun emoticon yang dihasilkan terlalu bias terhadap estetika Internet Eropa dan Amerika.

Paket emoticon "Saya ingin memainkan" Black Myth: Wukong "".

Kualitas Ideogram secara keseluruhan lumayan, fungsi teksnya kuat, ramah bagi pemula, mudah digunakan, dan interaksinya menyenangkan. Ketika alat AI menggabungkan kreativitas, kenyamanan, dan nilai berbagi, orang akan mudah terpikat.

Dunia yang diukir dari cetakan terlalu membosankan. Menarik juga untuk melihat kebutuhan kecil dan kemudian menjadikan solusinya sebagai yang pertama di industri.

Ada banyak produk di dunia, dan dengan lebih banyak audiens, kita dapat mengharapkan lebih banyak “makanan penutup” AI semacam itu.