berita

Semua keindahan AI musnah! Secara kolektif berubah menjadi "hantu" di bawah cermin ajaib dunia maya, kode AI mengganggu produksi gambar oleh AI

2024-08-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

  • Mingmin Kresi dari Kuil Aofei
    Qubit |. Akun publik QbitAI

Di bawah cermin ajaib dunia maya, semua keindahan AI berubah menjadi hantu.

Datang dan lihat giginya



Saat saturasi gambar ditingkatkan sepenuhnya, gigi potret AI akan menjadi sangat aneh dan batasnya menjadi kabur.

Warna gambar keseluruhannya normal, tetapi bagian mikrofonnya lebih aneh lagi.

kontrasFoto orang sungguhan, seharusnya seperti ini.

Giginya bening dan bercak warna pada gambar seragam.



Alat ini terbuka dan semua orang dapat mencobanya dengan foto.

Bingkai tertentu dalam video yang dihasilkan AI tidak bisa lepas dari metode ini.



Foto gigi yang hilang juga bisa mengungkap masalah.



Tapi BTW, alat inioleh Claude. Gunakan AI untuk memecahkan AI, loop tertutup yang luar biasa.



Faktanya, potret AI akhir-akhir ini terlalu nyata dan menimbulkan banyak diskusi. Misalnya, dalam kumpulan "video pembicara TED" yang populer, tidak ada satupun yang benar-benar manusia nyata.



Tidak hanya sulit membedakan wajah, bahkan tulisan, kelemahan AI sebelumnya, kini bisa sepenuhnya palsu.



Yang lebih penting lagi, biaya pembuatan potret AI semacam itu tidaklah mahal. Ini dapat dilakukan hanya dalam 5 menit dan 1,5 dolar AS (sekitar 10 yuan) setiap 20 detik.



Kini netizen tidak bisa duduk diam dan memulai kompetisi anti-pemalsuan AI satu demi satu.

Hampir 5.000 orang datang untuk mendiskusikan siapa di antara dua gambar ini yang merupakan orang asli.



Alasan yang diberikan beragam. Beberapa orang menganggap detail teks dan polanya sangat abstrak, sementara yang lain menganggap mata karakternya kosong...

Aturan yang digunakan AI paling canggih untuk menghasilkan potret secara bertahap mulai diketahui.

Sulit untuk mengatakannya tanpa melihat detailnya

Singkatnya, menyesuaikan saturasi mungkin merupakan cara tercepat untuk mengidentifikasinya.

Potret grup AI diekspos secara lebih menyeluruh dengan cara ini.



Tapi ada masalah dengannya. Cara ini mungkin tidak akan berhasil jika gambar dikompres menggunakan algoritma JPEG.

Misalnya, pastikan foto tersebut merupakan foto asli.



Namun karena masalah kompresi gambar dan pencahayaan, gigi karakter juga agak buram.



Oleh karena itu, netizen juga mencantumkan lebih banyak cara untuk mengetahui apakah sebuah potret disintesis oleh AI.

Sederhananya, metode pertama adalah mengandalkan pengetahuan dan penilaian manusia.

Karena cara AI mempelajari gambar tidak konsisten dengan manusia, tidak dapat dihindari bahwa AI tidak dapat menangkap 100% informasi visual dari sudut pandang manusia.

Hasilnya, gambar yang dihasilkan AI seringkali mengandungTidak sesuai dengan dunia nyataIni memberikan titik awal untuk identifikasi gambar.

Gunakan gambar di awal sebagai contoh.

Secara keseluruhan, kulit karakternya terlalu mulus dan tidak ada pori-pori yang terlihat. Fitur yang terlalu sempurna ini justru menambah kesan tidak nyata.

Tentu saja, "perasaan tidak realistis" ini tidak sepenuhnya sama dengan "palsu". Lagi pula, pori-pori tidak terlihat pada gambar yang telah diproses dengan mikrodermabrasi.

Tapi ini bukan satu-satunya faktor penilaian. Mungkin tidak hanya ada satu penyimpangan dari akal sehat yang ditinggalkan oleh AI.



Faktanya, jika Anda melihat detail gambar berikut ini, Anda dapat melihat fitur yang relatif jelas——Metode sambungan aneh dari pengait di atas papan nama



Ada juga mikrofon yang menunjukkan kekurangan pada mode saturasi tinggi, dan petunjuknya dapat dilihat langsung dengan mata telanjang setelah amplifikasi.



Yang lebih halus lagi adalah ada beberapa helai rambut di ujung rambut yang berada pada posisi yang sangat tidak masuk akal, namun fitur seperti itu mungkin memerlukan penglihatan tingkat Leeuwenhoek untuk melihatnya.

Namun seiring dengan kemajuan teknologi generasi, fitur-fitur yang dapat ditemukan semakin tersembunyi, yang merupakan tren yang tidak dapat dihindari.



Cara lainnya adalah dengan melihat teks. Meskipun AI secara bertahap mengatasi masalah "karakter hantu" dalam penggambaran font, masih ada beberapa kesulitan dalam menampilkan teks dengan arti sebenarnya yang benar.

Misalnya, beberapa netizen menemukan bahwa pada lencana yang dikenakan oleh orang di foto tersebut, dua huruf di baris terakhir di bawah logo Google adalah "CA", yang artinya California, dan tali panjang di depannya seharusnya adalah nama kota.

Namun nyatanya, tidak ada kota di California yang memiliki nama panjang seperti itu.



Selain detail objek itu sendiri, informasi seperti cahaya dan bayangan juga dapat digunakan untuk mengetahui keasliannya.

Gambar ini diekstraksi dari video, dan ada bingkai seperti itu di video tersebut di mana lokasinya.

Di sisi kanan mikrofon terdapat bayangan yang sangat aneh. Bayangan ini sesuai dengan salah satu tangan karakter.



Terkait video, karena konsistensi konten sebelum dan sesudahnya, AI lebih cenderung mengungkap kekurangan dibandingkan gambar statis.



Ada juga beberapa fitur yang bukan merupakan "kesalahan akal sehat", tetapi juga mencerminkan beberapa preferensi AI saat menghasilkan gambar.

Misalnya, keempat gambar ini semuanya adalah "orang biasa" yang disintesis oleh AI. Apakah Anda menemukan kesamaan?



Beberapa netizen mengatakan bahwa tidak ada satu pun orang di keempat gambar tersebut yang memiliki wajah tersenyum, yang sepertinya mencerminkan beberapa karakteristik gambar yang dihasilkan AI.



Hal ini memang benar untuk gambar-gambar ini, tetapi sulit untuk membentuk sistem untuk penilaian semacam ini. Bagaimanapun, alat menggambar AI yang berbeda memiliki karakteristik yang berbeda.

Singkatnya, untuk mengatasi kemajuan AI secara bertahap, di satu sisi, kita dapat meningkatkan intensitas "Leewenhoek", dan di sisi lain, kita juga dapat memperkenalkan teknik pemrosesan gambar seperti peningkatan saturasi.

Namun jika “perubahan kuantitatif” tersebut semakin terakumulasi, maka akan semakin sulit untuk menilai dengan mata telanjang, dan saturasi gambar suatu hari nanti mungkin dapat dipatahkan oleh AI.

Oleh karena itu, orang-orang juga mengubah pemikiran mereka dan memikirkan metode "model demi model", menggunakan gambar yang dihasilkan oleh AI untuk melatih model deteksi dan menganalisis lebih banyak fitur dari gambar.

Misalnya, gambar yang dihasilkan oleh AI memiliki banyak karakteristik dalam spektrum, distribusi noise, dll. Karakteristik tersebut tidak dapat ditangkap dengan mata telanjang, tetapi AI dapat melihatnya dengan jelas.

Tentu saja, tidak menutup kemungkinan bahwa metode pendeteksiannya tertinggal dan tidak dapat mengikuti perubahan model, atau bahkan pengembang model berspesialisasi dalam pengembangan adversarial.

Misalnya, pada gambar yang dibahas di atas, alat pendeteksi AI hanya memiliki kemungkinan 2% untuk disintesis oleh AI.



Namun, proses permainan antara penipuan AI dan deteksi AI itu sendiri merupakan “permainan kucing-dan-tikus.”

Oleh karena itu, selain deteksi, pengembang model mungkin juga perlu mengambil beberapa tanggung jawab, seperti menambahkan tanda air yang tidak terlihat pada gambar yang dihasilkan AI sehingga penipuan AI tidak dapat disembunyikan.

AI satu kaki lebih tinggi

Perlu disebutkan bahwa banyak potret AI yang menyebabkan kepanikan seperti yang disebutkan di atas berasal dari yang populer baru-baru iniAliranMenghasilkan/berpartisipasi dalam produksi.

Semua orang bahkan sudah mulai berasumsi bahwa efek yang terlalu bagus untuk dibedakan itu dibuat oleh Flux.



Itu dibuat oleh tim asli Stable Diffusion, dan menyebabkan keributan di Internet hanya 10 hari setelah dirilis.

Foto-foto indah dari pembicaraan TED palsu ini semuanya dibuat olehnya.



Yang lain telah menggunakan Flux dan Gen-3 bersama-sama untuk membuat iklan produk perawatan kulit yang indah.



Dan berbagai efek sintesis dari berbagai sudut.



Ini memecahkan masalah seperti pelukis AI dan teks dalam gambar yang dihasilkan AI dengan sangat baik.



Hal ini secara langsung mengarah pada fakta bahwa manusia tidak lagi bisa secara langsung melihat tangan dan kata-kata untuk membedakan gambar AI, tetapi hanya bisa menebak berdasarkan petunjuk.



Flux seharusnya memperkuat pelatihan tangan, teks dan indikator lainnya.

Ini juga berarti bahwa jika AI saat ini terus bekerja keras dalam melatih detail tekstur, warna, dll., pada saat model gambar AI generasi berikutnya keluar, metode pengenalan manusia mungkin menjadi tidak efektif lagi...

Apalagi Flux bersifat open source dan bisa dijalankan di laptop. Banyak orang sekarang berada di Forget Midjourney.

Butuh waktu 2 tahun untuk beralih dari Difusi Stabil ke Fluks.

Butuh waktu 1 tahun untuk beralih dari "Will Smith makan mie" menjadi "pembicara Tedx".

Saya benar-benar tidak tahu trik apa yang harus dilakukan manusia di masa depan untuk membedakan generasi AI...

Tautan referensi:
[1]https://x.com/ChuckBaggett/status/1822686462044754160
[2]https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/
[3]https://www.reddit.com/r/ChatGPT/comments/1epeshq/ini_semuanya_ai/
[4]https://x.com/levelsio/status/1822751995012268062