AI 미녀가 모두 사라졌습니다! 사이버 마법 거울 아래 집단적으로 '유령'으로 변한 AI 코드는 AI가 생성한 사진을 방해했다.

AI 미녀가 모두 사라졌습니다! 사이버 마법 거울 아래 집단적으로 '유령'으로 변한 AI 코드는 AI의 사진 제작을 방해했다.

2024-08-12

아오페이 사원(Aofei Temple)의 밍민 크레시(Mingmin Kresi)
Qubits 공개 계정 QbitAI

사이버 마법 거울 아래에서는 모든 AI 미녀들이 유령으로 변했습니다.

와서 그 이빨을 보아라。

이미지 채도를 완전히 높이면 AI 인물의 치아가 매우 이상해지고 경계가 흐려집니다.

전체적인 사진의 색감은 평범한데 마이크 부분은 더욱 이상하네요.

차이실제 사람들의 사진, 이렇게 되어야 합니다.

치아는 깨끗하고 사진의 색상 패치도 균일합니다.

이 도구는 공개되어 있으며 누구나 사진과 함께 사용해 볼 수 있습니다.

AI가 생성한 영상의 특정 프레임은 이 방법을 벗어날 수 없습니다.

빠진 치아의 사진도 문제를 드러낼 수 있습니다.

그런데 이 도구는클로드. AI를 사용하여 멋진 폐쇄 루프인 AI를 해독하세요.

사실, 최근 AI 초상화는 너무 생생해 많은 논의를 불러일으켰습니다. 예를 들어, 인기 있는 "TED 연설자 비디오" 세트에서 실제로는 실제 사람이 아닙니다.

얼굴 구별이 어려울 뿐만 아니라, 기존 AI의 단점이었던 글쓰기도 이제는 완전히 가짜가 될 수 있다.

더 중요한 것은 이러한 AI 초상화를 생성하는 데 드는 비용이 높지 않다는 것입니다. 최저 5분, 20초마다 1.5달러(약 10위안)의 비용으로 수행할 수 있습니다.

이제 네티즌들은 가만히 있지 못하고 AI 위조방지 대회를 잇달아 시작했다.

거의 5,000명의 사람들이 이 두 사진 중 어느 것이 실제 인물인지 토론하기 위해 왔습니다.

주어진 이유는 다양했습니다. 어떤 분들은 텍스트와 패턴 디테일이 너무 추상적이라고 생각하시는 분들도 계시고, 또 어떤 분들은 캐릭터의 눈빛이 공허하다고 생각하시는 분들도 계시는데...

최첨단 AI가 초상화를 생성하는 규칙은 점차 파악되고 있습니다.

자세한 내용을 보지 않고는 알기 어렵습니다

요약하면 채도를 조정하는 것이 채도를 식별하는 가장 빠른 방법일 수 있습니다.

AI 그룹 인물사진은 이런 방식으로 더욱 철저하게 노출됩니다.

하지만 문제가 있습니다. JPEG 알고리즘을 사용하여 이미지를 압축한 경우 이 방법이 작동하지 않을 수 있습니다.

예를 들어 사진이 실제 사진인지 확인하세요.

그러나 이미지 압축 및 조명 문제로 인해 캐릭터의 치아도 약간 흐릿합니다.

이에 네티즌들은 인물 사진이 AI로 합성됐는지 알 수 있는 방법도 다양하게 나열했다.

간단히 말해서 첫 번째 방법은 인간의 지식과 판단에 의존하는 것입니다.

AI가 이미지를 학습하는 방식은 인간과 일치하지 않기 때문에 인간의 관점에서 시각정보를 100% 파악하지 못할 수밖에 없다.

그 결과 AI가 생성한 이미지에는 다음과 같은 내용이 포함되는 경우가 많습니다.현실 세계와 일치하지 않음이는 이미지 식별의 시작점을 제공합니다.

시작 부분의 이미지를 예로 사용하세요.

전체적으로 캐릭터의 피부가 너무 매끄러워 모공이 보이지 않아 너무 완벽한 특징이 오히려 비현실감을 더해줍니다.

물론, 이 "비현실적인 느낌"은 "가짜"와 완전히 동일하지는 않습니다. 미세 박피술을 받은 사진에서는 모공이 보이지 않습니다.

하지만 이것이 유일한 판단 요소는 아닐 수도 있다. AI가 남긴 상식의 일탈은 단 한 가지도 아니다.

사실, 이 사진의 다음 세부 사항을 보면 비교적 분명한 특징을 볼 수 있습니다 ——명판 위 후크의 독특한 연결 방식。

고포화 모드에서 결함이 보이는 마이크도 있는데, 증폭 후 육안으로 단서를 직접 확인할 수 있습니다.

더욱 미묘한 점은 머리카락 끝에 여러 개의 털이 매우 불합리한 위치에 있다는 점인데, 그러한 특징을 보려면 아마도 리우엔훅 수준의 시력이 필요할 것입니다.

그러나 발전기술이 발전하면서 찾을 수 있는 특징이 점점 숨겨지는 것은 피할 수 없는 추세다.

또 다른 방법은 텍스트를 보는 것입니다. AI가 글꼴 묘사에서 "유령 문자" 문제를 점차 극복하고 있지만 올바른 실제 의미로 텍스트를 올바르게 렌더링하는 데는 여전히 몇 가지 어려움이 있습니다.

예를 들어 일부 네티즌들은 사진 속 인물이 착용한 배지에서 구글 로고 아래 마지막 줄의 두 글자가 캘리포니아를 의미하는 'CA'이고 앞에 있는 긴 문자열이 도시 이름이어야 한다는 사실을 발견했습니다.

하지만 실제로 캘리포니아에는 이렇게 긴 이름을 가진 도시가 없습니다.

물체 자체의 세부 사항 외에도 빛, 그림자 등의 정보도 진위 여부를 판단하는 데 사용될 수 있습니다.

이 사진은 동영상에서 추출한 것이며, 해당 사진이 위치한 동영상에는 그러한 프레임이 있습니다.

마이크 오른쪽에는 매우 이상한 그림자가 있습니다. 이 그림자는 분명히 여기의 AI 처리가 부족합니다.

영상의 경우 전후 콘텐츠의 일관성으로 인해 AI는 정적인 이미지보다 결함을 드러낼 가능성이 더 높습니다.

'상식의 오류'는 아니지만 이미지 생성 시 AI의 일부 선호도를 반영하는 기능도 있습니다.

예를 들어, 이 네 장의 사진은 모두 AI가 합성한 '보통 사람들'의 모습입니다. 공통점을 찾으셨나요?

일부 네티즌들은 이 네 장의 사진 속 인물 중 웃는 얼굴이 한 명도 없다고 말했는데, 이는 AI가 생성한 사진의 일부 특성을 반영하는 것으로 보인다.

이런 그림들도 마찬가지지만, 결국 이런 판단을 위한 시스템을 형성하기는 어렵습니다. AI 그리기 도구마다 특성이 다르기 때문이죠.

요컨대 AI의 점진적인 발전에 대응하기 위해 한편으로는 '리웬훅'의 강도를 높일 수 있고, 다른 한편으로는 채도를 높이는 등의 영상 처리 기술을 도입할 수도 있다.

하지만 이런 '양적 변화'가 점점 더 쌓이면 육안으로 판단하기가 점점 어려워지고, 언젠가는 AI에 의해 이미지 채도가 깨질 수도 있다.

따라서 사람들은 AI가 생성한 이미지를 사용하여 탐지 모델을 훈련하고 이미지에서 더 많은 특징을 분석하는 "모델별" 방법에 대한 생각과 생각을 바꾸고 있습니다.

예를 들어 AI가 생성한 이미지는 스펙트럼, 노이즈 분포 등 많은 특성을 갖고 있습니다. 이러한 특성은 육안으로는 포착할 수 없지만 AI는 이를 명확하게 볼 수 있습니다.

물론 탐지 방법이 뒤쳐져 모델 변경을 따라잡지 못하거나 모델 개발자가 적대적 개발에 특화되어 있을 가능성도 배제할 수는 없습니다.

예를 들어 위에서 설명한 그림에서 AI 탐지 도구는 AI에 의해 합성될 확률이 2%에 불과합니다.

그러나 AI 사기와 AI 탐지 사이의 게임 과정은 그 자체로 '고양이와 쥐 게임'이다.

따라서 탐지 외에도 모델 개발자는 AI 사기가 숨을 곳이 없도록 AI 생성 이미지에 보이지 않는 워터마크를 추가하는 등 일부 책임을 져야 할 수도 있습니다.

AI는 키가 1피트 더 크다

위에서 언급한 것처럼 패닉을 일으킨 AI 인물화 중 상당수는 최근 인기를 끌고 있는 AI 인물화라는 점을 언급할 필요가 있다.유량제작/제작에 참여합니다.

구별하기에는 너무 좋은 효과가 Flux에서 만들어지는 것이라고 모두가 가정하기 시작했습니다.

스테이블 디퓨전(Stable Diffusion) 원팀이 만든 작품으로, 출시 10일 만에 인터넷상에서 난리를 일으켰다.

가짜 TED 강연의 아름다운 사진은 모두 그것으로 만들어졌습니다.

다른 사람들은 Flux와 Gen-3를 함께 사용하여 아름다운 스킨 케어 제품 광고를 만들었습니다.

그리고 여러 각도에서 다양한 합성 효과를 볼 수 있습니다.

AI 화가, AI가 생성한 그림 속 텍스트 등의 문제를 매우 잘 해결합니다.

이는 인간이 더 이상 AI 그림을 구별하기 위해 손과 단어를 직접 볼 수 없고 단서를 바탕으로 추측만 할 수 있다는 사실로 직접 이어진다.

Flux는 손, 텍스트 및 기타 지표에 대한 교육을 강화해야 합니다.

이는 또한 현재의 AI가 텍스처 디테일, 색상 등의 훈련을 계속해서 열심히 한다면, 차세대 AI 드로잉 모델이 나올 때쯤에는 인간의 인식 방법이 다시 비효율적이 될 수도 있다는 것을 의미합니다...

또한 Flux는 오픈 소스이므로 랩톱에서 실행할 수 있습니다. 현재 많은 사람들이 Forget Midjourney에 있습니다.

Stable Diffusion에서 Flux로 가는 데 2년이 걸렸습니다.

'면을 먹는 윌 스미스'에서 'Tedx 스피커'가 되기까지 1년이 걸렸다.

AI 세대를 구별하기 위해 인간이 앞으로 어떤 트릭을 생각해내야 할지 정말 모르겠습니다...

참조 링크:
[1]https://x.com/ChuckBaggett/상태/1822686462044754160
[2]https://www.reddit.com/r/artificial/comments/1epjlbl/평균적인_모습_사람들/
[3]https://www.reddit.com/r/ChatGPT/comments/1epeshq/these_are_all_ai/
[4]https://x.com/레벨시오/상태/1822751995012268062

소식

AI 미녀가 모두 사라졌습니다! 사이버 마법 거울 아래 집단적으로 '유령'으로 변한 AI 코드는 AI의 사진 제작을 방해했다.

자세한 내용을 보지 않고는 알기 어렵습니다

AI는 키가 1피트 더 크다

소개

내 연락처 정보