소식

불쾌한 계곡 너머! 전 세계 500만 네티즌이 속았는데, 인기 TEDx 강연자 중 실제 사람은 한 명도 없었다고요?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



  새로운 지혜 보고서

편집자: Aeneas 너무 졸려
[새로운 지혜 소개]최근 이 TED 강연자들이 인터넷에서 입소문을 타고 있습니다. 하지만 그들은 실제 인물이 아닙니다. ! 정답이 공개되자 500만 네티즌들은 충격에 빠졌다. 이 5장의 사진에서 얼마나 많은 버그를 찾을 수 있나요?

최근 이러한 "TED 연설자"는 인터넷에서 큰 인기를 얻었으며 바이럴이라고 할 수 있습니다.

자세히 살펴보세요. 어떤 문제라도 발견할 수 있나요?

답이 공개됩니다. 이 다섯 사람 중 누구도 실제 사람이 아닙니다!

온라인에서 누군가를 찾는 남자는 울 것이다

너무나 생생하고 거의 완벽에 가까운 이 수준의 사진 생성 AI는 네티즌들에게 직접적인 충격을 주었습니다.
AI 인식 소프트웨어조차 이것이 AI가 생성한 이미지인지 인식할 수 없다.

"진짜처럼 보이는데, 진짜 사진이라서 그런 거 아닌가요?"

"그들 중 실제 사람은 아무도 없나요? 너무 소름끼치네요!"

네티즌들은 '불쾌한 계곡'을 넘어 '초현실적인 계곡'에 이르렀다는 반응을 보였다.

불과 몇 시간 만에 이 사진을 공유한 게시물은 트위터에서 조회수 500만 회 이상을 기록했습니다.

나중에 저자도 밝혀졌습니다. 그는 Stable Diffusion 팀의 전 멤버였던 Leo Kadieff였습니다.

그는 다음과 같이 밝혔습니다. 이 TEDx 스피커는 모두 LoRA의 최신 Flux 실제 버전을 사용하여 제작되었습니다.

과거에는 AI가 생성한 사진이 인간의 눈과 다소 불일치했지만, 이번에는 사진이 너무 생생합니다. LoRA 기술을 사용한 개선된 모델 덕분에 사실감이 크게 높아졌습니다.

게다가 이 워크플로는 복잡한 프롬프트 단어를 크게 단순화할 수 있는 장점도 있다고 저자는 말했습니다.

이 소식은 단순히 프롬프트 단어 마스터를 황홀하게 만듭니다.

이 작은 22MB 파일을 사용하면 각 프롬프트 단어에 여러 개의 진위 관련 토큰을 작성하는 수고를 덜 수 있습니다.

"초현실적인 RAW 사진, UHD, 8k"라는 한 문장이면 충분합니다. 사실주의를 사랑하는 분들이라면 이 도구를 정말 좋아하실 것입니다.

저자는 이를 직설적으로 표현합니다. 여전히 현실적인 모델을 미세 조정해야 합니까?

- 이 이미지는 업스케일링이나 후처리 없이 Flux+LoRA의 원시 출력입니다.

로라:https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

ComfuUI:https://we.tl/t-zrC5tPFG17

LoRA의 실제 버전, 뛰어난 효과

LoRA를 사용할 때와 사용하지 않을 때의 효과가 실제로 매우 분명하다는 것을 아래 두 그림을 보면 어렵지 않게 알 수 있습니다.

네티즌들은 재미있다.

동시에 'TED Speaker' 공유자인 키라니오(Kyranio)도 미드저니(Midjourney)로 이를 재현하려고 시도했다.

초기 프롬프트 단어는 다음과 같습니다.

무대에서 연설하는 여성, Google, 흰색 배경, 회사 ​​로고가 흐릿함, 기술 회의 --스타일 원시 --v 6.1

생성 효과가 나쁘지 않다는 것을 알 수 있지만 Leo Kadieff가 생성한 사진과는 여전히 큰 격차가 있습니다.

그런 다음 블로거는 몇 가지 개선 사항을 적용했습니다.

무대에서 웃으며 말하는 젊은 여성, Google, 흰색 배경, 흐릿한 회사 로고, 기술 컨퍼런스 --스타일 원시 --v 6.1

그리고 여러 세대를 거쳐 가장 가까운 결과를 시도했습니다.

동시에 Google Imagen 3가 공개되면서 네티즌들도 처음으로 이러한 메시지를 시도했습니다.

한동안 인터넷을 통해 AI 사진 생성 열풍이 불기 시작했습니다.

Imagen 3은 누구나 사용할 수 있습니다.


맞습니다. 방금 언급했듯이 Google의 가장 강력한 Vincentian 그래프 모델인 Imagen 3가 공식적으로 출시되었습니다.

프롬프트: 뉴욕에서 "Imagen은 이제 Midjourney만큼 좋습니다"라고 쓰인 간판을 든 남자의 사진.

출처: 리스피어

네티즌 chrypnotoad는 아킬레스의 방패를 이렇게 잘 할 수 있는 AI를 본 적이 없다고 말했습니다!

이렇게 복잡한 프롬프트를 쉽게 처리할 수 있는 Imagen 3는 과소평가될 수 없습니다.

유명한 블로거 "Guizang"은 경험 후 다음과 같이 말했습니다.

생성된 콘텐츠는 정확하지만 이미지 미학이 좋지 않습니다. 캐릭터가 포함된 만큼 프롬프트 작성 방법을 신중하게 고려해야 하며, 그렇지 않으면 그림이 제작되지 않을 확률이 높습니다.

다행히도 그들은 즉각적인 단어로 대화를 잘 했습니다.

LLM은 프롬프트 단어 유형을 분석하고 직접 전환할 수 있는 관련 단어를 제공합니다.

출처 : 구장