2024-08-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
새로운 지혜 보고서
편집자: 편집부
[새로운 지혜 소개]AI 매핑 도구 Flux는 인터넷 전체를 돌풍으로 몰아넣었습니다. 이 커플 사진은 사실적이고 섬세하며 조명, 질감, 머리카락 모두 완벽합니다. 영상, 소리, 입 모양, AI의 진화가 점점 완벽해지고 있어요!
이해가 되지 않는다면 질문해 보십시오. 요즘 인터넷에 있는 다른 것들은 사실입니까?
Flux는 전체 네트워크에 충격을 주었습니다.
오늘날 오픈 소스 Vincent 그래프 모델 Flux는 전체 인터넷을 휩쓸었습니다.
아래 단체 사진은 모두 AI가 만든 것인가요? 이 블로거는 너무 충격을 받아 자신의 삶을 의심했습니다.
넓은 조리개로 정면 클로즈업으로 얼굴, 근육질, 머리카락 등 결점 하나도 보이지 않습니다.
참고로 배경의 캐릭터들도 매우 자연스럽고 아무런 문제가 없습니다.
렌즈가 더 멀리 떨어져 있고 빛이 더 어두우면 어떻게 되나요? 그것은 또한 자연스럽습니다.
두 인물의 빛과 어둠의 대비는 그야말로 세계적으로 유명한 그림의 빛과 그림자의 질감을 만들어낸다.
그냥 섬세한지 아닌지 물어보면 정말 비현실적이죠?
더 많은 사람이 있어도 Flux는 두려워하지 않을 것입니다.
3명이 있든, 4명이든, 5명이든, 그 이상이든 그 그림은 여전히 틀림없습니다.
까다로운 네티즌들은 여전히 작은 버그를 찾으려고 노력하고 있습니다.
한눈에 가장 쉽게 알아볼 수 있는 것은 AI, 단연 로고에 적힌 텍스트다.
AI의 혼란스러운 노력이 느껴집니다.
AI가 인간의 모자와 목걸이가 어떤 용도로 사용되는지 이해하지 못하는 등 일부 세부 사항도 있으므로 그림에는 여전히 허점이 있을 것입니다.
그건 그렇고, 1년 반 전에 Midjourney V5에서 인터넷을 통해 경험한 커플의 사진은 다음과 같습니다.
두 번째 혁신의 물결이 다가오고 있습니다
이제 인터넷 전체가 Flux 이미지 생성의 폭풍을 일으켰고 사람들은 만장일치로 Flux가 AI 이미지 생성을 새로운 수준으로 끌어올렸다고 한탄했습니다.
AI 매핑이 더 이상 나아질 수 없다고 생각할 때마다 우리가 틀렸다는 것이 다시 증명됩니다.
이 블로거의 말에 따르면 AI가 통제 불능 상태가 되어 판도라의 상자가 열리고 있습니다!
특히 Flux의 뛰어난 이미지 생성 기능과 오픈 소스 재생 가능성은 다양한 2차 창작물, 비디오 및 음성 창작을 위한 훌륭한 공간도 제공합니다.
입소문이 난 TEDx 강연자에 대해서는 굳이 이야기할 필요가 없습니다.
이 네티즌은 Flux, Kering AI, synclabs를 사용해 유명 유튜브 블로거의 영상을 제작했습니다.
아직 AI의 흔적이 남아있지만, 이미지와 영상의 발전은 놀랍습니다.
저자는 자신의 목적이 단순히 인터넷 스타를 만드는 것이 아니라 자동화된 광고, 유튜브, 틱톡 영상, 교육 영상, 마케팅, 설명 강좌 등을 제작하는 것이라고 밝혔다.
AI가 충분히 빨라지면 실시간 생성이 가능하고, FaceTime AI 친구나 AI 치료사가 현실화될 것으로 예상됩니다.
네, AI의 가장 무서운 점은 속도입니다.
AI 단편 영화를 렌더링하는 데는 몇 초 또는 몇 분 밖에 걸리지 않습니다. AI가 세계로 진출한다는 것은 의심의 여지가 없으며 모두가 이에 대해 낙관하고 있습니다.
이 네티즌은 "Flux.1과 Midjourney를 AI 영상에 소개한 뒤 비록 완벽하지는 않지만 이미 지금까지 본 AI 작품 중 최고"라고 퉁명스럽게 말했다.
이 블로거는 Flux와 LoRA를 결합하여 LoRA가 사실주의 이미지와 회화/예술 이미지에도 좋은 처리 효과가 있음을 발견했습니다.
Flux.1과 LoRA는 애니메이션 생성에도 매우 효과적이며 단일 4090으로 실행할 수 있습니다.
이 네티즌은 한 시간도 안 돼서 두 개의 향수 광고를 만들었다고 한다. 그는 직설적으로 말했다: 우리는 AI 영상의 특이점에 가까워졌습니다.
AI 초진화에는 18개월밖에 걸리지 않는다
최근 AI가 생성한 영상을 본 와튼 경영대학원 AI 분야 부교수는 AI가 18개월 안에 진화를 완성할 것이라고 예측했다.
이렇게 보는 이유는 AI 모델의 진화 속도가 상상을 초월하기 때문이다.
예를 들어, 다음의 "비행기에서 Wi-Fi를 사용하는 수달" 사진에서는 1~2주 내에 눈에 띄는 진전이 있었습니다.
1년여가 지난 지금, AI가 어떤 모습으로 진화했는지 살펴보자——
수달의 이미지가 더욱 현실감 있고 귀엽게 느껴질 뿐만 아니라 휴대폰을 조작할 때 손의 움직임도 완벽합니다.
동일한 제품의 발전 속도를 비교해 보겠습니다. MidJourney v3와 v4 사이에는 매우 분명한 개선이 있습니다.
1초만에 머스크로 얼굴바꾸기, 아무것도 드러내지 않은 채 립싱크
뿐만 아니라, 최근 인기 있는 GitHub 연구에서는 사진만으로 라이브 스트리밍을 위해 얼굴을 바꿀 수 있다고 주장했습니다.
아래 영상에서 머스크는 안경을 쓰고 지연 없는 실시간 라이브 방송을 시작한다.
머스크의 어머니조차 속아야 했다.
네티즌들에게 생방송을 위해 얼굴을 바꾸는 데 이용되기도 했던 보스 르쿤도 있다.
현재 이 프로젝트는 GitHub에서 14,000개의 별을 받았으며 인기 급상승 목록에 있습니다.
프로젝트 주소: https://github.com/hacksider/Deep-Live-Cam
동시에 ReSyncer 등 다양한 립싱크 기술도 AI 영상 캐릭터의 입 모양을 매우 자연스럽게 만들어준다.
이 시점에서 AI는 전체 워크플로우를 실행했습니다! 이제부터 인터넷에서 아무리 현실적인 이미지를 보더라도 우리 마음속에는 물음표가 생길 수도 있습니다.
채도를 높이면 AI가 사진에 소심함을 표시합니다.
그렇다면 AI의 흔적을 예리한 눈으로 식별할 수 있는 방법은 없을까?
최근 AI 사진 생성 인기 물결에 편승하여 Google 검색의 전 창립자 중 한 명인 Deedy는 다음과 같은 제안을 했습니다.
AI 사진을 식별하는 가장 좋은 방법은 이미지의 채도를 높이고 마이크 인터페이스와 치아 위치를 주의 깊게 확인하는 것입니다.
예를 들어 최근 화제가 되고 있는 TED 강연자의 사진에서 채도를 200%로 설정하면 충격적인 치아를 볼 수 있습니다.
식별 도구의 코드는 Claude가 작성했으며 공개적으로 사용 가능하다는 점은 언급할 가치가 있습니다.
포털: https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46
그러나 AI가 생성한 또 다른 TED 발표자 사진을 테스트한 결과 결함이 없었습니다.
이 이미지에서는 치아가 이상하지 않고 피사체 색상 영역에서 색상이 더 일관성이 있습니다.
Deedy는 실제 이미지에 대해 JPG 압축을 수행하면 이러한 일관성이 깨질 수 있다고 말했습니다.
네티즌: 네트워크 케이블만 뽑을 수 있어요
AI로 둘러싸인 '트루먼 쇼' 속에 살고 있는 우리, 인류의 마지막 퇴각은 어디일까?
아마도 이제 네트워크 케이블을 뽑아야 할 때인 것 같습니다.
참고자료:
https://x.com/AngryTomtweets/status/1822203767728591350
https://x.com/deedydas/status/1822665923775611374
https://github.com/hacksider/Deep-Live-Cam?continueFlag=4be7aad2ca0a560d6f9019228a8b2d3e
https://x.com/emollick/status/1822774265390985401
https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/