소라는 구식인가요? meta의 "가장 강력한 비디오 모델"은 dit를 사용하지 않고 llama를 사용하여 기적을 달성합니다.

소라는 구식인가요? meta의 "최강 비디오 모델"은 dit를 사용하지 않고 llama를 사용하여 기적을 행합니다.

2024-10-05

저자 │왕자오양

openai sora의 주요 기술 리더가 google로 가서 openai sora가 내부 품질 문제로 어려움을 겪고 있다는 여러 보고서가 지적되는 시점에서 meta는 무의식적으로 비디오 모델인 "movie gen"을 공개하고 완전한 평가 시스템을 직접 사용했다고 선언했습니다. 소라를 물리쳤습니다.

더욱 잔인한 점은 메타도 '사람을 죽인다'는 점이다. 이 모델은 소라처럼 대중에게 공개되지는 않지만, 95페이지 분량의 새 모델에 대한 기술 보고서를 만들었다(오픈소스는 아니지만 많은 내용을 담고 있다). ) 공개하고 모든 사람에게 말했습니다.

이 모델은 실제로 sora를 물리쳤을 뿐만 아니라 새로운 테크니컬 루트도 사용했습니다. 이는 sora의 테크니컬 루트가 오늘날 더 이상 가장 발전된 루트가 아니라는 것을 증명했습니다.

vincent video 플레이어 여러분, sora를 '복사'하지 마세요.

"미디어 받침대 모델"

정확하게 말하면 meta는 "ai 생성 미디어 콘텐츠"를 달성하기 위해 만들어진 일련의 모델을 출시했습니다. 이는 또한 이 기술 문서의 제목이 의미하는 바이기도 합니다. movie gen: a cast of media foundation models

이 세트에는 다음이 포함됩니다:

가장 큰 기본 gen video 생성 모델인 movie gen video에는 300억 개의 매개변수가 있습니다.

가장 큰 기본 비디오 생성 오디오 모델인 movie gen audio에는 130억 개의 매개변수가 있습니다.

movie gen video 모델을 추가로 사후 학습하여 얻은 personalized movie gen video는 개인의 얼굴을 기반으로 개인화된 비디오를 생성하는 데 사용됩니다. 정확한 비디오 편집을 위해 movie gen edit를 생성하는 새로운 사후 교육 프로세스가 있습니다.

소식

소라는 구식인가요? meta의 "최강 비디오 모델"은 dit를 사용하지 않고 llama를 사용하여 기적을 행합니다.

소개

내 연락처 정보