영상 생성 모델 일관성 문제 해결 위해 중국판 '소라' 비두, '피사체를 한 장의 사진으로 고정'하는 기능 출시

비디오 생성 모델 일관성 문제를 해결하기 위해 중국어 버전 "sora" vidu는 "피사체를 한 장의 사진으로 고정"하는 기능을 출시합니다.

2024-09-11

9월 11일 shengshu technology는 미디어 오픈 데이 이벤트를 개최하고 모든 피사체의 일관된 생성을 달성하여 비디오 생성을 더욱 안정적이고 제어 가능하게 만드는 "주제 일관성" 기능을 출시했습니다. 이 기능은 현재 사용자에게 무료로 공개되어 있는 것으로 알려져 있습니다.

앞서 4월 말, 성수기술과 칭화대학교가 공동 개발한 오리지널 대형 비디오 모델인 vidu가 7월 말에 공식 출시되어 전면적으로 사용 가능하게 되었습니다.

shengshu technology의 ceo tang jiayu는 공개일에 "daily economic news" 기자를 포함한 언론 기자들에게 "주제 참조" 기능은 비디오 모델의 "통제할 수 없는" 한계를 해결하기 위한 것이라고 말했습니다. 현재 비디오 모델에는 약한 연속성, 무작위 출력 등의 제한 사항이 있습니다. 약한 연속성은 비디오가 생성될 때마다 주제, 장면, 스타일 등의 일관성이 보장될 수 없음을 의미합니다. 특히 복잡한 상호 작용이 포함된 경우에는 더욱 그렇습니다. 무작위 출력은 출력 결과가 상대적으로 무작위이며 생성을 위해 지속적인 시도가 필요함을 의미합니다. 거울 움직임 및 조명 효과와 같은 세부 사항을 미세하고 정확하게 제어할 수 없습니다.

shengshu technology ceo tang jiayu의 사진 출처: 사진 제공: li shaoting 기자

이전에 업계에서는 ai 드로잉 도구를 사용하여 분할 사진을 생성하고 먼저 피사체를 사진 수준에서 일관되게 유지한 다음 사진을 비디오로 변환하는 "먼저 ai가 사진을 생성한 다음 사진이 비디오를 생성하는" 방법을 채택하려고 했습니다. 클립을 편집하고 합성합니다.

'주제 참조' 기능에서 사용자는 모든 피사체의 사진을 업로드하여 피사체의 이미지를 잠그고 설명자를 통해 장면을 임의로 전환하고 동일한 피사체의 비디오를 출력할 수 있습니다. 이 기능은 단일 개체에 국한되지 않고 캐릭터, 동물, 상품, 애니메이션 캐릭터, 가상의 주제 등을 포함한 "모든 주제"에 열려 있습니다.

매일 경제 뉴스

보고/피드백

소식

비디오 생성 모델 일관성 문제를 해결하기 위해 중국어 버전 "sora" vidu는 "피사체를 한 장의 사진으로 고정"하는 기능을 출시합니다.

소개

내 연락처 정보