소식

우리나라가 자체 개발한 영상모델이 전 세계적으로 출시된다.

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

텍스트 설명을 입력하거나 이미지를 업로드하여 실감나는 동영상을 생성하세요. 최근에는 우리나라가 독자적으로 개발한 범용 영상모델인 Vidu(www.vidu.studio)가 글로벌하게 정식 출시되었습니다. 이 대형 비디오 모델은 Wensheng Video와 Tusheng Video의 두 가지 핵심 기능을 열어 4초와 8초의 두 가지 지속 시간 옵션을 제공하고 최대 해상도는 1080P이며 4초 비디오를 생성하는 데 30초 밖에 걸리지 않는 것으로 알려졌습니다. 실제 측정에 따라 클립합니다.


사진은 텍스트 설명을 기반으로 Vidu가 생성한 비디오 화면을 보여줍니다. (사진 제공: 인터뷰 대상자)

Vidu는 Tsinghua University와 Beijing Shengshu Technology Co., Ltd.가 공동 개발했으며 올해 4월 2024 Zhongguancun Forum Annual Meeting에서 처음 출시되었습니다. Tsinghua University 인공 지능 연구소 부원장이자 Beijing Shengshu Technology의 수석 과학자인 Zhu Jun은 Vidu가 "장기 지속 시간, 높은 일관성 및 높은 역동성"을 기반으로 하는 고화질 비디오를 생성할 수 있다고 말했습니다. 텍스트와 사진은 높은 부드러움을 유지하며 매우 역동적인 사진 효과를 제공합니다. 현재 Vidu는 한 번에 최대 32초의 비디오 생성을 지원할 수 있습니다.

"Vidu는 실제 물리적 세계를 시뮬레이션하고, 복잡한 디테일이 있는 장면을 생성하고, 합리적인 빛과 그림자 효과, 섬세한 캐릭터 표현 등 물리적 법칙을 준수할 수 있으며, 깊이와 복잡성이 있는 초현실적인 콘텐츠도 만들 수 있습니다." 공상 과학, 서부, 로맨스, 애니메이션 등과 같은 다양한 유형의 영화에 대해 Vidu는 해당 스타일에 맞는 그림 클립을 생성할 수 있으며 연기, 눈부심 및 눈부심과 같은 영화 및 TV 수준의 특수 효과도 생성할 수 있습니다. 다른 효과.


사진은 텍스트 설명을 기반으로 Vidu가 생성한 특수 효과 화면을 보여줍니다. (사진 제공: 인터뷰 대상자)

보고서에 따르면 역학 측면에서 Vidu는 복잡한 동적 샷을 생성하고 대규모 및 정밀한 액션 생성을 지원하며 화면에서 원거리 샷, 근접 샷, 중간 샷 및 클로즈업과 같은 다양한 샷 간에 전환할 수 있습니다. 롱샷, 트래킹샷 등을 직접 생성할 수 있습니다. 초점, 전환 및 기타 효과.

기자는 Vidu Video와 Tu Sheng Video의 두 가지 기본 기능 외에도 사용자에게 보다 다양하고 개인화된 비디오 제작 경험을 제공하기 위해 Vidu가 '애니메이션 스타일'도 출시했다는 것을 Beijing Shengshu Technology Co., Ltd.로부터 알게 되었습니다. 그리고 "문자" 일관성" 두 가지 새로운 기능이 있습니다. "Tusheng Video" 섹션에서 "Character Consistency" 기능을 사용하여 사용자는 인물 사진이나 맞춤형 캐릭터 사진을 업로드할 수 있으며, 텍스트 설명을 통해 사진 속 캐릭터가 어떤 장면에서든 어떤 동작을 하도록 지정할 수 있습니다. 이 기능은 비디오 제작 과정을 단순화하고 창작의 자유를 높여줍니다.

Vidu를 운영하는 데는 별도의 애플리케이션이 필요하지 않은 것으로 알려졌습니다. 사용자는 이메일 주소로 직접 등록하여 시작할 수 있습니다. Vidu의 기술적 혁신은 R&D 팀의 기계 학습 및 다중 모드 대형 모델에 대한 장기적인 축적에서 비롯됩니다. Vidu의 핵심 기술 아키텍처는 2022년 팀에서 제안되었으며 독립적인 연구 개발을 계속 수행하고 있습니다.

출처: 신화통신

기자: 웨이멍지아

편집자: 장쯔칭

교정: 진 다이신(Qin Daixin)