소식

국내 AI 영상 대형 모델 전개 실무 경험 측면에서 누가 소라를 능가할 수 있을까?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

표지 뉴스 기자 Xiong Yingying
올해 초 미국 기업 오픈AI(OpenAI)는 지상의 천둥과도 같은 AI 영상 생성 모델 소라(Sora)를 출시해 인공지능 응용에 새로운 가능성을 제시했다. 당시 많은 네티즌들은 우리와 외국 AI 기술의 격차가 점점 더 벌어지고 있다고 한탄했다.
그러나 불과 반년 만에 케링(Keling), 픽스버스 V2(PixVerse V2), 칭잉(Qingying), 비두(Vidu) 등 '국내 소라'가 잇달아 출시돼 사용자들에게 무료로 공개되고 있다.
국내 영상모델은 어떤게 좋은가요? 기술은 계속해서 발전하고 있지만, 상용화는 누가 주도할 수 있을까요?
이달 내 '국산 소라' 4개 제품 출시
기자의 실제 테스트 경험
국내 대형 제조사와 대형 모델 간 가격 전쟁이 치열한 가운데 일부 기업은 AI 영상 생성 분야에 집중하며 은밀한 노력을 펼치고 있다. 불완전한 통계에 따르면 현재 국내 대형 AI 영상 모델은 10개 이상이다. 올해 7월에만 '국산 소라' 모델이 4개나 온라인에 출시됐다.
7월 6일, Kuaishou Keling AI 웹페이지가 공식 출시되어 최대 10초의 동영상을 생성할 수 있는 Wensheng 비디오 및 Tusheng 비디오 기능을 제공하며, 카메라 이동 제어, 첫 번째 및 마지막 프레임 사용자 정의 등의 기능도 추가되었습니다.
7월 24일, Aishi Technology는 전 세계 동시 출시 예정인 PixVerse V2를 공식 출시했습니다. 이 모델은 한 번에 여러 개의 비디오 클립을 생성할 수 있으며 단일 클립의 경우 8초, 여러 클립의 경우 40초의 비디오 생성을 달성할 수 있습니다.
이어 Zhipu AI Company가 만든 Qingying과 Shengshu Technology가 독자적으로 개발한 Vidu도 차례로 출시되었습니다. 그중 Qingying은 30초 이내의 빠른 생성에 중점을 두고 있으며 Vidu는 일반적인 사실적 스타일에 애니메이션 스타일의 비디오 클립 생성을 추가합니다.
위 4개사의 대형 영상 생성 모델은 현재 테스트를 위해 공개됐으며, 전화, 이메일 등을 통해 빠르게 등록한 후 기자들 역시 실제 체험을 하게 됐다.
'사진 동영상' 기능을 테스트하기 위해 기자는 4개의 대형 모델 웹사이트에 동일한 장미 사진을 업로드하고 '꽃이 피다'라는 프롬프트 단어를 입력하여 성공적으로 장미를 생성했습니다. 꽃이 피는 영상. PixVerse와 Keling이 생성한 비디오에서는 꽃이 흔들리는 것을 볼 수 있지만 "꽃이 핀다"는 역동적인 효과는 없습니다. 그러나 기자가 프롬프트 단어를 "천천히 피는 꽃"으로 바꾸자 Keling은 장미가 피는 영상도 성공적으로 생성했습니다. 언어를 처리하고 이해하는 다양한 대형 모델의 능력에는 차이가 있음을 알 수 있습니다.
국내 대형 모델 4대가 제작한 영상 스크린샷
영상 생성 속도로 보면 Vidu가 1분도 안 되는 시간에 3초짜리 영상을 생성해 가장 빠른 속도를 기록했다. 나머지 3개의 대형 모델은 모두 5분 이내에 영상 생성을 완료했습니다. Qingying은 "30초 빠른 생성"을 광고하지만 시도하는 사람이 너무 많아서인지 생성 페이지에는 "3분 동안 대기할 것으로 예상됩니다"라고 표시됩니다.
소셜 플랫폼에 대한 네티즌들의 경험 피드백에 따르면 모든 주요 모델에는 문자 왜곡 및 이미지 누락과 같은 문제가 다소 있습니다.
"기다리고 지켜보는 사람은 많지만 행동으로 옮기는 사람은 거의 없습니다."
대형 모델 분야 투자는 신중한 편
연초 소라가 태어났을 때 인터넷에는 여전히 AI 분야에서 중국이 미국에 크게 뒤처졌다는 비관적인 목소리가 있었다. 불과 반년 만에 소라와 경쟁하는 대형 AI 영상 모델이 중국에서 대거 등장했다.
Tianyancha는 2019년에 설립된 Zhipu AI가 시리즈 C 자금 조달을 완료했으며 현재 가치가 100억 달러 이상임을 보여줍니다. Aishi Technology와 Shenshu Technology는 2023년에야 설립되었지만 각각 3차와 4차의 자금 조달을 완료했습니다. 이는 투자계가 여전히 대형 모델 경주 트랙에 대한 투자에 매우 열성적이라는 것을 의미합니까?
"기본적으로 우리는 여전히 더 많은 것을 보고 투자는 거의 하지 않습니다." 엔젤 투자자이자 인공 지능 분야 전문가인 Guo Tao는 현재 가장 큰 투자자는 여러 대형 모델에 광범위하게 투자한 여러 주요 인터넷 회사라고 말했습니다. 프로젝트. 한편으로, 대형 제조업체는 기존 비즈니스에서 대형 비디오 모델에 대한 몇 가지 적용 시나리오를 찾을 수 있습니다. 반면에 이러한 대형 모델이 회사 자체 비즈니스와 어느 정도 중복되는 경우 이를 보완적으로 사용할 수 있습니다. 제품 라인도 가능합니다. 기존 생태 자원을 통해 이러한 대형 모델 회사는 어느 정도 권한을 부여받게 됩니다.
Zhipu AI 회사는 여러 차례의 자금 조달을 통해 1억 위안 이상을 모금했습니다.
전반적으로 국내 투자기관들은 빈센트비디오, 투시비디오 등 대형 모델에 대해 여전히 보수적이고 신중한 태도를 취하고 있다.
궈타오의 견해로는 소라이든 국내 대형 모델이든 생성된 동영상에는 여전히 결함이 있습니다. 예를 들어, AI로 생성된 캐릭터는 때때로 손가락이 더 있고, 촬영 시 바구니를 칠 수 없는 등의 현상이 발생합니다. 이는 대형 모델이 객체 간의 공간 관계에 대한 이해가 부족하다는 것을 보여주며, 알고리즘 모델도 더욱 개선되어야 합니다.
아직 극복해야 할 기술적 문제 외에도, 대형 AI 영상 모델 상용화의 가장 큰 문제점은 성숙한 적용 시나리오가 부족하다는 점이다.
"예를 들어 Kuaishou 자체에는 플랫폼과 콘텐츠가 있고 상대적으로 특정 응용 시나리오가 있습니다. 많은 셀프 미디어 회사가 이를 사용할 수 있지만 일부 순수 기술 회사의 경우 여전히 이를 찾기가 어렵습니다." . 사용자가 기꺼이 지불할 의사가 있는 특히 훌륭하고 엄격한 수요 시나리오입니다.
플랫폼으로 상용화 탐색 가속화
마이크로단편드라마 시장이 선점할 것으로 예상
상용화에 어려움이 있음에도 불구하고 국내외 대형 모델 플랫폼에서는 상용화를 적극적으로 모색하고 노력하고 있습니다.
기자는 현재 국내 AI 영상 모델도 소비자 측에서 비용을 지불하기 시작했다고 지적했다. 7월 24일 Keling AI의 공식 WeChat 게시물은 권한을 신청한 사용자 수가 100만 명을 초과했다고 밝혔습니다. 같은 날 골드, 플래티넘, 다이아몬드의 세 가지 멤버십 카테고리를 포함하는 유료 멤버십 시스템이 동시에 출시되었습니다. 연간 회원 가격은 500위안 이상부터 5,000위안 이상까지 다양합니다.
PixVerse는 기본 버전, 표준 버전, 무제한 버전을 포함한 구독 결제 모델을 채택하고 있으며 단가는 5위안~60위안입니다.
그러나 많은 업계 관계자들은 현재 대형 AI 모델은 컴퓨팅 파워 비용과 고객 확보 비용이 매우 높으며 사용자 결제 습관이 아직 형성되지 않았으며 시장 경쟁이 전적으로 치열하기 때문에 수익성을 달성하기가 쉽지 않다고 말했습니다. C측 결제 시.
언론 보도에 따르면 올해 6월 세계적인 어린이 장난감 브랜드 '토이저러스'가 오픈AI와 협력해 소라가 제작한 1분짜리 상업영화 '토이저러스의 기원'을 영화에 활용했다고 한다. 실현 가능한 상업 광고를 생성합니다.
지난 7월 국내 최초 AIGC 오리지널 판타지 마이크로 단편 드라마 '산해의 이상한 거울:파도를 가르며'가 정식 런칭됐다. 드라마는 총 5부작, 15분 분량의 드라마로 날카로운 칼날을 자랑하는 주인공 소년이 등장한다. , 환상적인 Kunpeng과 이상한 짐승 등은 모두 AI에 의해 생성됩니다.
점점 더 많은 제작사와 플랫폼이 'AI+마이크로단편드라마' 통합 경로를 모색하기 시작하면서 마이크로단편드라마 시장에서 AI 영상 대형 모델이 가장 먼저 상용화될 수도 있다.
보고/피드백