소식

PixVerse V2가 출시되었습니다!단숨에 5개의 '소라'를 생성하고, 영상 생성 트랙 '볼륨'이 날아간다

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


작성자 |

이메일 | [email protected]

"너무 곱슬이야!"

6월 이후 비디오 생성 제품은 Keling에서 Luma 및 Runway Gen3에 이르기까지 모델 기능과 제품화 효과가 점점 더 좋아지고 있습니다.

방금 PixVerse는 V2 버전을 출시했습니다. DiT 아키텍처를 업데이트하는 것 외에도 실제로 5개의 "Sora" 효과 비디오 콘텐츠를 연속으로 생성할 수 있습니다!

국수를 먹는 고양이, 오토바이를 타는 개 등 창의적인 테스트에서 PixVerse V2의 비디오 선명도, 역동적인 품질 및 미학이 모두 좋은 성능을 보였습니다.

실리콘스타에 따르면,시공간 주의 메커니즘과 결합된 DiT(확산 + 변환기) 아키텍처를 기반으로 PixVerse V2는 모델 기능에서 단계적인 업그레이드를 거쳤습니다.한 번에 8초 비디오 생성을 지원하는 동시에 비디오의 다이나믹 레인지, 디테일 표현 및 신뢰성을 크게 향상시킵니다. 또 다른 주요 업데이트는 PixVerse V2가 1~5개의 연속 비디오 콘텐츠의 원클릭 생성을 지원한다는 것입니다. 클립은 메인 이미지, 사진 스타일, 장면 요소의 일관성을 자동으로 유지합니다. 즉, 누구나 쉽게 40초짜리 비디오 콘텐츠를 생성할 수 있습니다!

생성 효과의 관점에서 볼 때, 생성된 비디오 콘텐츠의 PixVerse V2 버전은 정보 밀도가 더 높고 몇 초 안에 더 많은 정보를 전송할 수 있습니다. 동시에 일관성이 업그레이드되어 생성된 콘텐츠가 생성됩니다. 반면에 V2의 제품 디자인은 복잡한 기능을 최대한 단순화하여 초보자도 만들 수 있습니다.

우리는 비디오 생성 모델 기술과 제품이 지속적으로 반복됨에 따라 국내외를 불문하고 일반 사용자가 엄청난 수요를 보이고 있음을 발견했습니다. AI 영상 콘텐츠 제작은 전문가 그룹에만 국한되지 않고, 일반 사용자들도 간단하고 직관적인 도구를 통해 자신의 창의성과 아이디어를 표현하고 싶어합니다.

이러한 관점에서 PixVerse V2의 제품 버전을 살펴보면 모든 기능이 사용자에게 더 가까워지기 위해 노력하고 있음을 알 수 있습니다.

1

1. 모든 반복은 사용자에게 한 걸음 더 가까워집니다.

PixVerse는 출시 이후 기술 혁신과 사용자 요구에 대한 깊은 통찰력을 기반으로 가장 인기 있는 비디오 생성 제품 중 하나가 되었습니다.

최신 V2 버전의 획기적인 기능 중 하나는 비디오 간 요소의 일관성과 일관성을 유지하면서 동시에 여러 비디오를 생성하는 기능입니다. 이 기능은 제작자가 테마나 스토리라인을 중심으로 상호 연관된 일련의 비디오 클립을 생성할 수 있도록 하는 긴 형식의 비디오 콘텐츠를 만드는 데 매우 중요합니다.


평가 결과 PixVerse V2는 복잡한 장면과 긴 비디오 시퀀스를 처리할 때 우수한 성능을 발휘하는 것으로 나타났습니다. 동일한 캐릭터 이미지는 서로 다른 장면 설정 사이를 자유롭게 이동할 수 있습니다. 또한 일관성은 시각적 일관성에만 국한되지 않고 액션과 플롯의 원활한 전환도 포함하며 이는 내러티브 비디오에 특히 중요합니다.

또 다른 특징은 향상된 사용성입니다. 짧은 클립만 생성할 수 있고 지속적인 "카드 그리기"와 2차 편집이 필요한 시중의 "창의적인 장난감"과 달리 PixVerse V2는 고품질 비디오 클립을 생성할 수 있을 뿐만 아니라 짧은 클립의 창의성을 확장하여 직접 출력할 수 있습니다. 완전하고 사용 가능한 창의적인 콘텐츠.

이 기능을 통해 PixVerse V2는 더 이상 보조 편집을 위한 짧은 샷 생성에만 국한되지 않고 여러 플랫폼과 여러 장면에서 사용할 수 있는 완전한 비디오를 직접 출력할 수 있습니다.

실제 평가에서 PixVerse V2의 이 기능은 비디오 제작의 효율성과 편의성을 크게 향상시켰습니다. 사용자는 더 이상 영상 편집과 합성에 많은 시간을 할애할 필요가 없으며 창의성과 콘텐츠 자체에 더 집중할 수 있습니다. 소셜 미디어에 공유하기 위한 짧은 영상이든 연속성이 필요한 극적인 영상이든 PixVerse V2는 원스톱 솔루션을 제공할 수 있습니다. 향상된 사용성으로 인해 AI 영상 생성 기술의 적용 범위가 더욱 넓어져 일반 사용자와 전문 창작자 모두가 혜택을 누릴 수 있습니다.


PixVerse V2의 기술 혁신과 사용자 경험의 다양한 개선을 볼 수 있습니다. Silicon Star에 따르면 PixVerse V2는 기본 모델에 혁신적인 시공간 주의 메커니즘을 도입하여 확산 시공간 모델링에서 획기적인 발전을 이루었으며 복잡한 장면에 대한 처리 기능을 크게 향상시켰습니다. 동시에 강력한 텍스트 이해 기능을 통해 모델은 텍스트 프롬프트를 비디오 콘텐츠와 보다 정확하게 일치시켜 심층적인 다중 모드 융합을 달성할 수 있습니다.

또한 PixVerse V2는 컴퓨팅 효율성 측면에서도 최적화되었습니다. 기존 흐름 모델을 개선하고 손실 함수에 가중치를 부여함으로써 모델이 더 빠르게 수렴할 수 있어 비디오 생성 속도와 정확도가 향상됩니다. 3D VAE 모델의 도입과 시공간 주의 메커니즘의 적용으로 비디오 압축 및 재구성 품질이 더욱 향상되어 비디오 콘텐츠의 효율적인 전송 및 저장이 보장됩니다.

출시 이후 PixVerse의 몇 가지 주요 이정표를 되돌아보면 그 이면에는 기술적 강점뿐만 아니라 시장과 사용자 요구에 대한 예리한 이해가 있음을 알 수 있습니다.

지난 5월 PixVerse는 혁신적인 모션 브러시 기능을 출시했습니다. 이 기능을 사용하면 사용자는 단순히 궤적을 그리는 것만으로 비디오의 특정 영역의 움직임을 제어할 수 있으므로 비디오 제작의 유연성과 직관성이 크게 향상됩니다. 특정 시나리오의 사용에는 애니메이션 제작, 광고 창의성, 소셜 미디어 콘텐츠 생성 등이 포함되지만 이에 국한되지는 않습니다. 사용자들의 피드백은 일반적으로 긍정적이었습니다. 이 기능은 비디오 편집 프로세스를 크게 단순화하여 제작을 더욱 자유롭고 직관적으로 만들어준다고 합니다.

제품 기능 설정 측면에서 사용자가 기본적으로 생성된 결과에 만족하지만 세부 사항을 조정하려는 경우 PixVerse는 보조 편집 및 자유 변환 기능을 지원하여 사용자가 다양한 플랫폼 및 시나리오의 요구에 따라 비디오 디스플레이 효과를 유연하게 조정할 수 있습니다. 또한 PixVerse는 다양한 스타일과 종횡비를 선택할 수 있어 사용자에게 비디오 제작에 있어 더 높은 자유도를 제공합니다.


모션 브러시부터 캐릭터 일관성 기능, V2 버전의 일관된 영상 생성까지 모든 업데이트가 사용자에게 한 걸음 더 가까워졌습니다. 이러한 사용자 중심의 혁신적인 개념은 PixVerse를 기술로 구현된 제품일 뿐만 아니라 사용자의 창의성을 실현하는 파트너로 만듭니다.

1

2. 깊이가 혁신을 결정한다

비디오 생성 제품이 장난감인지 생산성 도구인지 평가할 때 정보 밀도는 콘텐츠 품질을 나타내는 중요한 지표입니다.

작은 공이 빈 배경 위에서 불규칙하게 움직이면 무한한 시간 동안 움직일 수 있지만 정보를 제공하는 것은 거의 없습니다.

PixVerse V2에서 Aishi Technology는 기술적 수단을 통해 비디오 생성의 정보 밀도를 높이려고 시도하여 사용자가 지루한 비디오 자료 편집에서 해방되고 창의적인 비디오 콘텐츠 제작에 직접 참여할 수 있습니다. 궁극적으로 일관성을 추구하여 여러 클립의 본체가 변경되지 않도록 하고 기타 기능은 모두 비디오 자료에서 게시 가능한 비디오 콘텐츠로 직접 이동하는 것을 목표로 합니다.

PixVerse의 제품 관리자는 다음과 같이 말했습니다. 팀은 항상 "사용자와 함께 걷는다"는 제품 아이디어를 고수합니다. 제품 개발 초기 단계에서는 업계 실무자와의 소통, 실제 사용자 관찰, 커뮤니티 피드백 수집 등 심도 있는 사전 조사를 실시할 예정이다. 이 종합적인 사용자 조사 방법을 통해 Aishi는 미묘하지만 중요한 사용자 요구 사항을 포착할 수 있습니다. 사용자가 제안한 작은 특징점도 진지하게 받아들이고 테스트됩니다.

이 사용자 중심의 혁신적인 개념은 PixVerse의 기능을 사용자의 실제 요구에 더 가깝게 만듭니다. 아이시 제품 매니저는 아이시 제품 제작의 대표적인 대표주자인 매직브러쉬의 탄생 과정을 공유했다.

올해 초 Runway는 첫 번째 브러시인 모션 브러시를 출시했습니다. 사용자는 다양한 브러시를 선택하고 아래 제어 버튼을 조정하여 피사체의 이동 궤적을 조정할 수 있습니다. 이 기능을 확인한 후 시장 조사, 사용자 인터뷰 및 커뮤니티 피드백을 통해 사용자는 보다 유연한 비디오 편집 도구에 대한 수요가 높지만 모션 브러시의 상호 작용 방법은 충분히 유연하지 않고 디버깅이 정확하지 않으며 충분히 통제 가능하다.


이러한 필요성을 발견한 후 PixVerse 제품 팀은 다음과 같은 논의에 집중했습니다. 어떤 상호 작용 방법을 통해 사용자가 브러시 기능을 보다 직관적이고 간결하게 사용할 수 있습니까?

예비 사용자 조사를 바탕으로 제품 팀은 우선 사용자가 여러 피사체의 모션 궤적을 디버그해야 하며 모션 브러시에는 파티션 선택 기능이 없으며 두 번째로 피사체를 선택한 후 피사체의 움직임 궤적이 변경 가능하다는 사실을 발견했습니다. , 위, 아래, 왼쪽, 오른쪽 컨트롤 버튼은 실제 움직임 효과를 시뮬레이션할 수 없습니다. 따라서 제품팀은 Magic Brush를 만들 때 스미어링 방법, 지능적인 파티션 선택, 사용자가 360도에서 자유롭게 모션 궤적을 그릴 수 있는 대화형 방법을 선택했습니다.


그러나 이러한 종류의 상호 작용 방법은 사용자에게는 편리하지만 더 큰 기술적 과제를 안겨줍니다. Aishi 기술팀은 DiT 아키텍처를 기반으로 사용자의 스트로크 입력을 분석하여 영상 속 모션 효과로 변환하는 Magic Brush 기능을 지원하는 핵심 알고리즘을 개발했습니다.

매직브러시는 사용자의 니즈 발굴부터 제품 프로젝트 수립, 기술적 솔루션까지 단 한 달 만에 빠르게 출시되었습니다. 이는 Aishi의 "짧고, 평평하고, 빠른" 회사 운영 모델과 분리될 수 없습니다.

마케팅 부서에서는 사용자 피드백을 신속하게 수집하고 적시에 제품 및 기술 팀에 전달할 수 있습니다. 이러한 신속한 정보 흐름과 의사 결정 프로세스를 통해 Aishi는 요구 사항의 타당성을 신속하게 고려하고 A/B 테스트를 수행하며 빠른 결정을 내릴 수 있습니다. 이러한 민첩성은 스타트업의 고유한 장점이자 Aishi가 제품을 빠르게 반복하는 능력의 핵심이기도 합니다.

대규모 기술 회사와 비교하여 스타트업은 응답 속도와 유연성 측면에서 확실한 이점을 가지고 있습니다. 이러한 민첩성은 제품 개발과 시장 전략에 반영될 뿐만 아니라 기업 문화와 조직 구조에도 큰 영향을 미칩니다. 스타트업은 규모가 작기 때문에 리소스를 보다 유연하게 할당할 수 있습니다. 리소스를 한 작업에서 다른 작업으로, 또는 한 프로젝트에서 다른 프로젝트로 신속하게 이동하여 리소스 활용도를 극대화할 수 있습니다.

동시에 우리는 사용자 피드백에 더 많은 관심을 기울이고 사용자 요구를 제품 개발의 중심에 두었습니다. 제품 개발에 대한 이러한 사용자 중심 접근 방식을 통해 스타트업은 사용자 요구 사항을 충족하는 제품을 더 빠르게 출시할 수 있습니다. 많은 스타트업에서는 신속한 반복과 지속적인 개선을 강조하는 민첩한 개발 방법을 채택합니다. 새로운 기능과 버그 수정의 정기적인 릴리스를 통해 제품을 더 빠르게 시장에 출시하고 사용자 피드백을 기반으로 최적화하세요.

Aishi가 구현하는 민첩성과 심층적인 혁신은 대형 모델의 새로운 시대를 맞이하는 스타트업 기업의 고유한 장점입니다.

1

3. 좋은 기술과 더 좋은 제품이 필요합니다.

오늘날 우리는 기술이 사용자에게 도달하기까지 실제로 갈 길이 멀고 제품이 가장 중요한 커넥터라는 사실을 발견했습니다. 기술은 혁신의 원동력이지만 그 가치는 기술이 제품을 통해 사용자와 연결될 때에만 진정으로 반영될 수 있습니다.

PixVerse 개발 과정에서 Aishi Technology 팀은 모든 세부 사항을 세심하게 다듬었습니다. V2 버전에서는 비디오의 유용성을 높이기 위해 PixVerse가 생성된 결과의 2차 편집을 지원합니다. 지능형 콘텐츠 인식 및 자동 연결 기능을 통해 사용자는 비디오의 피사체, 동작, 환경 및 카메라 움직임을 유연하게 교체하고 조정할 수 있습니다. 비디오를 통해 창의적인 섹스의 가능성이 더욱 풍성해집니다.


아이시 제품 담당자도 “기술적 강점과 차이도 중요하지만 제품화와 사용자 장벽, 제품을 통해 점점 더 많은 사용자를 연결하면서 형성되는 기술적 피드백이 더욱 중요하다”고 말했다.

동시에 기술 개발의 초기 단계에서 제품은 기술 구현의 출발점이기도 합니다. 첨단 AI 기술을 사용자가 인지하고 조작할 수 있는 실제 제품 기능으로 전환합니다. 기술에서 제품으로의 이러한 변화는 기술 적용을 가속화할 뿐만 아니라 사용자에게 전례 없는 편의성과 창의성을 제공합니다.

특히 기술이 아직 목표 수준에 도달하지 못한 경우에는 기술과 제품 간의 양방향 홍보가 더욱 실질적인 의미를 갖습니다.

예를 들어 위에서 언급한 매직 브러시에 대해 일부 제작자는 다음과 같이 보고했습니다. "이 단계에서 기본 모델 기능이 여러 피사체가 물리적 세계에 따라 움직이는 지점에 도달할 수 없는 경우 모션 브러시를 사용자 정의하면 창작 공간을 늘릴 수 있습니다. 일부 캐릭터 깜박임, 표현, 복잡한 상대 움직임 모두 모션 브러시를 사용하여 구현할 수 있습니다.”

현 단계에서 Vincent Video는 개념적으로는 매력적이지만 실제로 콘텐츠를 생성하는 데에는 한계가 있습니다. 텍스트 자체의 제한된 정보 밀도로 인해 텍스트 설명을 비디오 콘텐츠로 직접 변환할 때 복잡한 장면의 세부 사항과 동적 변화를 모두 전달하기 어려운 경우가 많습니다. 따라서 Tusheng Video는 단계별 솔루션으로 등장했습니다.

Vincent 비디오에 비해 Tusheng 비디오는 시각적 정보를 기반으로 생성되기 때문에 더 높은 정보 밀도를 제공할 수 있으며 장면의 복잡성을 보다 정확하게 포착하고 재현할 수 있습니다. 기본 모델의 기능이 텍스트와 비디오 사이의 정보 밀도 차이를 아직 해결하지 못한 상황에서 Tusheng Video의 도입은 기술 진보를 반영할 뿐만 아니라 제품 디자인 아이디어의 혁신이기도 합니다.

기술 초기에는 제품 구현에 더 많은 관심을 기울이면서 기술 혁신을 이루는 데 Aishi의 전략이 반영되었습니다. 기술적 장벽이 아닌 사용자 장벽이 형성되고, 사용자에 대한 이해와 통찰을 통해 제품 장벽이 형성되어 기술의 경계, 제품의 한계를 뛰어넘는다.

실제로 사용할 수 있는 영상 생성 제품만이 남을 수 있습니다. 사용자의 현재 요구를 충족할 뿐만 아니라 미래에 초점을 맞추고 지속 가능한 기술 개발 경로를 선택해야 합니다.

일관성 기술을 사용한 초기의 "죽은 투쟁"이든, Magic Brush의 반복이든, PixVerse V2 버전의 새로운 업그레이드이든, Aishi의 제품 전략은 한편으로는 현재에 기반을 두고 실용적인 문제를 해결합니다. 미래를 내다보고 장기적인 발전 경로를 선택하며 지속 가능한 미래를 구축하기 위해 최선을 다하고 있습니다.

지속적인 기술 연구 및 개발, 심층적인 사용자 통찰력, 제품 세부 사항의 신중한 개선을 통해 비디오 생성 산업에서는 규모에 관계없이 기업이 진정으로 가치 있고 창의성을 고취할 수 있는 제품을 만들기 위해 지속적인 기술 혁신이 필요합니다.

PixVerse V2의 슬로건처럼, 이는 PixVerse만의 기회가 아니라 대형 모델 시대의 모든 창작자들을 위한 기회이기도 합니다.