소식

3개월과 9번의 반복 끝에 kuaishou keling ai가 전 세계적으로 1.5 모델 출시

2024-09-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

9월 19일, keling ai는 비디오 생성을 위한 새로운 keling 1.5 모델을 대대적으로 업그레이드했습니다. 이미지 품질, 동적 품질, 미적 성능, 모션 합리성 및 의미 이해가 크게 향상되었습니다. 동시에 keling ai는 비디오 생성의 정밀한 제어 기능을 더욱 향상시키기 위해 새로운 "모션 브러시" 기능도 도입했습니다.
먼저 기본 모델이 다시 업그레이드됐는데, 고화질 모드에서 1080p 고화질 영상 직접 출력을 지원하는 keling 1.5 모델이 추가돼 대형 화면의 선명도와 질감에 도전했다. keling 1.0 모델과 비교하여 1.5 모델은 화질, 동적 품질, 텍스트 응답성 등이 크게 향상되었으며 전반적인 내부 평가 효과가 95% 증가했습니다.
이전에는 keling 1.0 모델은 고화질 모드에서 720p 비디오를 생성할 수 있었습니다. 이번 업그레이드 이후 1.5 모델은 고화질 모드에서 1080p 고화질 비디오를 직접 생성할 수 있습니다. "차창을 바라보는 소녀"라는 프롬프트 단어를 입력하고 좌우 두 가지 버전의 영상에서 발생하는 효과를 비교해 보면 신형 keling 1.5의 화질이 크게 향상되었음을 확인할 수 있다. : 사진 선명도가 직관적이고 인지 가능하며 사진 오른쪽에 있는 소녀의 얼굴이 더 선명하고 풍부하며 창문의 물 안개와 전체적인 빛과 그림자 성능도 더 좋습니다. 동시에 새 모델의 사진 전체 구성이 더욱 최적화되어 사진이 더욱 아름다워졌습니다.
동적 품질 측면에서도 새 모델이 크게 개선되었습니다. 예를 들어 이전에 인기를 끌었던 keling ai의 국수 먹기 사례와 비교하면 오른쪽 1.5 모델이 생성한 영상에서 "국수를 먹는 어린 소년"이라는 프롬프트 단어를 입력하면 국수는 과정에서 탄력성과 수직 특성이 달라집니다. 입구에 고정되어 떨어지는 느낌과 기타 측면은 매우 사실적인 신체 표현을 가지고 있으며, 동시에 젓가락을 쥐고 있는 어린 소년의 오른손과 국수를 먹을 때 씹는 동작은 왼쪽의 1.0 모델보다 더 자연스럽고 부드럽습니다. 전반적인 움직임 합리성이 크게 향상되었습니다.
tusheng 비디오 측면에서 keling의 새로운 1.5 모델은 보다 복잡한 텍스트 설명 요구 사항에 대응할 수 있습니다. 예를 들어, 사람이 없는 음식 사진과 "카메라가 줌아웃되고, 어린 소년이 테이블로 걸어가서 숟가락을 들고 먹기 시작합니다."라는 프롬프트를 통해. 생성된 영상에서는 카메라가 약간 흔들리면서 숟가락이 "들어오고" 화면은 숟가락을 들고 있는 어린 소년에게 초점을 맞추고 그가 입에 한 숟가락의 음식을 넣는 모습과 숟가락이 쌀알을 숟가락으로 움직이는 모습을 보여줍니다. 세부적인 내용도 자세하게 제시되어 사진과 영상을 이해하는 능력이 뛰어납니다.
이번 업그레이드에서 keling ai는 강력한 "모션 브러시" 기능도 제공하여 동영상 제작 시 제작자의 모션 효과 제어 능력을 크게 향상시킵니다. "모션 브러시" 기능은 그림의 요소(사람이나 개체 등)에 대한 동작 궤적 지정을 지원합니다. 사용자는 움직임 방향을 제어해야 하는 그림 부분의 윤곽을 잡은 다음 방향을 나타내는 화살표를 그리면 됩니다. 정확한 움직임 제어를 달성하기 위해 움직임의 방향. 이 기능은 사진을 업로드한 후 사진에 있는 최대 6개 요소(사람, 사물 등)에 대한 동작 궤적 지정을 지원합니다. 또한 특정 요소에 대해 추가 스틸 영역을 지정하여 비디오 콘텐츠의 모션 제어 및 성능이 향상될 수도 있습니다.
현재 '모션'을 이용하면 가로화면(16:9, 4:3), 세로화면(9:16, 3:4), 정사각형 화면(1:1) 등 다양한 포맷의 영상을 생성할 수 있다. brush' 비디오의 경우 생성된 비디오 지속 시간은 5초입니다. 수많은 사용자와 미디어의 평가에 따르면 keling ai의 모션 브러시 기능은 사용 편의성과 성능 측면에서 업계 최고 수준입니다.
실제로 keling ai는 최근 한 번에 최대 4개의 비디오 생성을 지원하는 등 일련의 기능 업그레이드를 수행하여 제작자가 최적의 생성 결과를 신속하게 선택할 수 있도록 "tu sheng video" 기능에 대한 지원을 추가했습니다. 비디오 지속 시간은 10초이며 표준 모드에서는 마지막 프레임 추가를 지원하며 "ai 사진" 기능은 "이미지 품질 향상"을 지원합니다. 또한 공식적으로는 사용자가 keling ai를 더 잘 제어할 수 있도록 사용자 가이드도 출시했습니다.
올해 6월 출시 이후 keling ai의 9번째 반복 업그레이드입니다. 이번 업그레이드는 올해 7월 전 세계적으로 동시에 출시될 예정이다. keling ai는 국제 버전 1.0이 공식적으로 출시되어 전 세계 사용자에게 공식적으로 공개되었으며 이후 글로벌 멤버십 시스템을 출시했다고 발표했습니다. 현재 keling ai는 수많은 국내외 사용자를 보유하고 있습니다. kuaishou의 수석 부사장이자 주요 웹사이트 비즈니스 및 커뮤니티 과학 라인 책임자인 gai kun은 이전에 kuaishou investor day에서 260만명 이상이 사용했다고 밝혔습니다. keling ai는 2,700만 개 이상의 비디오와 5,300만 개 이상의 사진을 생성했습니다. (저자: 류지아)
보고/피드백