2024-09-26
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
"byte의 대형 모델 개발 경로는 먼저 c로 가서 제품을 다듬은 다음 모델 기능이 경쟁 우위를 확보한 후 b로 가서 시장을 확장하는 것입니다." 9월 25일 volcano engine의 tan daizai 사장은 언론인 등 언론 단체 인터뷰에서 '매일경제신문'과의 인터뷰를 수락했다.
이러한 개발경로를 바탕으로 올해 5월 편집팀이 개발한 ai 창작 플랫폼 '지멍(ji meng)'에 초기 버전이 적용된 후, 2024년 화산엔진 ai혁신투어에서 빈백 영상 생성 모델이 정식 공개됐다. 9월 24일에 엔터프라이즈 시장을 목표로 베타 테스트가 시작되었습니다.
sora가 '동영상의 chatgpt 시대'를 시작한 이후 kuaishou, zhipu ai, minimax, alibaba 등 국내 대형 모델 플레이어가 유사한 제품을 잇달아 출시했습니다. 이제 bytedance가 게임에 진출한 이상 대형 비디오 모델의 기존 경쟁 환경을 바꿀 수 있을까요? ?
기자 회견에서 두 가지 비디오 생성 모델의 효과 시연을 통해 tan dai는 의미론적 이해 능력, 여러 주제 움직임의 복잡한 대화형 사진 또는 다중 렌즈 전환의 내용 일관성 여부에 관계없이 대규모 doubao 비디오 생성이 가능하다고 믿습니다. 모델은 업계 최고의 수준에 도달했습니다.
동시에 이번 컨퍼런스에서는 '음악세대 모델'과 '동시통역 모델'이 공개돼 바이트 ai 영역을 더욱 확장했다.
볼케이노엔진은 업계 최초로 대형 모델 가격을 인하하며 상용화에 박차를 가하고 있다. 탄다이는 '매일경제뉴스' 기자에게 b씨에게 걸려오는 전화가 급격히 늘고 있다고 말했다. "to c 사업에 대해서는 그다지 명확하지 않지만 매우 순조롭게 진행되고 있다고 생각합니다. ai가 문제를 처음부터 끝까지 해결할 수 있고 to b와 to c 사업 사이의 경계가 그다지 명확하지 않다고 생각합니다."
매일경제신문 기자는 기자회견을 통해 올해 9월 기준 doubao 모델의 일일 평균 토큰 사용량이 1조 3천억 장을 넘어섰고, 매일 평균 5천만 장의 사진이 생성되며, 평균적으로 일일 음성 처리 시간은 850,000시간입니다.
8월 31일, "ai의 여섯 작은 용" 중 하나인 minimax는 9월 19일에 비디오 생성 모델 video-1을 출시했고, keling ai는 9차 반복을 완료하고 같은 날 "keling 1.5 모델"을 출시했습니다. yunqi 이번 컨퍼런스에서 alibaba cloud는 새로운 비디오 세대 모델을 출시했습니다. 한 달도 안 되어 이미 격동적인 비디오 세대 모델 분야에 새로운 플레이어가 등장했습니다.
지난 9월 24일 볼케이노 엔진 ai 혁신 투어에서는 두바오 비디오 제너레이션(pixeldance)과 두바오 비디오 제너레이션(seaweed)의 대형 모델 2개가 함께 공개됐다.
"daily economic news" 기자는 이 두 대형 모델이 지원하는 최대 비디오 콘텐츠 생성 기간이 아직 발표되지 않았다고 밝혔습니다. jimeng 앱은 3초, 6초, 9초, 12초의 비디오 콘텐츠 생성을 지원하는 것으로 나타났습니다. 이에 비해 케링은 지난 6월 21일 동영상 연속 기능을 출시했는데, 이를 통해 약 5초 동안 영상을 이어갈 수 있으며, 가장 긴 영상은 약 3분 동안 생성할 수 있다.
기자회견 사진 출처: 사진=양신이(楊信信) 데일리뉴스 기자
"다양한 시나리오에는 비디오 지속 시간에 대한 요구 사항이 다르므로 우리는 다양한 산업을 위한 솔루션에 더 많은 관심을 기울이고 있습니다." tan dai는 "daily economic news" 기자와의 인터뷰에서 대규모 doubao 비디오 생성 모델의 장점에 대해 말했습니다. 업계는 주로 지침을 따르는 능력, 다중 렌즈 전환의 일관성 및 비디오 생성의 일반화 능력에 달려 있습니다.
기자회견에서 많은 공식 영상들이 위의 능력을 시연했다. 예를 들어 남자와 여자가 말을 타고 질주하는 시연 영상에서 10초짜리 화면에서 두 사람의 표정과 동작은 서로 달랐지만 둘 다 퍼포먼스를 펼쳤다. 음. 자연스럽고 부드럽습니다.
doubao 비디오 생성 대형 모델은 흑백, 3d 애니메이션, 2d 애니메이션, 중국어 회화, 두꺼운 페인트 및 기타 스타일의 콘텐츠 생성을 지원한다는 점은 주목할 가치가 있습니다.
"동영상 생성 모델의 경우 다양한 스타일(콘텐츠 제작)을 만드는 것이 어렵습니다. 기술 외에도 주로 데이터 소스의 풍부함에 달려 있습니다." 한 대형 모델 기술자는 '매일경제 뉴스' 기자에게 말했습니다. tan dai는 이를 "풀 스택 기능, 기술적 혁신, douyin과 jianying의 비디오에 대한 이해의 장점"이라고 생각했습니다.
실용주의 원칙을 고수하는 tan dai는 새로운 빈백 비디오 생성 모델이 "출시 이후 상용화를 고려하고 있다"고 밝혔으며 그 적용 분야에는 전자상거래 마케팅, 애니메이션 교육, 도시 문화 관광 및 스크립트가 포함됩니다.
상품화에 대한 '불안'도 켈링이다. 8월 20일 저녁 2분기 실적 컨퍼런스 콜에서 kuaishou의 공동 창업자이자 회장 겸 ceo인 cheng yixiao는 keling의 상용화를 최우선 과제로 삼고 "가능한 한 빨리 상당한 상업적 실현 규모를 달성하기 위해 노력하고 있습니다. ."
가격 전략에 관해 tan dai는 doubao 비디오 생성 모델의 가격이 아직 결정되지 않았다고 밝혔습니다. “영상 모델과 언어 모델의 적용 시나리오가 다르고 가격 책정 논리도 다릅니다. 제품의 가치는 새로운 경험, 마이그레이션 비용 등을 통해 측정되어야 합니다. 결국 (제품이) 널리 사용될 수 있는지 여부. 생산성 roi(투자수익률)도 이전보다 좋아졌는지 여부에 따라 달라집니다.”
이번 행사에서는 영상세대 신모델 외에도 빈백 음악모델, 동시통역 모델도 공개됐다. 지금까지 doubao 전체 모드 대형 모델 제품군은 대형 언어 모델, 대형 시각적 모델 및 대형 음성 모델의 세 가지 범주를 다루었으며 총 13개의 대형 모델이 출시되었습니다.
하지만 모델만으로는 부족하다는 업계 관계자가 많다. 현재 대형 모델 제조사의 구현 방식은 '망치로 못을 찾는 것'이라고 한다. 따라서 못을 찾는 방법과 적절한 망치를 사용하여 적은 노력으로 못을 망치는 방법은 ai 시대의 클라우드 벤더에게 새로운 과제가 될 수 있습니다.
첫 번째는 대형 모델 제조사와 기업 간의 비용 문제이다.
tan dai는 지난 5월 기자회견에서 doubao 메인 모델의 추론 입력 가격이 0.0008위안/천 토큰에 불과하다고 발표했는데, 이는 업계보다 99.3% 저렴하며 대형 모델 분야에서 가격 전쟁을 시작했습니다.
"비용이 핵심입니다. 가격이 10분의 1로 떨어지면 거래량이 10배로 늘어날 수 있습니다." tan dai의 관점에서 현재 초점은 모델 통화량과 애플리케이션 커버리지에 있습니다. "우리는 수익이 아닌 애플리케이션 커버리지에 중점을 둡니다. 채팅 시나리오 업그레이드, 동료애, 생산성, 엔터프라이즈 애플리케이션 시나리오 확장 등 새로운 시나리오의 잠금 해제가 더 가치 있다고 믿습니다.”
그러나 그는 b엔드 시장의 사업 전제가 지속 가능해야 한다고 주장했다. “to c 사업처럼 광고로 돈을 버는 것은 고려할 수 없다. 할 수 있다는 자신감."
대형 doubao 모델이 가격 인하에 앞장선 후 alibaba tongyi qianwen, baidu wenxin yiyan 및 기타 모델도 순차적으로 가격을 인하했습니다. 올해 yunqi 컨퍼런스에서는 alibaba cloud bailian 플랫폼에 있는 tongyi qianwen의 세 가지 주요 모델 가격이 다시 한 번 인하되었습니다. alibaba cloud cto zhou jingren은 "미래의 거대한 애플리케이션에 비해 여전히 너무 비쌉니다." ."
이 업계의 현재 상황에 대해 tan dai는 가격 인하 이후 호출 수로 판단하면 비용이 더 이상 혁신의 장애물이 되지 않는다고 말했습니다. “다음으로 해야 할 일은 모델의 품질과 성능을 향상시키는 것입니다. 품질지수는 모델을 더욱 강력하고 다양하게 만드는 것이 목적입니다.”
일련의 "일반 인하" 이후 대형 모델 업계는 더 이상 맹목적으로 가격을 "인하"하지 않을 것입니다. 이 단계에서 경쟁은 모델 성능이며 이는 고객 요구에 의해 뒷받침됩니다.
tan의 관찰에 따르면 대형 모델 구현에 대한 b 시장의 수요는 천천히 변화하며 핵심 수요는 비용을 절감하고 효율성을 높이는 것입니다. "기업이 ai를 적용할 때 하향식으로 계획을 세우다가 실패할 확률이 높았습니다. 이제는 상향식으로 혁신해야 합니다."
'매일경제뉴스' 기자는 기업의 디지털 변혁을 지원하는 과정에서 볼케이노엔진이 각 당사자와 힘을 합쳐 스마트 터미널 대형 모델 연합, 자동차 대형 모델 생태 연합, 소매 대형 모델 생태 연합을 설립했다고 밝혔습니다. , 외부 고객은 휴대폰, 자동차, 금융, 소비, 인터랙티브 엔터테인먼트 등 30개 이상의 산업을 다루고 있습니다.
이제 byte는 손에 몇 가지 편리한 "망치"를 더 가지고 있습니다. 각계각층에서 이에 맞는 더 많은 "못"을 찾는 방법은 volcano 엔진의 다음 테스트가 될 것입니다.
매일 경제 뉴스