소식

minimax 창업자 yan junjie: 당신이 할 수 있는 유일한 일은 자신을 더 좋게 만드는 것입니다|ai 프론티어

2024-09-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

편집자 주:

중국 금융통신사와 과학기술혁신위원회일보의 자회사 'ai데일리'가 오늘 '인사이트·ai 프론티어' 인터뷰를 공식 출시했다. 인터뷰는 국내외 인공지능 및 대형 모델 분야의 뛰어난 기업, 기업가, 선도적인 학자, 투자자 등에 초점을 맞춰 수천 개의 산업에 힘을 실어주는 ai에 대한 최신 탐색, 실천 및 사고를 소개합니다. insight・ai는 최전선, 통찰력, 개척자, 최전선입니다!

'커창반일보' 9월 20일(황신이 기자)6대 ai 호랑이 중 하나인 minimax는 a+ 자금조달 라운드를 완료했으며, 최근 자금조달은 alibaba가 주도하여 6억 달러에 달했습니다. 회사의 가치는 25억 달러를 초과했으며, 그 뒤에는 tencent, sequoia china, hillhouse, idg, mihoyo 등이 투자자가 포함되어 있습니다.

minimax 내에서 동료들은 별명으로만 서로를 부릅니다. 창립자인 yan junjie에 대해 직원들은 그를 io(꽃 이름)라고 부릅니다. yan junjie는 sensetime 부사장, 연구소 부사장, 스마트 시티 비즈니스 그룹 cto를 역임했습니다. 2021년 12월, sensetime 상장 전날 yan junjie는 sensetime을 떠나 minimax를 설립했습니다.

최근 minimax는 최초의 ai 고화질 비디오 생성 모델 abab-video-1을 출시했습니다. 기자회견 후 yan junjie는 science and technology innovation board daily 및 기타 매체와의 인터뷰에서 차세대 기술을 사용하는 abab7 시리즈 모델이 앞으로 몇 주 내에 공식 출시될 것이며 그 효과는 gpt와 비슷할 것이라고 밝혔습니다. -4o 모델. 대형 모델 상용화의 어려움에 대해 yan junjie는 이것이 실제로 업계 테스트이며 이 테스트를 통과하는 회사만이 성공할 수 있다고 답했습니다.

"아무도 제품을 사용하지 않거나, 제품이 돈을 벌지 못한다면 결코 사용자를 비난할 수 없습니다. 대부분은 자신의 기술이나 제품이 좋지 않다고 비난할 뿐입니다. 이는 다음과 같이 볼 수 있습니다. 테스트에 합격하면 나가도 된다.

기자회견 중인 옌준지

▌경쟁은 불가피하며, 우리가 더 강해질 수 있는 영역을 무한히 확대해야 합니다.

gpt로 대표되는 인공지능의 새로운 물결이 떠오르면서 일반 인공지능(agi)의 구현을 위한 상상의 여지가 더 많아졌습니다.

yan junjie는 다음과 같이 믿습니다.agi는 화려한 것이 아니라 모든 사람의 삶의 일부가 될 수 있는 것입니다.

“예를 들어 사람들은 douyin이나 비디오 계정을 볼 때 그것이 추천 알고리즘을 기반으로 한 짧은 비디오의 콘텐츠 배포 플랫폼이라는 것을 깨닫지 못하고 douyin과 wechat이 모든 사람의 삶의 일부가 되었다고 느낍니다.agi도 마찬가지입니다. ai가 휴대폰처럼 되어 모든 사람의 일상생활의 일부가 되면 agi가 실현될 것입니다. 물론 시간이 오래 걸리겠지만 차근차근 열심히 하면 될 것 같아요.

ai가 5년이라는 단기간에 가져올 수 있는 변화에 대해 yan junjie는 ai의 도움으로 5년 안에 모든 사람이 iq의 상한선을 크게 높이고 iq가 가장 높은 사람보다 높아질 것이라고 믿습니다. 수백명의 사람들이 모이는 장소에서. "물론 ai의 도움으로 인간 iq의 상한선이 얼마나 향상될 수 있는지는 확실하지 않습니다."

2024년에는 대형 모델 경쟁이 더욱 치열해질 전망이다. 대형 제조업체의 기습 공격에 스타트업 기업의 생활공간이 압축됐다.

yan junjie는 “전기 자동차, 휴대폰, 모바일 인터넷 등 중국에서 잘 발달된 일부 산업에서는 여러 회사가 장기적이고 매우 치열한 경쟁을 벌여 결국 중국으로 이어졌습니다.”라고 한탄했습니다. 세계를 선도하는 제품.다른 신흥 산업의 발전 역사가 이렇고, 대형 모델이 큰 사회적 가치를 창출할 가능성이 크기 때문에 경쟁이 치열할 수밖에 없습니다. 이것이 객관적인 발전법칙이다.。”

yan junjie는 스타트업 회사가 치열한 경쟁에서 이길 수 없다면 도태되어야 한다고 믿습니다.

당신보다 몇 배 더 큰 회사가 당신과 경쟁하기 시작하면 어떤 것들은 쓸모가 없다는 것을 깨닫게 될 것입니다. 그 대형 제조업체가 당신보다 수백 배 더 낫기 때문입니다. 우리가 할 수 있는 일은 더 강해질 수 있는 잠재력을 가진 것들을 무한히 증폭(강하게 만드는) 것입니다.이는 두 가지 요점으로 요약됩니다. 하나는 기술을 개선하는 방법이고, 다른 하나는 사용자와 더 나은 공동 창작물을 만드는 방법입니다. 이 두 가지 사항 모두 매우 비판적인 판단이 필요하며 매우 장기적인 축적이 필요합니다. "

▌다중 모드 대형 모델은 기본 인프라도 업그레이드해야 함을 의미합니다.

비디오로 생성된 대형 모델 분야는 지난 몇 달 동안 매우 활발해졌습니다. shengshu technology가 만든 대형 비디오 모델인 vidu가 출시되었습니다. zhipu ai는 대형 비디오 생성 모델인 "qingying"을 공식 출시했습니다. sensetime은 c-end 사용자를 위한 최초의 제어 가능한 캐릭터 비디오 생성 모델인 vimi를 출시했습니다. 스테이션 기반 ai 비디오 생성 플랫폼 "xunguang", kuaishou keling ai가 공식적으로 웹페이지에 출시되었으며 liveportrait라는 제어 가능한 인물 비디오 생성 프레임워크를 오픈 소스화했습니다.

최근 미니맥스는 첫 ai 고화질 영상 생성 모델도 출시했다. yan junjie는 다중 모드 콘텐츠가 인간 커뮤니케이션의 중요한 부분이기 때문에 다중 모드 대형 모델이 갈 수 있는 유일한 방법이라고 믿습니다.

“지금 우리가 매일 읽는 대부분의 콘텐츠는 텍스트가 아니라 역동적인 콘텐츠입니다. xiaohongshu를 열면 사진과 텍스트가 표시되고, douyin을 열면 비디오가 표시되며, 물건을 사기 위해 pinduoduo를 열 때도 마찬가지입니다. , 대부분의 경우 사진이 표시됩니다.인간 사회에서 대형 모델의 핵심 의미는 더 나은 정보 처리를 수행하는 것입니다. 대부분의 정보는 텍스트가 아닌 다중 모드 콘텐츠에 반영됩니다. 매우 높은 사용자 범위와 매우 높은 사용 깊이를 갖기 위해서는 (멀티 모달) 동적 콘텐츠를 출력하는 유일한 방법은 순수한 텍스트 기반 콘텐츠를 출력하는 것이 아니라 매우 핵심적인 판단입니다.

다중 양식은 일반적으로 낙관적이지만 업계에서는 탐색 중에 텍스트 모델과 비교하여 비디오 생성 모델의 개발이 분명히 더 어렵다고 느꼈습니다.

이와 관련하여 yan junjie는 대부분의 경우 비디오의 작업 복잡성이 텍스트의 작업보다 실제로 더 어렵다고 믿습니다. 비디오의 텍스트는 본질적으로 매우 길기 때문입니다. 예를 들어, 비디오에는 수천만 개의 입력 및 출력이 포함되므로 당연히 처리하기가 어렵습니다. 둘째, 영상의 양이 엄청납니다. 또 다른 예는 5초짜리 비디오의 무게가 수 메가바이트이지만 5초 동안 읽은 텍스트는 1k보다 작을 수 있다는 것입니다. 이는 수천 배의 저장 공백입니다.문제는 데이터를 처리하는 방법, 데이터를 정리하는 방법, 이전에 텍스트를 기반으로 구축된 기본 인프라에 레이블을 지정하는 방법에 있습니다. 이는 인프라도 업그레이드해야 함을 의미합니다.

"게다가 더 많은 인내심이 필요해요. 텍스트를 작성하는 오픈소스 것들이 많아요. 오픈소스를 기반으로 연구개발하면 더 빨라질 거에요. 하지만 영상을 위한 오픈소스는 그렇게 많지 않아요. 그래야 해요." 다시 하게 되므로 더 많은 인내가 필요합니다."

▌객관적으로 가격 전쟁으로 인해 모델 문의 전화가 늘어났습니다.

올해부터 많은 대형 모델사들이 ai 대형 모델의 인기를 맞고 가격 전쟁을 벌이고 있다. yan junjie는 객관적으로 가격 전쟁으로 인해 모델 호출 수가 실제로 증가했다고 믿습니다.

“국내 모델 가격 전쟁이 시작되자 원래 대형 모델은 비싸다고 생각했던 대부분의 기업들이 대형 모델이 저렴하고 안심하고 사용할 수 있다는 사실을 깨닫기 시작했습니다. 결국 놀라운 발견이 이루어졌습니다.대형 모델의 가격 전쟁 이후, 매우 전통적인 많은 회사들이 대형 모델을 기꺼이 사용하기 시작했습니다. 어쨌든 비용이 저렴하고 문제가 발생하면 문제가 되지 않는다고 생각하며 한 번만 더 호출하면 됩니다. 객관적으로 말하면 모델 호출 수가 크게 늘어납니다. "

국내 모델 간 치열한 경쟁 속에 미니맥스가 해외 시장 진출에 나선다. 옌준지에 씨는 "우리가 앞으로 나아가야 하는 것은 바로 국내 모델들 간의 치열한 경쟁 때문이다. 적어도 이제는 비영어권 국가의 언어에서는 gpt와 맞먹는 수준에 도달할 수 있다"고 말했다. 그리고 다양한 일은 피할 수 없으니 최선을 다해 보세요.긍정적인 측면도 있습니다. 실제로 국내 대형 모델의 사용이 크게 늘어나고 있으며, 해외에서 중국 모델의 경쟁력이 점점 더 높아지고 있다는 점은 두 가지 긍정적인 변화라고 생각합니다. "

구체적인 상용화 모델과 관련하여 yan junjie는 회사 전체의 상용화는 두 가지 형태로 나눌 수 있다고 소개했습니다. 하나는 b-side용 minimax 개방형 플랫폼이고 다른 하나는 제품 내 광고 메커니즘입니다.

"minimax 개방형 플랫폼에는 이제 유명 인터넷 기업, 전통 기업 등을 포함하여 30,000명 이상의 기업 고객과 개발자가 있습니다. 모든 기업이 스스로 할 수 있는 것은 아니기 때문에 사용자는 우리의 음성 및 시각적 기능을 사용할 것입니다. 우리는 좋은 파트너입니다. 둘째, minimax의 제품도 수익화할 수 있는 광고 메커니즘을 갖추고 있습니다. 그러나 현 단계에서 가장 중요한 것은 이를 상용화하는 것이 아니라 실제로 기술을 널리 사용할 수 있도록 하는 것입니다.”

현재,중국에는 zhipu ai, baichuan intelligence, zero one thousand things, dark side of the moon, minimax, step star 등 6개의 독립적인 대규모 모델 스타트업이 있으며 이들은 'ai의 여섯 작은 호랑이'라고 불립니다.. jinshajiang venture capital의 경영 파트너인 zhu xiaohu는 언론과의 인터뷰에서 대형 모델은 너무 비싸고 상용화를 통해 자립하는 것이 불가능하다고 솔직하게 말했습니다. 이러한 스타트업의 가장 좋은 결과는 대형 제조업체에 제품을 판매하는 것입니다.

투자자 zhu xiaohu의 발언과 대형 모델 상용화의 어려움에 대해 yan junjie는 이것이 실제로 업계 테스트이며 이 테스트를 통과하는 회사만이 성공할 수 있다고 대답했습니다.

“아무도 제품을 사용하지 않거나, 제품이 돈을 벌지 못한다면 절대 사용자를 비난할 수 없습니다. 대부분 자신의 기술이나 제품이 좋지 못하다고 비난할 뿐입니다. 우리는 그렇게 봅니다.”

yan junjie가 보기에 qq는 2000년에 돈을 버는 방법을 몰랐습니다. 수많은 상업적 수익화 계획을 시도했지만 실패했습니다. 그러나 결국 모바일 부가 가치 서비스와 게임을 찾았고 모두 이 과정을 거치게 될 것입니다. "이것은 업계에 대한 시험이라고 볼 수 있습니다. 시험에 합격하면 탈출할 수 있습니다. 시험에 실패하면 (회사는) 문을 닫아야 합니다."

인터뷰 내내 yan junjie는 업계 경쟁과 기업 전망에 대해 항상 비교적 차분한 모습을 보였습니다."물론 사용자를 비난할 수도 없고 생태계를 비난할 수도 없습니다. (많은 경우에) 우리는 충분히 잘하지 못한 것에 대해 우리 자신을 비난할 수 있습니다. 적어도 우리는 열심히 일해 왔습니다. 우리가 더 나아질 수 있기를 바랍니다. 이것은 우리가 할 수 있는 유일한 일은."

(황신이 과학기술혁신위원회 일간지 기자)
보고/피드백