notícias

fundador da minimax, yan junjie: a única coisa que você pode fazer é melhorar |

2024-09-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

nota do editor:

"ai daily", uma subsidiária do china finance news e science and technology innovation board daily, lançou hoje oficialmente a entrevista "insight·ai frontier". as entrevistas concentram-se em empresas, empreendedores, acadêmicos líderes, investidores, etc. de destaque no campo da inteligência artificial e grandes modelos no país e no exterior, trazendo as mais recentes explorações, práticas e pensamentos sobre ia, capacitando milhares de indústrias. insight・ai é a linha de frente, insight, pioneiro, linha de frente!

"kechuangban daily" 20 de setembro (repórter huang xinyi)como um dos seis tigres da ia, a minimax concluiu a rodada de financiamento a+. a última rodada foi liderada pelo alibaba, com um montante de us$ 600 milhões. a avaliação da empresa ultrapassou us$ 2,5 bilhões e os investidores por trás dela incluem tencent, sequoia china, hillhouse, idg, mihoyo, etc.

no minimax, os colegas só se chamam pelos apelidos. quanto ao fundador yan junjie, os funcionários o chamam de io (nome da flor). yan junjie já atuou como vice-presidente da sensetime, vice-presidente do instituto de pesquisa e cto do smart city business group. em dezembro de 2021, na véspera da listagem da sensetime, yan junjie deixou a sensetime e fundou a minimax.

recentemente, a minimax lançou o primeiro modelo de geração de vídeo de alta definição com ia, abab-video-1. após a coletiva de imprensa, yan junjie revelou em entrevista ao science and technology innovation board daily e outras mídias que o modelo da série abab7 usando tecnologia de nova geração será lançado oficialmente nas próximas semanas, e o efeito será comparável ao gpt -4o modelo. falando sobre as dificuldades na comercialização de modelos grandes, yan junjie respondeu que este é realmente um teste da indústria, e somente as empresas que passarem neste teste poderão ter sucesso.

"quando ninguém usa um produto, ou quando um produto não rende dinheiro, você definitivamente não pode culpar os usuários. a maioria deles só pode culpar sua própria tecnologia ou os produtos que não são bons o suficiente. isso pode ser considerado como uma crítica a um teste da indústria. se você conseguir passar no teste, você pode sair.

yan junjie na conferência de imprensa

▌a competição é inevitável e devemos ampliar infinitamente as áreas onde podemos ser mais fortes.

com o surgimento de uma nova onda de inteligência artificial representada pela gpt, mais espaço de imaginação foi criado para a realização da inteligência artificial geral (agi).

yan junjie acredita que,agi não é algo sofisticado, mas algo que pode se tornar parte da vida de todos.

“por exemplo, quando as pessoas assistem ao douyin ou às contas de vídeo, elas não percebem que é uma plataforma de distribuição de conteúdo para vídeos curtos baseada em algoritmos de recomendação. em vez disso, elas sentem que o douyin e o wechat se tornaram parte da vida de todos.o mesmo se aplica à agi. quando a ia se tornar como um telefone celular e se tornar parte do uso diário de todos, a agi será realizada. é claro que isto levará muito tempo, mas penso que podemos trabalhar arduamente, passo a passo.

em relação às mudanças que a ia pode trazer no curto prazo de cinco anos, yan junjie acredita que em cinco anos, com a ajuda da ia, todos aumentarão muito o limite superior do seu qi e serão superiores à pessoa com o qi mais alto em um local com centenas de pessoas. “é claro que não é certo até que ponto o limite superior do qi humano pode ser melhorado com a ajuda da ia.”

a partir de 2024, a competição por modelos grandes se tornará cada vez mais acirrada. confrontados com o rápido ataque dos grandes fabricantes, o espaço de vida das empresas start-up foi comprimido.

“a competição é inevitável.” yan junjie lamentou: “em algumas indústrias bem desenvolvidas na china, como veículos elétricos, telefones celulares e internet móvel, várias empresas se envolveram em uma competição muito acirrada e de longo prazo, o que acabou levando à china produtos assumindo a liderança no mundo.uma vez que a história de desenvolvimento de outras indústrias emergentes é assim, e os grandes modelos são susceptíveis de produzir grande valor social, deveria de facto haver muita concorrência. esta é a lei objetiva do desenvolvimento。”

yan junjie acredita que se uma empresa iniciante não conseguir vencer a competição acirrada, ela deverá ser eliminada.

quando empresas muitas vezes maiores que você começarem a competir com você, você perceberá que algumas coisas são inúteis. porque esses grandes fabricantes são centenas e milhares de vezes melhores que você. o que podemos fazer é amplificar infinitamente (tornar mais fortes) coisas que têm potencial para se tornarem mais fortes.tudo se resume a dois pontos: um é como melhorar a tecnologia e o outro é como criar melhores cocriações com os usuários. ambos os pontos exigem alguns julgamentos muito críticos e exigem uma acumulação a muito longo prazo. "

▌os grandes modelos multimodais significam que a infraestrutura subjacente também precisa de ser atualizada

o campo de grandes modelos gerados por vídeo tem estado muito ativo nos últimos meses. vidu, um grande modelo de vídeo criado pela shengshu technology, foi lançado; zhipu ai lançou oficialmente o grande modelo de geração de vídeo "qingying" lançou o vimi, o primeiro modelo de geração de vídeo de grande personagem controlável para usuários finais c; a plataforma de criação de vídeo ai baseada em estação "xunguang"; kuaishou keling ai é oficialmente lançada na página da web e abre o código-fonte de uma estrutura de geração de vídeo de retrato controlável chamada liveportrait...

recentemente, a minimax também lançou seu primeiro modelo de geração de vídeo de alta definição com ia. yan junjie acredita que grandes modelos multimodais são o único caminho a percorrer, porque o conteúdo multimodal é uma parte importante da comunicação humana.

“a maior parte do conteúdo que lemos todos os dias agora não é texto, mas sim algum conteúdo dinâmico. quando abrimos o xiaohongshu, ele mostra fotos e textos, quando abrimos o douyin, ele mostra vídeos, e mesmo quando abrimos o pinduoduo para comprar coisas. , na maioria das vezes, mostrará fotos.para a sociedade humana, o significado central dos grandes modelos é melhorar o processamento da informação. a maior parte da informação é refletida no conteúdo multimodal, e não no texto. para ter uma cobertura de usuário muito alta e uma profundidade de uso muito alta, a única maneira de produzir conteúdo dinâmico (multimodal) não é apenas produzir conteúdo baseado em texto puro. este é um julgamento muito importante.

embora a multimodalidade seja geralmente otimista, a indústria também sentiu durante a exploração que, em comparação com os modelos de texto, o desenvolvimento de modelos de geração de vídeo é obviamente mais difícil de desenvolver.

nesse sentido, yan junjie acredita que na maioria das vezes a complexidade do trabalho do vídeo é realmente mais difícil do que a do texto, porque o texto do vídeo é naturalmente muito longo. por exemplo, um vídeo envolve dezenas de milhões de entradas e saídas, que serão naturalmente difíceis de processar. em segundo lugar, a quantidade de vídeo é enorme. outro exemplo é que um vídeo de 5 segundos pesa vários megabytes, mas uma leitura de texto de 5 segundos pode ser inferior a 1k. esta é uma lacuna de armazenamento de milhares de vezes.o desafio reside em como processar os dados, como limpá-los e como rotular a infra-estrutura subjacente que foi anteriormente construída com base em texto. isto significa que a infra-estrutura também precisa de ser actualizada.

"além disso, é necessária mais paciência. existem muitas coisas de código aberto para escrever textos. será mais rápido se fizermos pesquisa e desenvolvimento com base em código aberto. mas não existem tantas coisas de código aberto para vídeo. precisa ser feito de novo e requer mais paciência."

▌objetivamente falando, a guerra de preços aumentou o número de ligações para o modelo

desde este ano, muitas grandes empresas de modelos iniciaram guerras de preços em troca da popularidade dos grandes modelos de ia. yan junjie acredita que, objetivamente falando, a guerra de preços realmente aumentou o número de chamadas de modelos.

“quando a guerra de preços dos modelos domésticos começou, a maioria das empresas que originalmente pensavam que os modelos grandes eram caros começaram a descobrir que os modelos grandes são baratos e podem ser usados ​​com confiança.após a guerra de preços dos modelos grandes, muitas empresas muito tradicionais começaram a se mostrar muito dispostas a usar modelos grandes. eles acham que o custo é baixo de qualquer maneira e não importa se algo der errado. se algo der errado, eles podem simplesmente desistir mais uma vez. falando objetivamente, isso aumenta muito o número de chamadas de modelo. "

em meio à concorrência acirrada entre os modelos nacionais, o minimax está se expandindo para mercados internacionais. yan junjie disse: "é precisamente por causa da competição acirrada entre os modelos nacionais que temos que avançar. pelo menos agora podemos atingir um nível comparável ao gpt em idiomas de países que não falam inglês. concorrência e vários como todos os tipos de coisas não podem ser evitados, tente fazer o seu melhor.vemos o lado optimista. a utilização de grandes modelos nacionais está, de facto, a crescer significativamente, e os modelos chineses estão, de facto, a tornar-se cada vez mais competitivos no exterior. penso que estas são duas mudanças positivas. "

quanto ao modelo específico de comercialização, yan junjie apresentou que a comercialização de toda a empresa pode ser dividida em duas formas. uma é a plataforma aberta minimax para o lado b e a outra é o mecanismo de publicidade dentro do produto.

"a plataforma aberta minimax agora tem mais de 30.000 clientes empresariais e desenvolvedores, incluindo empresas de internet bem conhecidas, empresas tradicionais, etc. os usuários usarão nossos recursos de voz e visuais, porque nem todas as empresas podem fazer isso sozinhas. somos um bom parceiro em segundo lugar, os produtos da minimax também possuem mecanismos de publicidade que podem ser rentabilizados. no entanto, nesta fase, o mais importante não é comercializá-los, mas sim disponibilizar verdadeiramente a tecnologia.

atualmente,existem seis startups independentes de modelos de grande escala na china, incluindo zhipu ai, baichuan intelligence, zero one thousand things, dark side of the moon, minimax e step star, que são chamadas de “seis pequenos tigres da ia”. zhu xiaohu, sócio-gerente da jinshajiang venture capital, disse sem rodeios em entrevista à mídia que modelos grandes são muito caros e é impossível sustentar-se através da comercialização. o melhor resultado para essas startups é vender para grandes fabricantes.

falando sobre as observações do investidor zhu xiaohu e as dificuldades na comercialização de modelos grandes, yan junjie respondeu que este é realmente um teste da indústria, e apenas as empresas que passam neste teste podem ter sucesso.

“quando ninguém usa o produto, ou quando o produto não rende dinheiro, você definitivamente não pode culpar os usuários neste momento, você só pode culpar sua própria tecnologia ou o produto que não é bom o suficiente. nós somos. é assim que vemos as coisas.”

na opinião de yan junjie, qq não sabia como ganhar dinheiro em 2000. tentou vários planos de monetização comercial, mas falhou. no entanto, acabou encontrando serviços e jogos móveis de valor agregado, e tudo passará por esse processo. "isso pode ser considerado um teste para uma indústria. se ela conseguir passar no teste, será capaz de escapar. se falhar, (a empresa) deverá ser fechada."

ao longo da entrevista, yan junjie sempre pareceu relativamente calmo em relação à concorrência do setor e às perspectivas corporativas."você certamente não pode culpar os usuários, nem pode culpar o ecossistema. (por muitas coisas) só podemos nos culpar por não estarmos bem o suficiente. pelo menos temos trabalhado duro. espero que possamos melhorar. isto é a única coisa que podemos fazer."

(huang xinyi, repórter do conselho diário de inovação em ciência e tecnologia)
relatório/comentários