notícias

“Keling” de Kuaishou tornou-se inesperadamente popular, Byte estava ansioso para alcançá-lo e a competição na faixa de vídeo AI Wensheng se intensificou

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



Em fevereiro de 2024, o surgimento da Sora impediu que muitas grandes empresas modelo realizassem um bom Festival da Primavera.

“A Festa de Gala do Festival da Primavera ainda está sendo repetida, por isso estamos organizando discussões em grupo com urgência”, disse um funcionário de uma empresa líder de IA ao “City Circle”. Vendo a experiência tranquila de Sora, até mesmo blogueiros que vendem cursos estão correndo para lançar tutoriais online e ganhar muito dinheiro.

Quem pode "copiar" a versão doméstica do Sora no tempo mais rápido. Mais pessoas estão se concentrando no Alibaba, no Baidu e nos "Cinco Grandes". Mas ninguém pensou que o vencedor seria um jogador rápido com desempenho técnico relativamente "de Buda".

Em 7 de junho, Kuaishou lançou repentinamente o modelo de vídeo Wensheng "Kling", que pode suportar geração de vídeo de até 2 minutos. Além disso, em comparação com o Sora, que ainda está na fase de “futuros”, o Keling foi aberto para testes assim que foi anunciado, e os resultados gerados também são notáveis.

“Keling é o assunto que mais tem sido discutido na indústria recentemente”, disse uma pessoa da indústria de capital de risco ao City Circle. De acordo com dados oficiais, mais de 500.000 pessoas se inscreveram no Keling um mês após seu lançamento. Ele foi aberto a mais de 300.000 usuários e gerou mais de 7 milhões de vídeos curtos.

A popularidade inesperada de Ke Ling inevitavelmente deixou Byte um pouco envergonhado. Em maio deste ano, Byte também abriu o teste do modelo Wensheng Video "Jimeng", mas o efeito ainda não é óbvio na faixa Wensheng Video atualmente popular.

De repente, sendo jogado fora por um oponente que havia sido “ignorado”, Byte precisava se recuperar. De acordo com o TMTPost, a ByteDance definiu recentemente o grande modelo de IA como a direção de “nível mais alto P0” do grupo. Muitas equipes como Douyin e Jianying também estão trabalhando duro para desenvolver aplicativos de modelos de vídeo de IA, que deverão ser anunciados em um futuro próximo.

1. Isso pode ser feito de forma rápida, áspera e feroz.

Muitos desenvolvedores disseram a “City” que o lançamento e o excelente desempenho de Keling são uma surpresa na indústria.

Recentemente, "City Boundary" usou um parágrafo de "gato preto" como palavra-chave e inseriu o mesmo prompt em Keling, Jimeng e "Qingying" que acabara de ser lançado por Zhipu AI: "As ruas da cidade em um dia chuvoso estão vazias Uma pessoa, um lindo gato preto passa correndo. Tem olhos verdes, uma coleira amarela e um sino no pescoço e longos cabelos pretos no corpo. o chão reflete isso.

Entre os três vídeos gerados, embora a versão Keling não tenha conseguido o efeito de corrida rápida, os vídeos geralmente estavam em conformidade com as regras objetivas.

Por outro lado, na versão “Jimeng” não havia água no solo e o gato preto não avançou. Embora a versão “Qingying” tenha acúmulo de água, o gato preto tem um andar estranho ao caminhar, e a cauda também perde a moldura.

▲(Os vídeos são gerados por Ke Ling, Ji Meng e Qing Ying em ordem)

De acordo com "Silicon Star", Keling levou três meses para Kuaishou construir; a equipe é muito pequena, com apenas mais de 20 pessoas. O líder é Wan Pengfei, o atual chefe do Centro de Geração e Interação Visual de Kuaishou, a maioria dos quais é sua pesquisa. as direções incluem processamento de sinal de imagem/vídeo, fotografia computacional e visão computacional, redução de função de perda, geração de visão, etc.

O antecessor de Keling vem de um projeto discreto "Puji" reiniciado por Kuaishou em outubro de 2023. Este é um software ferramenta que usa IA para gerar emoticons Gif 2s a partir de imagens estáticas. No início de março deste ano, Kuaishou realizou uma pequena reunião interna. A ideia de Wan Pengfei foi afirmada por Gai Kun (Yu Yue), vice-presidente sênior de Kuaishou, e Puchi foi rapidamente determinado como um produto para pré-investigação.

De acordo com "Silicon Star People", "Ao fazer Keling, há um consenso no nível de execução de que é rápido, áspero e feroz."

Menos de um mês após o início do projeto Keling, recebeu o apoio do fundador da Kuaishou, Cheng Yixiao, que o considerou um projeto estratégico para a empresa. Gai Kun também costuma dizer: Os cartões da empresa são todos para você usar e a empresa apoia isso totalmente.

Ke Ran, um empreendedor na trilha humana digital, analisou "City": "O sucesso de Keling se deve em grande parte ao material de dados de vídeo acumulado por Kuaishou. Olhando para o país, o único que pode competir com ele neste aspecto é o som Douishu ."

Mas embora o cenário seja lindo, Byte parece um pouco solitário.

Embora "Jimeng" tenha sido anunciado oficialmente em 9 de maio, em 17 de junho, Jimeng também apareceu como o principal apoiador técnico de IA na curta série da AIGC "Sanxingdui: Future Apocalypse". No entanto, seja em termos de desempenho no lado C ou em comparação com o curta-metragem do AIGC de Kuaishou, “Mountains and Seas”, que foi lançado em 13 de julho, a voz de Ji Meng não é muito alta.

No dia 17 de julho, surgiu no mercado a notícia de que a Byte anunciará o progresso da tecnologia de vídeo Vincent semelhante ao Sora. O mundo exterior também interpreta isso como significando que Byte irá alcançar e competir de frente com Keling.

No entanto, Byte declarou mais tarde ao "City Circle" que a notícia não era precisa. No dia 17 de julho, “City Circle” notou que o evento mais parecia uma sessão de compartilhamento de tecnologia. A reunião foi organizada principalmente por Feng Jiashi, líder da equipe de pesquisa visual básica do grande modelo Doubao, e toda a sessão foi compartilhada por cientistas pesquisadores da Byte, acadêmicos institucionais, etc.

Parece que a “grande jogada” da Byte ainda terá que esperar algum tempo.

2. O byte ainda não se recuperou

Então, por que Byte perdeu a festa na faixa do Vincent Video que estava em pleno andamento recentemente?

Até certo ponto, talvez porque comparado a Kuaishou apostando em “Ke Ling”, ele pode “derrotar dez habilidades com um esforço”. O layout do modelo em grande escala da Byte é mais complicado - e no primeiro semestre deste ano, os oponentes mais importantes da Byte são Tencent e Alibaba.

Diante de modelos grandes, o ritmo da Byte deixou de ser “radical”. Afinal, foi a Byte quem assumiu a liderança no lançamento de uma grande guerra de preços de modelos na indústria há mais de 2 meses.

Em 15 de maio, na “FORCE Motive Power Conference” da ByteDance, a Byte lançou um serviço API baseado em seu modelo de bean bag desenvolvido por ele mesmo. Ao mesmo tempo, Tan Dai, presidente da Volcano Engine, deu um passo e revelou o preço mais recente do “Doubao”: 0,0008 yuan/mil Tokens, anunciando que este era o “preço mínimo” inferior a 99,3% da indústria.

Naquela época, o “ataque” de Byte havia assumido a liderança. De acordo com os “círculos de mercado” de muitas fontes, os principais players não estavam preparados para o ataque da Byte, embora todas as partes se sentissem desamparadas, eles só poderiam segui-lo passivamente;

Nos próximos dias, Alibaba Cloud, Baidu Wenxin Model e Tencent Cloud anunciaram sucessivamente que reduziriam significativamente os preços de seus tokens e APIs de entrada de inferência de grandes modelos. Sob esta influência, as solicitações do lado C para modelos de cabeça em grande escala são agora quase gratuitas e a indústria começou a avançar em direção ao próximo nível ecológico.

De acordo com o fundador de uma empresa de aplicativos legais de IA, quase não houve atraso após a abertura do serviço API, e a equipe de vendas da Volcano Engine começou a entrar em contato ativamente com os clientes e promover produtos. Isto também confirma a especulação que circula no mercado de que a Byte marcou o modelo grande como a estratégia de mais alto nível.



▲(Tan Dai na "Conferência FOECE" de 2024. Fonte/Volcano Engine)

Recentemente, os pufes “produto líder” da Byte cresceram significativamente.

De acordo com dados da Questmobile, em junho de 2024, entre os aplicativos AIGC domésticos, Doubao, Tiangong, Kimi Smart Assistant e Cat Box alcançaram um crescimento impressionante – com Doubao ocupando o primeiro lugar em tráfego.



▲(Fonte da foto/QuestMobile)

Comparado com Kuaishou, o que mais preocupa Byte agora pode ser a competição ecológica total, desde grandes modelos básicos até a camada de aplicação de IA. Além disso, considerando que o Volcano Engine só se tornará oficialmente uma nuvem em 2021, ele é o “mais jovem” entre os gigantescos fornecedores de nuvem. Por mais de três anos, a Huoshan Cloud tem sido considerada um desafiante no mercado de nuvem. Como a Byte colabora com o grande modelo básico, a camada de aplicação e o mercado de nuvem é uma proposta abrangente.

Recentemente, "Photon Planet" relatou que um grande número de usuários da plataforma "Kouzi" da Byte estão procurando maneiras de conectar seus agentes e bots criados às contas oficiais ou miniprogramas do WeChat, e as discussões são muito ativas.

Em dezembro do ano passado, a Byte lançou a plataforma de desenvolvimento de aplicativos de IA "coze" no exterior. Em fevereiro deste ano, a versão nacional de “Button” foi lançada online. Um grande número de comerciantes de Douyin também espera fazer rapidamente um pote de ouro com ele.

Considerando que a Tencent lançou tardiamente a plataforma de criação e distribuição de agentes de IA "Tencent Yuanqi" em maio deste ano. Naquela época, o número de visitas ao Button chegou a 2,33 milhões de vezes. No momento, Tencent Yuanqi ainda não abriu o ecossistema da série WeChat de miniprogramas, contas oficiais e contas de assinatura de atendimento ao cliente.

Afinal, o desenvolvimento da IA ​​ainda está em seus estágios iniciais. A Byte, assim como a Tencent, ainda precisa gastar muito tempo educando os usuários. Competir pelos direitos de distribuição na era da IA ​​​​e obter uma vantagem inicial pode ser uma lição maior que a Byte precisa fazer para atingir a Tencent.

3. Ataque mais tarde, ainda dá tempo

No nível da indústria, na Internet de hoje, não falta tráfego de conteúdo, tráfego de comércio eletrônico e bytes de munição financeira. Mesmo que esteja "um passo atrás" em Vincent Video no curto prazo, no longo prazo, ainda tem potencial para se recuperar.

Usar estratégias ativas de mercado para recuperar posições atrasadas e alcançar milagres vigorosamente também é a especialidade da Byte.

Recentemente, visando o Alibaba, a Byte também tem trabalhado na integração de grandes modelos. Na Conferência do Ecossistema DingTalk, realizada em 26 de junho, o presidente Ye Jun anunciou que, além do Tongyi do próprio Alibaba, grandes modelos de terceiros das outras seis empresas também serão incluídos no DingTalk. Estes incluem MiniMax, Dark Side of the Moon, Zhipu AI, Orion Star, Zero One Thing e Baichuan Intelligence, cobrindo quase todos os modelos de startups de grande escala bem conhecidos na China. É evidente que "construir o ecossistema de IA mais aberto da China". ".

Semelhante à jogabilidade do DingTalk, além de suportar seu próprio "Doubao", a plataforma Kouzi da Byte também tem acesso aos principais modelos externos, como Tongyi Qianwen, Dark Side of the Moon e MiniMax. No dia 14 de junho, Kouzi também lançou a função “Model Square”, que permite aos usuários selecionar dois modelos anônimos e pontuá-los com base no desempenho do conteúdo gerado.



Além disso, a Byte foi recentemente exposta e a sua exploração de "AI + hardware" está a acelerar, e não hesita em recrutar talentos através de aquisições.

De acordo com o "Tech Planet", a PICO, subsidiária da Byte, vem desenvolvendo diversos dispositivos vestíveis desde o segundo semestre do ano passado, incluindo fones de ouvido e alto-falantes, e esses dispositivos também serão equipados com IA. A equipe Byte Doubao também explorou a combinação de software e hardware de modelo em grande escala. A combinação de software e hardware de modelo em grande escala foi gradualmente aplicada a dispositivos de hardware, como máquinas de aprendizagem, cães-robôs e robôs.

De acordo com outro relatório da 36Kr, o responsável pela “linha D” do hardware Byte AI é Li Haoqian. Este último é o fundador da Oladance, marca de fones de ouvido OWS (Open Wearable Stereo) adquirida pela Byte em março deste ano. O responsável pela “O Line”, outra linha de hardware de IA, também é o fundador da empresa adquirida pela Byte. Ele se reporta a Hong Dingkun, vice-presidente de tecnologia da ByteDance.

Na direção de Vincent Video, diante da recente popularidade da faixa, os perseguidores, incluindo Byte, ainda têm tempo.

Recentemente, um desenvolvedor disse ao “City World”: “Atualmente, uso o Keling para compor imagens e reduzir a carga de trabalho do fluxo de trabalho.

Aos olhos de outro desenvolvedor e blogueiro de vídeos curtos da AIGC, Keling ainda tem muito espaço para otimização: “Contar com Keling Wensheng Video não pode garantir a consistência do IP humano virtual. para dar uma imagem a Ke Ling, permitindo-lhe gerar vídeos dinâmicos de diferentes perspectivas e depois juntá-los para simular o efeito do movimento da câmera. Na verdade, a proporção da operação humana é maior.

Um membro da equipe de P&D de um produto doméstico de simulação de datação por IA disse: "No atual mercado de aplicação de modelos em grande escala, todos estão cruzando o rio sentindo as pedras. Como comercializá-lo é uma questão muito distante e muito vago, mas o que é certo é que quanto mais pessoas usam e jogam, mais ele pode garantir a otimização e iteração do produto.”

(Ke Ran é um pseudônimo)

Autor | Dong Wenshu

Editar | Li Yuan

Operações | Liu Shan