notícias

Conversa com o investidor Chen Yu: Até que as capacidades das grandes bases de modelos sejam desenvolvidas, será difícil fazer mudanças qualitativas nas aplicações.

2024-08-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

·O desenvolvimento de grandes modelos ainda é “atravessar o rio tateando as pedras”. Independentemente de escolherem o mercado B-end (orientado para a empresa) ou o mercado C-end (orientado para o consumidor), as grandes empresas modelo são. enfrentam dificuldades semelhantes e não existe um modelo de negócio claro e estabelecido.
Em agosto, grandes startups de modelos relataram notícias de financiamento novamente e Zero Mil Coisas relataram sucessivamente que haviam concluído uma nova rodada de financiamento. Entre elas, Dark Side of the Moon completou a última rodada de financiamento nos EUA. US$ 300 milhões, com a avaliação mais recente para US$ 3,3 bilhões. Embora o capital tenha mais uma vez mostrado seu favor às empresas unicórnios de IA, aos olhos dos investidores, o caminho de desenvolvimento dos grandes modelos ainda é “atravessar o rio sentindo as pedras”.
"Todo mundo sabe que grandes modelos de IA são bons, mas como podemos implantá-los internamente para maximizar a eficácia dos grandes modelos?" "Não importa se os grandes modelos escolhem o mercado B-end ou o mercado C-end, atualmente não há uma clareza clara." e modelo de negócios viável." Envolvido em Chen Yu, sócio da Yunqi Capital que vem investindo em tecnologia de ponta, direção inteligente e outros campos há dez anos, disse recentemente sem rodeios em uma entrevista à ThePaper Technology (www.thepapaper.cn ).
Chen Yu, sócio da Yunqi Capital
Antes de ingressar na Yunqi, Chen Yu trabalhou como engenheiro no Google e CTO (Chief Technology Officer) de uma empresa nacional listada. Chen Yu havia entrado na indústria de grandes modelos já em 2021. Naquele ano, ele participou do investimento no grande modelo. startup MiniMax e se tornou um investidor anjo deste último, a MiniMax também é uma das grandes startups modelo do momento. Chen Yu acredita: “No futuro, cada empresa terá seu próprio modelo de aplicação grande, mas atualmente não existe um bom modelo de lucro comercial”.
The Paper: Recentemente temos feito pesquisas sobre algumas startups de grande escala e descobrimos que há muitas incertezas sobre como as startups podem alcançar o desenvolvimento sustentável. Por um lado, o investimento é muito grande e, por outro lado, o financiamento. não é fácil. O que você pensa como investidor?
Chen Yu:Na verdade, parece que as grandes empresas modelo levantaram dinheiro este ano e as avaliações das startups famosas atingiram dois a três mil milhões de dólares americanos. No entanto, o ambiente de capital de risco para as empresas de tecnologia é na verdade muito cruel e o capital não pode apoiar ilimitadamente as empresas não lucrativas. As empresas e as startups devem eventualmente formar os seus próprios modelos de negócio e ser capazes de gerar receitas em grande escala. Mas a realidade é que é muito difícil para as startups de grande escala obterem receitas em escala, quanto mais rentabilidade. Independentemente de escolherem o mercado do lado B (orientado para a empresa) ou o mercado do lado C (orientado para o consumidor), as grandes empresas modelo enfrentam dilemas semelhantes e ainda não possuem um modelo de negócio claro e estabelecido.
O mercado do lado B, na verdade, ajuda os clientes empresariais a implantar modelos privados. Atualmente, as margens de lucro no mercado B-end estão diminuindo rapidamente. Projetos de modelos em grande escala que foram vendidos por dezenas de milhões no ano passado só poderão ser vendidos por 1 milhão de yuans este ano. Existem muitos modelos grandes de código aberto no mercado que podem ser empacotados e a concorrência é muito acirrada. Os negócios do lado B envolvem serviços de pré-venda, assinatura de contrato, implementação de projeto (como supervisão e ajuste de modelo) e manutenção pós-venda, etc. tem espaço para lucro bruto, mas agora até o lucro bruto não sobrou nada.
O custo do poder de computação consumido por grandes empresas modelo para treinar modelos básicos é geralmente de centenas de milhões, e atualmente as grandes empresas modelo não têm como alocar os custos de treinamento através das receitas dos negócios do lado B.
ThePaper Technology: Por enquanto, para os clientes da Parte A, não é rentável implantar grandes modelos privados?
Chen Yu:Muitas empresas não querem perder a onda da IA, mas não encontraram um caminho claro para integrar a IA aos seus próprios negócios. O mesmo se aplica à Parte A. O maior problema enfrentado pela Parte A é que ela sabe usar grandes modelos, mas não sabe como implementar e implantar grandes modelos dentro da empresa e como maximizar a eficácia de grandes modelos. Na verdade, isso requer muito tempo e grandes modelos de comunicação corporativa.
Quando as empresas privatizam e implementam modelos em grande escala, os dados podem tornar-se um verdadeiro obstáculo. Que tipo de dados são adequados para ajuste fino, como limpá-los e como rotular dados úteis, tudo isso requer mão de obra e recursos materiais. A seleção dos dados de treinamento e o alinhamento do modelo afetarão muito a eficácia do modelo, portanto, não existe um modelo grande que possa ser adequado para todos os cenários.
ThePaper Technology: O mercado do lado B é difícil de fazer, então e o lado C?
Chen Yu:As aplicações de produtos de grandes modelos para o mercado de massa C-end podem ser divididas em duas categorias: uma são os robôs de conversação emocionais, como o Hoshino da MiniMax e o conhecido C.ai; a segunda categoria são as ferramentas de produtividade; Na verdade, esses produtos são fabricados por todos os grandes modelos. O problema é que, enquanto uma grande empresa não cobrar por um dia, será difícil para outras empresas cobrar porque essencialmente não há aderência ao usuário. Para grandes empresas com bom fluxo de caixa, a melhor estratégia é sobreviver aos seus concorrentes, por isso será difícil para as startups nacionais cobrarem pelas ferramentas de produtividade do lado C. No final, certamente haverá empresas que não conseguirão financiamento e serão eliminadas.
The Paper: Muitas grandes empresas modelo estão agora desenvolvendo negócios no exterior. O que você acha desse fenômeno?
Chen Yu:Depois de um grande modelo atingir uma determinada avaliação, tem de responder a uma questão, ou seja, como conseguir a geração de receitas em grande escala. O mercado externo é maior e a disposição de pagar dos clientes estrangeiros é maior do que a dos clientes nacionais. Portanto, as empresas nas quais estou focando atualmente também são empresas com negócios no exterior. Quando os grandes modelos vão para o exterior, os seus métodos de lucro não mudarão muito em relação aos do mercado interno, mas enfrentarão a concorrência com produtos estrangeiros de grandes modelos, o que é extremamente desafiador.
The Paper: Do ano passado até este ano, o foco de todos em grandes modelos mudou da tecnologia para as aplicações, mas as aplicações não explodiram.
Chen Yu:Do ano passado até este ano, o custo de raciocínio dos grandes modelos foi bastante reduzido, mas a razão pela qual não existem bons cenários de aplicação ainda é limitada pelas capacidades dos próprios grandes modelos, como capacidades de raciocínio e problemas de alucinação.
Agora, o sentimento geral de todos é que modelos grandes podem ser usados ​​em muitos lugares, mas parecem inúteis em todos os lugares. Isso ocorre porque os modelos grandes ainda envolvem problemas como ilusão antes de serem treinados. Esta é também a razão pela qual é difícil investirmos. Embora todos estejam olhando para a direção das aplicações de IA, o problema é que as capacidades básicas dos grandes modelos estão progredindo lentamente. Antes que haja um avanço nas capacidades dos grandes modelos, será difícil para os aplicativos subjacentes fazerem alterações substanciais.
Portanto, não tenha expectativas muito altas no momento, mas você pode estar otimista quanto ao futuro. A iteração da tecnologia é muito rápida. Se o nível do grande modelo do ano passado estava no nível de um aluno da terceira série do ensino fundamental, agora pode estar no nível de um aluno do segundo ano do ensino médio. Ele também continua aprendendo e melhorando como as pessoas.
A maior mudança no campo dos grandes modelos este ano é o custo, que caiu pelo menos duas ordens de grandeza. Por um lado, a redução de custos é resultado da pressão do mercado e, por outro lado, também se deve ao aprimoramento da tecnologia. A inovação do algoritmo subjacente sempre existiu, o que trouxe redução de custos.
Todos devem ter paciência com o desenvolvimento da tecnologia. A experiência das grandes empresas modelo é de apenas um ou dois anos, e agora todos estão no mesmo estado de atravessar o rio sentindo as pedras. No entanto, a tendência de desenvolvimento da tecnologia é, em última análise, a democratização da tecnologia, o que reduzirá o limite para que todos possam utilizá-la, por isso, se esperarmos um pouco mais, penso que cada empresa terá os seus próprios modelos de aplicações em grande escala no futuro. Hoje em dia, a implementação do seu modelo privado pode custar dezenas de milhões a uma empresa, mas dentro de dez anos já não será necessário desembolsar um custo tão elevado. Penso que, no futuro, a implantação de modelos privatizados em grande escala nas empresas poderá tornar-se mais baseada em ferramentas e em produtos.
À medida que a tecnologia amadurece, ela se tornará mais padronizada e o custo se tornará cada vez menor. O desenvolvimento de todas as tecnologias segue esse caminho de desenvolvimento. O alto custo é apenas um fenômeno de fase de curto prazo. Quando compartilhei isso com nossos LPs (investidores) em novembro do ano passado, também disse que o custo dos modelos grandes cairá duas ordens de grandeza nos próximos três anos. Inesperadamente, isso foi percebido meio ano depois. Na verdade, o mundo está a mudar mais rapidamente do que qualquer um de nós imagina.
O repórter do jornal Yu Yan
(Este artigo é do The Paper. Para mais informações originais, baixe o APP “The Paper”)
Relatório/Comentários