Qual é a batalha entre código aberto e fechado para modelos grandes?

2024-08-14

As disputas não podem negar o valor de mercado uma da outra. As duas necessidades do mercado coexistirão por muito tempo.

Texto | Wu Junyu Xu Wenpu

Editor｜Xie Lilong

Desde este ano, empresários, investidores e empreendedores da indústria de IA (inteligência artificial) na China e nos Estados Unidos iniciaram simultaneamente um debate: se os grandes modelos deveriam ser de código aberto ou de código fechado.

Na China, a figura no centro da controvérsia é o fundador do Baidu, Robin Li. Em abril deste ano, ele declarou publicamente: "Todo mundo costumava usar código aberto e pensava que o código aberto era barato. Na verdade, em cenários de modelos de grande escala, o código aberto é o mais caro. O modelo de código aberto se tornará cada vez mais atrasado". Não falta oposição a esta visão. Os oponentes incluem o CTO da Alibaba Cloud (Diretor de Tecnologia) Zhou Jingren,Inteligência BaichuanCEO Wang Xiaochuan e CEO da Cheetah Mobile, Fu Sheng. Em maio deste ano, Zhou Jingren disse sem rodeios em uma entrevista à mídia: "Não há dúvida de que o código aberto contribui para a tecnologia e a ecologia globais. Isso foi comprovado muitas vezes em todo o mundo e não há mais necessidade de discutir o assunto".

Nos Estados Unidos, o debate é ainda mais acalorado. O fundador da Tesla, Musk, uma vez processou startups de IAIA aberta. Musk foi um dos principais fundadores e investidores da OpenAI em 2015. Ele acredita que a OpenAI, liderada pelo atual CEO Altman, violou seu compromisso de “operar como uma organização sem fins lucrativos e tornar a IA de código aberto e de código aberto”. Dois investidores famosos do Vale do Silício, Andreessen, fundador da a16z, e Kosla, fundador da Kleiner Perkins Caufield & Byers, tiveram muitas rodadas de confronto nas redes sociais. O primeiro acredita que o modelo de código fechado levará ao monopólio dos gigantes e prejudicará a investigação académica. Este último acredita que os grandes modelos são armas económicas e não devem ser de código aberto.

Código aberto é um modelo de desenvolvimento de software – o código-fonte é liberado gratuitamente e sobrevive de doações da comunidade. Os desenvolvedores podem baixar, modificar, distribuir, relatar bugs de software (defeitos ou erros de software) gratuitamente e fazer sugestões de otimização. Esta inovação coletiva irá acelerar a iteração do software.Os modelos de código aberto referem-se a modelos de uso gratuito e com detalhes técnicos publicados, como parâmetros de modelo, referem-se a modelos que exigem pagamento e não publicam detalhes técnicos.Para entender de forma simples, código aberto é gratuito, mas você tem que comprar e cozinhar sua própria comida; código fechado é pago, o que equivale a ir a um restaurante para comer, e você pode obter melhores serviços;

Os modelos grandes devem ser de código aberto ou fechado? Interesses comerciais, opiniões técnicas e outros factores foram misturados, de modo que muitos factos foram confundidos - mas há alguns factos por detrás deste debate.

Primeiro, diferentes estratégias de negócios permitem que as empresas escolham diferentes rotas técnicas.Empresas como Baidu e OpenAI que esperam comercializar rapidamente grandes negócios modelo escolheram o código fechado, Alibaba Cloud, Meta e outras empresas confiam;computação em nuvemOu empresas com negócios lucrativos de publicidade escolhem o código aberto para aumentar o bolo.

Em segundo lugar, as exigências do mercado de código aberto e código fechado coexistirão durante muito tempo, e é impossível simplesmente julgar qual é o melhor.Os modelos de código aberto e de código fechado têm seus próprios cenários aplicáveis, e o modelo a ser escolhido está relacionado à demanda do mercado. Isso não muda por vontade do fabricante do modelo.

Terceiro, existem diferenças essenciais entre modelos de código aberto e software de código aberto.O software de código aberto publica o código-fonte e a maioria dos detalhes técnicos. O modelo de código aberto é mais como uma caixa preta técnica gratuita - os parâmetros do modelo são abertos, mas o código-fonte, os dados de treinamento, o processo de treinamento e outros detalhes técnicos raramente são abertos.

Além disso, a batalha entre fontes abertas e fechadas na indústria de IA da China tem mais a ver com a concorrência comercial.O código aberto não tem fronteiras, este conceito tem sido geralmente reconhecido. No entanto, no contexto da intensificação da concorrência entre a China e os Estados Unidos na indústria de IA, a oposição da indústria dos EUA ao código aberto está cada vez mais alta.

Quem é código aberto e quem é código fechado?

O desenvolvimento de grandes modelos ainda está em seus estágios iniciais e ainda requer tentativa e erro.Código aberto e código fechado não são distintos. Quando as empresas enfrentam a questão da múltipla escolha entre código aberto e código fechado, elas seguem três caminhos diferentes.

O mais extremo é fazer apenas modelos de código aberto. Existem relativamente poucas empresas que seguem esse caminho e a Meta é uma das poucas. A vantagem é que atrairá mais usuários. O problema é que não existe um modelo de lucro e apenas as grandes empresas podem pagar.

Llama 3, de propriedade da Meta, é o modelo de código aberto com mais usuários no mundo. O principal negócio da Meta são as mídias sociais (como Facebook, Instagram), com lucro líquido em 2023 atingindo US$ 39 bilhões. Meta tem vontade de explorar novos negócios, mas não há pressão para ganhar dinheiro por meio de modelos. Portanto, só pode fazer o modelo de código aberto e não considerar questões de rentabilidade por enquanto.

Um caminho intermediário é código aberto e código fechado em paralelo, o que é muito flexível. As empresas podem não apenas obter usuários por meio de código aberto, mas também obter renda por meio de código fechado. Isso não apenas dá aos desenvolvedores espaço de escolha, mas também permite que as próprias empresas tenham margem para erros.

As empresas que escolhem esse caminho incluem Microsoft, Google, Alibaba Cloud, Tencent Cloud, bem como startups de IA como Mistral Al, Zhipu AI e Baichuan Intelligence. Uma prática comum na paralelização de código aberto e código fechado é usar modelos de código aberto gratuitos para atrair usuários e orientá-los a usar modelos de código fechado que sejam maiores em tamanho e tenham desempenho mais forte. Por exemplo, o principal modelo comercial da Microsoft é a série GPT-4 da OpenAI, mas também abriu o código-fonte do pequeno modelo Phi-3 Mini, abriu o código-fonte de mais de dez modelos com parâmetros que variam de 500 milhões a 110 bilhões, e também fornece; uma base de código fechado. Grandes modelos, modelos industriais, o Google abriu o código-fonte da série Gemma de pequenos modelos e também fornece a série Gemini de código fechado de grandes modelos básicos, como Mistral Al, com modelos de código aberto com versões anteriores; desempenho na geração anterior e orientou os usuários a pagar para usar modelos com desempenho mais forte nesta geração.

O problema com o código aberto e o código fechado é que a comercialização às vezes envolve esforços concorrentes. Alguns clientes usaram modelos de código aberto gratuitos e não usarão mais modelos de código fechado pagos. Como resultado, os fabricantes de modelos perderão parte dos seus rendimentos.

Um técnico de um provedor chinês de serviços de software de IA disse à Caijing em julho deste ano que eles usaram recentemente o modelo de código aberto Tongyi Qianwen (Qwen2) do Alibaba Cloud para treinamento secundário e ajuste fino para atender a um departamento de turismo local da cidade. Este pedido ultrapassa 10 milhões de yuans e eles são os beneficiários, mas o Alibaba Cloud não tem receita. "Caijing" perguntou sobre o contrato de licença do Qwen2 no Github (a maior plataforma de hospedagem de código do mundo). O acordo diz “Não é necessária solicitação de uso comercial”. Em outras palavras, não há necessidade de pagar pelo uso comercial depois que o Qwen2 for treinado e ajustado.

O valor a longo prazo do código aberto é aumentar o bolo do mercado modelo. Um funcionário do Alibaba Cloud disse a Caijing que é normal que os usuários modifiquem modelos de código aberto para uso comercial, e você deve estar preparado para isso ao fazer código aberto. Embora o Alibaba Cloud ainda não tenha comido todo o bolo, ele tornou o bolo da indústria ainda maior. No longo prazo, acabará por beneficiar. As reações químicas só ocorrerão quando grandes modelos forem amplamente utilizados por diferentes clientes, como governos, grandes e médias empresas e desenvolvedores. As grandes indústrias modelo precisam estabelecer uma ecologia e formar um volante de crescimento. Essa tendência pode ser vista no ModelScope, uma comunidade de código aberto de IA de propriedade da Alibaba Cloud. Em julho deste ano, a comunidade Moda contava com mais de 5,6 milhões de desenvolvedores, mais de 5.500 modelos de alta qualidade e milhares de conjuntos de dados, tornando-a a maior comunidade de modelos de código aberto da China.

Uma visão mais otimista é que o código aberto e o código fechado podem até formar um relacionamento upstream e downstream. O código aberto está na vanguarda da tecnologia, responsável pela participação da comunidade, pela iteração da tecnologia, pela atração de clientes e pela garantia de que a tecnologia esteja à frente de seus pares. O código fechado é downstream e é responsável pela realização comercial.

Lanzhou Technology é uma grande empresa startup modelo na China. Li Jingmei, sócio e co-CEO da Lanzhou Technology, disse a Caijing que o código aberto é tanto uma estratégia técnica quanto uma estratégia de negócios. Pode impactar a comunidade de desenvolvedores, bem como a psique da equipe técnica de clientes em potencial. Código aberto e código fechado não são contraditórios. O ciclo de feedback do cliente para modelos de código fechado é relativamente longo, mas os desenvolvedores comunitários de modelos de código aberto darão feedback rapidamente. Isso pode ajudar as empresas a iterar produtos rapidamente.

Um planejador estratégico de IA de uma empresa líder de tecnologia chinesa acredita que, para os principais fornecedores de nuvem, como o Alibaba Cloud, é melhor ser de código aberto e de código fechado em paralelo do que ser apenas de código fechado. A receita do Alibaba Cloud vem principalmente dos quatro principais componentes da nuvem pública (computação, armazenamento, rede, banco de dados). O modelo de código aberto gratuito promoverá o consumo de dados comerciais dos clientes, impulsionando assim as vendas dos produtos básicos em nuvem mencionados acima.

Somente criar modelos de código fechado é uma abordagem simples, direta e lógica. As grandes empresas que seguem este caminho acreditam que, para comercializar grandes modelos, devem ser de código fechado, caso contrário o circuito comercial não pode ser fechado.

As startups de IA OpenAI (seus modelos da série GPT-4), Amazon (investiu na startup de IA Anthropic, que inclui modelos da série Claude 3.5), Huawei (modelo grande Pangu), Baidu (modelo grande Wenxin) e outras empresas escolheram este estrada. As empresas que usam modelos grandes geralmente pagam por chamada de API (interface de programação de aplicativos), o que é como pagar por água, eletricidade e gás com base no uso. O modelo de negócios do modelo de código fechado é teoricamente o mais saudável. As taxas de crescimento das receitas do Microsoft Azure, Amazon AWS e Google Cloud aumentaram cerca de 5 pontos percentuais no ano passado e os seus níveis de lucro também aumentaram ligeiramente. Acredita-se que isso seja resultado de uma grande atração do modelo.

Mas na China é difícil que o modelo de código fechado seja verdadeiramente rentável a curto prazo. Em maio deste ano, o mercado de modelos chinês iniciou uma guerra de preços. O objetivo da redução de preços é estimular a demanda do cliente e expandir o tamanho do mercado. Os serviços em nuvem da ByteDance, Volcano Engine, Alibaba Cloud, Tencent Cloud e Baidu Smart Cloud reduziram sucessivamente o preço de chamadas de grandes modelos em mais de 90%. A margem de lucro bruto das grandes chamadas de modelos caiu de mais de 60% para menos de 0%.

Uma pessoa responsável pelo grande negócio de modelos de um fornecedor de nuvem chinês acredita que grandes chamadas de modelos entraram na “era do lucro bruto negativo”. Quanto mais você usar, maiores serão suas perdas. A diferença é que grandes empresas como Alibaba, ByteDance e Baidu podem dar-se ao luxo de perder dinheiro, mas as pequenas e médias empresas e as startups não podem.

Ele e um grande executivo de startups expressaram uma visão semelhante - empresas diferentes têm genes diferentes e modelos de estratégias de negócios diferentes. A nuvem é o principal negócio da Alibaba Cloud, e o objetivo final dos modelos de código aberto é vender mais nuvens. O Volcano Engine é apoiado pela ByteDance e o negócio de publicidade da controladora pode ser transfundido. A participação de mercado de computação em nuvem do Volcano Engine é muito menor do que a do Alibaba Cloud "É descalço e não tem medo de usar sapatos", e espera conquistar mais participação de mercado por meio de guerras de preços. A IA é o principal negócio do Baidu. O Baidu espera ganhar dinheiro com grandes modelos, por isso enfatiza o valor dos modelos de código fechado.

Qual é o argumento? Qual é o consenso?

Existem vários focos no debate sobre código aberto e código fechado na China para grandes modelos - primeiro, há uma diferença entre modelos de código aberto e software de código aberto? Em segundo lugar, qual é o mais forte, o modelo de código aberto ou o modelo de código fechado? Terceiro, qual é o modelo de código aberto ou o modelo de código fechado mais caro?

O primeiro debate é: existe diferença entre modelos de código aberto e software de código aberto? A resposta é: há uma grande diferença. A grande maioria dos modelos de código aberto não é totalmente de código aberto. Eles são mais como caixas pretas de uso gratuito, em vez de uma caixa transparente como o software de código aberto.

O software de código aberto publicará o código-fonte e os desenvolvedores poderão dominar a maioria dos detalhes técnicos do software por meio do código-fonte. A lógica central do software de código aberto gratuito é que os desenvolvedores de toda a sociedade podem ajudar os fabricantes de software a encontrar bugs nos produtos e fornecer sugestões de otimização. O desenvolvimento social pode não apenas reduzir os custos de pesquisa e desenvolvimento de software, mas também acelerar a iteração de software. O sistema operacional móvel Android e o software de banco de dados MySQL alcançaram sucesso dessa forma.

A complexidade dos modelos de código aberto excede em muito a dos projetos de software de código aberto, incluindo código-fonte, pesos de parâmetros, estrutura do modelo, dados de treinamento, processo de treinamento, etc. Dois estudiosos da Universidade Radboud, na Holanda, Lisenfeld e Dingemans, publicaram um artigo em março deste ano comparando o grau de código aberto em modelos de código aberto. O artigo mostra que os modelos de código aberto de maior desempenho geralmente apenas pesam os parâmetros de código aberto. Uma explicação é que, para garantir o desempenho líder do modelo, os fabricantes de modelos não podem revelar todas as “receitas”. Tomemos como exemplo o modelo de código aberto mais poderoso do mundo, Llama3. Ele abriu apenas parcialmente o código-fonte de seus pesos de parâmetros e estrutura de modelo. O código-fonte, os dados de treinamento e o processo de treinamento não foram abertos.

Não há dúvidas sobre o valor do conceito de código aberto para a ecologia industrial.Xin Zhou, gerente geral do Baidu Smart Cloud AI e plataforma de grande modelo, disse a Caijing em julho deste ano que os modelos de código aberto tornarão os aplicativos de modelo e os modelos da indústria mais ricos. Mas ele se opõe à fusão do modelo de código aberto com o software de código aberto.Porque existe uma diferença essencial entre os dois – o modelo de código aberto não pode contar com a participação de desenvolvedores sociais para melhorar o desempenho do produto e reduzir os custos de P&D como o software de código aberto. O modelo básico só pode ser melhorado pelo próprio treinamento do fabricante do modelo. O ajuste fino e a otimização de inferência do modelo de código aberto não são tão bons quanto o modelo comercial. Ele possui altos requisitos técnicos para os desenvolvedores e o custo real de uso não é. baixo.

O segundo debate é: qual é o mais forte, o modelo de código aberto ou o modelo de código fechado? O fato é que os modelos de código fechado geralmente têm melhor desempenho do que os modelos de código aberto, mas a lacuna de desempenho entre os modelos de código aberto e os modelos de código fechado está diminuindo.

O Centro de Pesquisa em Modelos Fundamentais (CRFM) da Universidade de Stanford há muito tempo conduz classificações globais de testes de grandes modelos. Em 24 de julho, as classificações dos testes de compreensão de linguagem multitarefa em larga escala (MMLU) divulgadas mostram que entre os dez principais modelos de desempenho, apenas Llama3.1 é um modelo de código aberto, incluindo Claude3.5 (investido pela Amazon), GPT -4o (investido pela Microsoft) e Gemini1.5 Pro (desenvolvido pelo próprio Google) e outros são modelos de código fechado.

Li Jingmei acredita que o modelo de código fechado da mesma empresa deve ter melhor desempenho do que o modelo de código aberto. No entanto, na comparação horizontal na indústria, os modelos de código fechado não são necessariamente melhores que os modelos de código aberto. Como os modelos grandes são iterados a cada 6 a 12 meses, alguns modelos de código aberto podem evoluir mais rapidamente.

As classificações das organizações avaliadoras ilustram essa tendência. A organização LMSYS (Large Model System Research Organization) foi iniciada pela Universidade da Califórnia, Berkeley. A organização também avaliará e classificará o desempenho do modelo global por um longo tempo. Llama3.1 da Meta e Qwen2 da Alibaba Cloud estão melhorando rapidamente nas classificações desta avaliação. Llama3.1 supera até mesmo a maioria dos modelos de código fechado.

Uma pessoa responsável pelo negócio de modelos de grande porte de um fornecedor de nuvem chinês analisou que há duas razões pelas quais a lacuna de desempenho entre os modelos de código aberto e os modelos de código fechado diminuiu. No ano passado, os grandes modelos básicos geralmente entraram em um período de gargalo. melhoria de desempenho. O modelo de código aberto atrai um grande número de desenvolvedores. Embora não possam melhorar diretamente o desempenho do modelo por meio de feedback do código, eles melhoram o nível geral de pesquisa do modelo, o que indiretamente ajuda os modelos de código aberto a melhorar o desempenho do modelo.

O terceiro debate é: modelo de código aberto ou modelo de código fechado, qual é mais caro? A conclusão é que o desempenho é o fator decisivo. Os custos de uso do modelo estão diretamente relacionados ao desempenho do modelo. Quanto maior o desempenho, menor o custo de uso a longo prazo, pois são necessárias menos chamadas para concluir a tarefa.

Os modelos de código aberto são gratuitos e muitas vezes dão a impressão de serem mais baratos e de menor custo. Xin Zhou explicou que o aplicativo de modelo grande é uma solução abrangente que inclui "tecnologia + serviço", e a empresa precisa calcular o "razão geral". Além de fornecer modelos completos e cadeias de ferramentas, os fabricantes de modelos de código fechado também fornecem treinamento e serviços técnicos para ajudar as empresas a começarem rapidamente. O modelo de código aberto parece ser gratuito, mas para obter o mesmo efeito do código fechado, é necessário muito investimento subsequente em mão de obra, dinheiro e tempo, e o custo geral é ainda maior.

No longo prazo, o fator decisivo no custo de aplicação dos modelos de código aberto e de código fechado é o custo da inferência. Modelos de código fechado com a mesma magnitude de parâmetro geralmente apresentam melhor desempenho do que modelos de código aberto e têm custos abrangentes mais baixos. Xin Zhou calculou que se uma empresa implantar um modelo de código aberto gratuitamente, a implantação de um modelo de código fechado custará 500.000 yuans. Na fase inicial de investimento, o modelo open source é mais barato. Na fase posterior de uso, se o desempenho abrangente do modelo de código fechado for 20% melhor do que o do modelo de código aberto, o modelo de código fechado pode economizar dezenas de milhares de yuans por dia em algumas empresas de grande volume . Em última análise, o custo de utilização a longo prazo deve ser muito inferior ao do modelo de código aberto.

Quem está usando o modelo de código aberto? Quem está usando o modelo de código fechado?

O modelo de código aberto é melhor ou o modelo de código fechado? Esta questão não é decidida pelos fabricantes de modelos do lado da oferta, mas pelos clientes empresariais do lado da procura.

Em público, as guerras de palavras corporativas continuam. No entanto, muitos técnicos de fornecedores de nuvem disseram à Caijing que esses argumentos não podem negar o valor de mercado um do outro. Estas duas necessidades coexistirão por muito tempo. Olhando de outra perspectiva, uma guerra de palavras facilita o aumento conjunto da visibilidade do mercado.

Na verdade, a maioria dos clientes empresariais não se importa se o modelo precisa ser de código aberto. Xin Zhou concluiu que, depois de se comunicar com muitos clientes de grandes empresas, descobriu que o uso de um modelo pelo chefe do departamento de TI depende de muitos fatores. A classificação em ordem de prioridade geralmente é: efeito, desempenho, preço e segurança. Código aberto ou código fechado não é um fator decisivo.

Na “caixa de ferramentas” da maioria das empresas, os modelos de código aberto e os modelos de código fechado são complementares. A implementação de grandes modelos por grandes empresas costuma ser dividida em diferentes etapas.

Na fase inicial, o departamento de TI irá classificar o desempenho e as características dos modelos de código aberto e de código fechado no mercado. Modelos diferentes têm vantagens diferentes. Alguns têm fortes capacidades de pronúncia do idioma e outros têm fortes capacidades de estatísticas de dados. Teste POC (prova de conceito) de modelo de código aberto gratuito em estágio inicial para verificar os efeitos nos negócios.

No médio prazo, iniciaremos a primeira fase de projetos em cenários de negócios de baixa dificuldade e resultados rápidos, como marketing, atendimento ao cliente e base de conhecimento. Você não só precisa comprar um modelo de código fechado, mas também treinar e ajustar seu próprio modelo de código aberto. Deixe os modelos internos e externos "correrem com cavalos", comparem os efeitos e custos de diferentes modelos e mudem de uso a qualquer momento.

Na fase posterior, com base nos resultados da implementação, planejaremos gradativamente os projetos da segunda e terceira fases em cenários de negócios difíceis e lentos para produzir resultados. Neste momento, muitas vezes é até necessário gastar dezenas de milhões de yuans para estabelecer um conjunto de grandes modelos básicos independentes e controláveis ou grandes modelos da indústria.

O modelo de código aberto é gratuito, mas não pode ser usado imediatamente, requer tempo e esforço e ninguém é responsável pelos detalhes. O modelo de código fechado pode obter diretamente produtos maduros e fornecer serviços completos antes, durante e após as vendas. Para simplificar, o modelo de código aberto é como comprar comida e cozinhar para si mesmo, enquanto o modelo de código fechado é como gastar dinheiro para comer em um restaurante.

O ponto de vista de Xin Zhou é que o modelo de código aberto é adequado para pesquisa acadêmica, para algumas pequenas e médias empresas com orçamentos de TI extremamente limitados e para algumas grandes empresas para projetos de autopesquisa interna independente e controlável, mas não é adequado para projetos comerciais externos de grande escala. Em alguns projetos comerciais sérios que custam milhões ou dezenas de milhões de dólares, o modelo de código fechado ainda é a melhor escolha.

O modelo de código aberto não é almoço grátis. Existem muitos custos ocultos para grandes empresas que utilizam o modelo de código aberto. Por exemplo, aquisição de poder computacional, adaptação de software, etc. Um diretor técnico de um provedor chinês de serviços de marketing inteligente no exterior disse a Caijing em julho deste ano que sua empresa depende fortemente de serviços em nuvem e gasta mais de 80 milhões de yuans em pesquisa e desenvolvimento todos os anos. Nos últimos dois anos, a empresa utilizou mais de dez modelos de código fechado ao mesmo tempo, mas não há modelos de código aberto entre eles. Na sua opinião, o modelo de código aberto requer tempo e mão de obra para funcionar. A maioria dos modelos de código aberto não podem ser usados imediatamente, ninguém conhece os detalhes e só podem ser considerados "brinquedos". Ele tende a gerenciar mais de uma dúzia de modelos de código fechado e trocá-los a qualquer momento com base no preço e no desempenho. Este é o mais econômico.

Um diretor de TI de um grande banco comercial de ações acredita que não é um grande problema que o modelo de código aberto não possa ser usado imediatamente. Ele disse a Caijing em dezembro de 2023 que sua equipe também usou Alibaba (modelo de código aberto Tongyi), Meta (modelo de código aberto Llama), Baidu (série Wenxin) e Zhipu (série GLM) para aplicativos de auditoria de relatórios de conformidade de pesquisa de autoatendimento. O modelo de código aberto é adequado para projetos pequenos, pois permite testes POC gratuitos e pode ser modificado conforme necessário. Sua equipe de TI conta com dezenas de pessoas, além de uma empresa terceirizada de serviços de TI, com mão de obra suficiente para lidar com esses problemas. Mas ele também acredita que em projetos de grande escala no valor de um milhão ou dez milhões de yuans, o modelo de código fechado é mais adequado. Como o modelo de código fechado é estável e confiável, você também pode encontrar uma empresa modelo responsável por cuidar dele.

Custa dezenas de milhões de yuans treinar completamente um conjunto de modelos industriais usando modelos de código aberto e também requer a compra de chips de IA para construir uma sala de computadores autoconstruída. Os técnicos fornecedores de serviços de software de IA acima mencionados concluíram que o modelo de código aberto é adequado para algumas empresas estatais centrais que têm elevados requisitos de segurança, autonomia e controlo de dados e não são tão sensíveis aos custos. Eles usarão modelos de código aberto para treinar seus próprios modelos industriais. Porque o "modelo de código aberto + nuvem privada" atende às demandas de segurança de dados e controlabilidade independente de muitas empresas centrais e estatais.

Qual é o futuro?

O debate entre fontes abertas e fechadas de grandes modelos no mercado chinês é uma questão puramente comercial. Porém, no mercado internacional, a disputa entre grandes modelos de fontes abertas e fechadas envolve mais fatores como antitruste e interesses nacionais.

Após a guerra de preços em maio deste ano, as grandes chamadas de modelos da China entraram na "era do lucro bruto negativo". Tanto os modelos de código aberto quanto os de código fechado enfrentam um problema – modelos grandes não podem obter lucros diretos.

"A competição arrasadora no mercado de grandes modelos já começou." Um responsável pelo negócio de grandes modelos de um fornecedor de nuvem chinês analisou que o lucro bruto negativo para chamadas de grandes modelos significa que quanto mais chamadas forem feitas no curto prazo, maior será o lucro bruto. maiores serão as perdas para os fornecedores de nuvem. Os fornecedores de nuvem chineses estão apostando que, depois que o preço das chamadas de grandes modelos for reduzido em 90%, o número de chamadas de grandes modelos aumentará exponencialmente nos próximos um a dois anos. No longo prazo, os custos de energia computacional dos fornecedores de nuvem serão diluídos à medida que a demanda dos clientes crescer, e eles ainda serão capazes de obter lucros positivos no final. Mesmo que esta aposta não se concretize, um grupo de fabricantes de modelos morrerá na guerra de preços e os fabricantes sobreviventes juntarão os cacos.

Muitos membros da indústria expressaram a mesma opinião à Caijing. Esta rodada de eliminação durará de 1 a 2 anos e apenas 3 a 5 empresas do modelo básico podem continuar a sobreviver.

An Xiaopeng, membro do comitê executivo da China Informatization Baihui e diretor do Alibaba Cloud Intelligent Technology Research Center, disse a Caijing em julho deste ano que não há guerra de centenas de modelos na China, ou mesmo uma guerra de dez modelos. Modelos grandes exigem investimento contínuo, têm capacidade para 10.000 ou até 100.000 cartões e exigem retorno comercial. Muitas empresas não possuem tais capacidades. No futuro, haverá apenas três ou cinco fabricantes de modelos básicos no mercado chinês.

Quem se beneficia com a guerra de preços? Quem vai rir por último? Os planejadores estratégicos de IA das principais empresas de tecnologia da China acima mencionados acreditam que nesta rodada de guerra de preços, o Volcano Engine do Alibaba Cloud e ByteDance tem mais sangue. O Alibaba Cloud pode ganhar dinheiro com a nuvem, e o Volcano Engine tem o negócio de publicidade da ByteDance como uma transfusão de sangue. Numa guerra de preços, o Baidu não é tão bom quanto o Alibaba e o ByteDance. No entanto, o grande modelo Wenxin do Baidu possui tecnologia forte e terá um grupo de clientes dispostos a pagar pela tecnologia. Isso ajudará o Baidu a sobreviver à guerra de preços. Ele explicou ainda que essas grandes startups modelo no mercado chinês enfrentarão testes severos nos próximos um a dois anos. Grandes startups de modelos podem optar por se tornar empresas de desenvolvimento de modelos baseados em projetos ou migrar para modelos verticais de indústria.

A concorrência global no grande mercado de modelos da China é muito mais importante do que a concorrência local entre modelos de código aberto e modelos de código fechado. A direcção da concorrência global determinará directamente o resultado da concorrência local.

Um funcionário do Alibaba Cloud disse sem rodeios que tanto os modelos de código aberto quanto os de código fechado têm seus próprios benefícios, e o Alibaba Cloud espera tornar a IA mais inclusiva. Independentemente do código aberto ou fechado, o objetivo principal é dar aos desenvolvedores mais opções. Alibaba Cloud optou por andar sobre duas pernas: código aberto e código fechado. Possui modelos de código aberto em tamanho real e modais e modelos de código fechado. Outra pessoa responsável pelo grande modelo de negócios de um fornecedor de nuvem chinês acredita que o código aberto não tem modelo de negócios. No mercado modelo da China, apenas empresas líderes ou um número muito pequeno de startups que possam angariar fundos de forma sustentável podem insistir no código aberto. No final, pode haver apenas 1-2 modelos de código aberto no mercado chinês.

Os fabricantes de modelos treinam uma nova geração de modelos quase a cada 6 a 12 meses. No mercado de modelos chineses, à medida que aumenta a pressão para obter lucros, o modelo de código aberto pode se tornar cada vez mais "estratégico" - as empresas tenderão a abrir modelos de código-fonte com tecnologia atrasada e parâmetros menores na geração anterior, e orientar os usuários a pagar para use atualizações e parâmetros de tecnologia maiores.

A competição entre modelos de código aberto e de código fechado não terminará tão cedo. Algumas empresas podem até executar código aberto e código fechado ao mesmo tempo.No setor de TI, isso não é sem precedentes. Já se passaram mais de 60 anos desde que o banco de dados nasceu e já se passaram mais de 50 anos desde que nasceu o primeiro banco de dados de código aberto. O mercado de bancos de dados está atualmente ativo com diferentes bancos de dados de código fechado e de código aberto, e novas marcas de bancos de dados ainda estão surgindo indefinidamente. A gigante dos bancos de dados Oracle ainda possui um banco de dados RDBMS de código fechado e um banco de dados MySQL de código aberto.

Muitos técnicos de fornecedores de nuvem acreditam que os modelos de código aberto e os modelos de código fechado coexistirão por muito tempo. O grande mercado de modelos crescerá gradualmente em meio à concorrência de diferentes rotas técnicas.

Editor｜Zhang Yufei

notícias

Qual é a batalha entre código aberto e fechado para modelos grandes?

Introdução

Minhas informações de contato