notícias

As empresas estrelas da IA ​​lutam por modelos pequenos, os custos despencam e economizam mais nas contas de luz, acelerando a popularização da IA

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Coisas inteligentes (conta pública:zhidx com
Compilado por Meng Qiang
Editor Yunpeng

De acordo com relatórios da Venture Beat, na semana passada, Hugging Face, Mistral AI e OpenAI lançaram seus respectivos pequenos modelos (SLM) em 16 e 18 de julho, prometendo popularizar recursos avançados de processamento de linguagem natural. No passado, as empresas de tecnologia competiram para buscar redes neurais maiores e mais complexas no caminho dos grandes modelos de linguagem. Venture Beat acredita que esses pequenos modelos abriram novos caminhos e também podem afetar a maneira como as empresas usam soluções de IA.

Modelos pequenos, como o nome sugere, são relativos a modelos de linguagem grandes (LLM). Eles geralmente têm menos parâmetros e menores requisitos de recursos computacionais. Comparados com grandes modelos de linguagem com parâmetros muitas vezes na casa das centenas de bilhões ou até trilhões, os parâmetros dos três novos modelos pequenos: SmolLM, Mistral NeMo e GPT-4o mini podem variar de centenas de milhões a dezenas de bilhões, dependendo do treinamento. volume. O consumo de energia é menor do que o de modelos de linguagem grandes. Embora os três modelos utilizem métodos diferentes para popularizar a IA, todos eles têm um objetivo comum: levar capacidades poderosas de processamento de linguagem a mais dispositivos e aplicações.

1. Como os pequenos modelos mudam a computação de ponta

Venture Beat acredita que o SmolLM da Hugging Face é o mais inovador dos três. Ele foi especialmente projetado para rodar em dispositivos móveis e possui três especificações: 135 milhões, 360 milhões e 1,7 bilhão de parâmetros, o que facilita o processamento de IA em dispositivos de ponta e resolve os principais problemas de privacidade e latência de dados.

A importância do SmolLM vai muito além da melhoria da eficiência. Permitir que dispositivos de ponta usem processamento de IA pode permitir que aplicativos de dispositivos sejam executados com base em baixa latência e alta proteção de privacidade. No passado, muitas funções complexas de IA não podiam ser realizadas devido a questões de privacidade ou de conexão. Com o SmolLM, essas funções podem se tornar uma realidade.

Além disso, a Mistral AI lançou o modelo Mistral NeMo, que possui 12 bilhões de parâmetros e uma janela de contexto de até 128k. Mistral NeMo é voltado para computadores desktop e está posicionado entre grandes modelos de nuvem e IA móvel ultracompacta. O primeiro é um modelo de IA em grande escala treinado e executado em uma plataforma de computação em nuvem, enquanto o último é um dispositivo móvel com recursos limitados ( como um telefone celular).

Venture Beat disse que o método de computação do Mistral NeMo pode trazer mudanças consideráveis ​​para o campo empresarial. O modelo tem o potencial de alavancar hardware de consumo para democratizar capacidades complexas de IA que antes eram reservadas a gigantes da tecnologia e instituições de pesquisa bem financiadas. Isso pode ajudar vários setores a popularizar aplicativos baseados em IA, como otimizar o atendimento ao cliente e fornecer ferramentas de análise de dados mais sofisticadas.

2. O eficiente modelo pequeno GPT-4o mini da OpenAI tem um belo preço

A OpenAI também entrou na competição dos modelos pequenos com o lançamento do GPT-4o mini, considerado o modelo pequeno com melhor custo-benefício do mercado. Custa apenas 15 centavos por milhão de tokens para entrada e 60 centavos por milhão de tokens para produção. A Venture Beat afirma que o GPT-4o mini reduz muito o acesso ao fundo de integração de IA.

Além disso, a estratégia de preços do GPT-4o mini poderia gerar uma nova onda de inovação impulsionada pela IA, especialmente entre startups e pequenas empresas. Ao reduzir significativamente o custo da integração de IA, este modelo reduz efetivamente a barreira de entrada para a adoção de soluções baseadas em IA. Ventrue Beat acredita que isto pode acelerar a inovação tecnológica e a reforma em vários setores. Além disso, esta mudança para modelos menores reflete as novas tendências na comunidade de IA: pesquisadores e desenvolvedores estão cada vez mais focados na eficiência, acessibilidade e aplicações de nicho. Esta tendência pode levar a soluções de IA mais direcionadas e eficientes, otimizadas para tarefas e setores específicos.

3. Modelos pequenos promovem a inovação tecnológica verde e reduzem a pegada de carbono da tecnologia

A mudança para modelos mais pequenos também se alinha com as preocupações crescentes sobre o impacto ambiental da IA. O treinamento e a operação de modelos pequenos consomem menos energia, o que pode reduzir a pegada de carbono da tecnologia de IA. À medida que as empresas tecnológicas enfrentam uma pressão crescente para serem sustentáveis, a Venture Beat acredita que o baixo consumo de energia e as baixas emissões do modelo pequeno podem tornar-se um importante ponto de venda.

As implicações ambientais desta mudança para modelos mais pequenos poderão ser profundas. À medida que a IA se torna mais predominante, as poupanças de energia resultantes da proliferação de modelos mais eficientes poderão ser enormes. Isto pode permitir que a IA assuma um papel de liderança na inovação verde, em vez de continuar a contribuir para o aquecimento global.

No entanto, a ascensão de modelos pequenos não está isenta de desafios. À medida que a IA se torna mais omnipresente, as questões de preconceito, responsabilização e utilização ética tornam-se mais prementes. Se não for regulamentada, a difusão da IA ​​através de pequenos modelos poderá amplificar os preconceitos existentes ou criar novos dilemas éticos. Para desenvolvedores e usuários de modelos pequenos, além das capacidades técnicas, as questões éticas também devem ser priorizadas.

Conclusão: O futuro do desenvolvimento da IA ​​aponta para a diversificação e especialização

Embora modelos pequenos tenham vantagens em eficiência e generalização, seu poder de processamento pode não corresponder ao de modelos de linguagem grandes em muitas tarefas devido a limitações no número de parâmetros. Venture Beat disse que isso mostra que no futuro cenário de desenvolvimento de IA, haverá modelos de linguagem de vários tamanhos, e modelos menores terão aspectos específicos nos quais são bons.

Olhando para o futuro, esperamos ver o desenvolvimento de modelos de IA florescer. Quer se trate de um modelo de linguagem grande ou de um modelo pequeno, uma abordagem única não é aconselhável. desempenho e requisitos específicos da aplicação. Para as empresas e os decisores técnicos, estes três pequenos modelos representam uma mudança no sentido de soluções de IA mais eficientes, profissionais e implementáveis, proporcionando novas possibilidades para a integração da IA ​​em ambientes empresariais. Quanto a saber se os pequenos modelos podem substituir o atual domínio dos grandes modelos na nuvem, ainda é muito cedo para tirar conclusões.

Fonte: VentureBeat