notícias

Llama 3.1, "European OpenAI" lança novo modelo de código aberto Large 2 |

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Autor | Wang Yixin

Editora|Anita Tang

Menos de um dia depois que a Meta lançou o mais recente modelo grande de código aberto Llama 3.1, a startup francesa de IA Mistral deu o pontapé inicial - em 24 de julho, a Mistral lançou seu novo modelo carro-chefe, Large 2.

Mistral AI é uma empresa francesa de IA que acaba de ser criada há um ano. É também o player de IA mais bem financiado e competitivo da Europa até agora. Seus principais membros vêm de instituições de IA de ponta, como o Google DeepMind. como Lianchuang Mensch. Autores de grandes modelos de artigos, como Chinchilla, propuseram tecnologias básicas, incluindo Leis de Escala.

Apenas 4 semanas após a sua criação em junho de 2023, a Mistral AI recebeu 105 milhões de euros em financiamento com uma equipa de 6 pessoas. A empresa concentra-se na investigação e desenvolvimento de grandes modelos de código aberto e foi elogiada pelo presidente francês Macron como “um modelo para uma nova geração de start-ups europeias competirem com gigantes tecnológicos americanos”.

Em dezembro de 2023, a Mistral lançou um grande modelo de código aberto chamado Mistral 8x7B, que tem 56 bilhões de parâmetros. Sua eficiência e desempenho são comparáveis ​​ao LLaMA-65B, e se tornou um sucesso instantâneo na indústria de grandes modelos. Além disso, a empresa também avaliou o ChatGPT e lançou um assistente de conversação multilíngue chamado Le Chat (o site oficial mostra que ainda está em fase de testes e requer registro e inscrição para qualificações de teste) para mostrar as mais recentes capacidades técnicas da empresa.

Mistral disse que o Large 2 ultrapassou o Llama 3.1 405B em geração de código, matemática e capacidades de raciocínio usando menos de um terço dos parâmetros do Llama 3.1 405B, ou 123 bilhões de parâmetros, e superou outros modelos líderes de IA na geração de respostas mais concisas. muitas descrições longas. Isso significa que o Large 2 tem mais vantagens em termos de custo e os desenvolvedores podem executá-lo localmente com mais rapidez.

Assim como o Llama 3.1 do Meta, o Large 2 não possui recursos multimodais, mas em termos de precisão e confiabilidade das respostas do diálogo, pode ser comparado ao "pequeno é maior" do Llama. Mistral disse que o problema de alucinação do modelo foi um dos focos durante o processo de treinamento do Grande 2. Além disso, o Large 2 também melhora o acompanhamento de comandos e tarefas de conversação, lidando com instruções precisas e conversas longas e multivoltas.

Large 2 tem um comprimento de contexto de 128k e pode receber aproximadamente tantos caracteres quanto um livro de 300 páginas em uma única conversa. Além disso, o Large 2 oferece suporte a vários idiomas e pode lidar com inglês, francês, alemão, espanhol, italiano, português, árabe, hindi, russo, chinês, japonês e coreano, além de 80 idiomas de código.


Fonte: Site oficial da Mistral

Deve-se ressaltar que o modelo de Mistral não é um modelo de código aberto no sentido tradicional e o uso comercial exige pagamento.

Atualmente, o Large 2 entrou nas plataformas Google, Amazon, Azure e IBM para uso dos usuários. Os usuários também podem experimentá-lo através do "mistral-large-2407" no La Plateforme da Mistral (uma plataforma abrangente que simplifica o desenvolvimento de aplicativos de IA e fornece modelos pré-treinados, ferramentas de processamento de dados e interfaces API), ou testá-lo gratuitamente no Le Chat.

A Mistral concluiu o financiamento da Série B em junho deste ano, levantando um total de 640 milhões de dólares e uma avaliação de 6 mil milhões de dólares. Esta rodada de financiamento foi liderada pela General Catalyst, e os investidores também incluem Lightspeed Venture Partners, Andreessen Horowitz, Nvidia, Samsung Ventures e IBM.

A Mistral AI conta atualmente com aproximadamente 60 funcionários, 45 dos quais estão na França, 10 nos Estados Unidos e cinco no Reino Unido. Cerca de três quartos de seus funcionários trabalham no desenvolvimento e pesquisa de produtos, segundo o Financial Times.