notícias

Versão europeia do CEO da OpenAI: Não há riscos no modelo de código aberto, só vejo os benefícios

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

【Nota do editor】ter“OpenAI europeu”A Mistral AI, conhecida como Mistral AI, foi avaliada em US$ 6 bilhões após apenas um ano de criação.

Desde a sua criação, a Mistral AI tem feito esforços frequentes no campo do código aberto e lançou recentemente o seu modelo principal de nova geração. Mistral Grande 2, alcançando desempenho comparável ao Llama 3.1 405B com menos de um terço do número de parâmetros.

Recentemente, o cofundador e CEO da Mistral AI, Arthur Mensch, discutiu em detalhes em uma entrevista exclusiva para a revista Time Tópicos como a forma como a IA Mistral atrai talentos escassos em inteligência artificial (IA), como obter rentabilidade e a falta de um ecossistema europeu de IA

As ideias centrais são as seguintes:

  • Mensch diz que não há riscos no modelo de código aberto, ele só vê benefícios;
  • O modelo de código aberto é uma ferramenta neutra que pode ser usada para fazer qualquer coisa;
  • As pessoas não estão proibindo o uso de C só porque você pode criar malware em C;
  • De certa forma, a IA não muda nada no software, é apenas uma forma mais abstrata de definir software;
  • A tecnologia utilizada para construir estas aplicações não é a única coisa que pode ser regulamentada, é importante controlar a qualidade das aplicações que são colocadas no mercado;
  • De certa forma, os grandes modelos podem ser vistos como uma linguagem de programação mais abstrata que mudará a forma como trabalhamos nos próximos 10 anos;
  • A Mistral AI não mudou em termos de código aberto, mas sempre quis ter modelos líderes no campo do código aberto, bem como alguns recursos avançados que só podem ser obtidos através de serviços monetizados.



Foto | Arthur Mensch, cofundador e CEO da Mistral AI

O Acadêmico Toutião fez uma compilação simples, sem alterar a ideia central do texto original. O conteúdo é o seguinte:

Durante o ano passado, a Mistral AI, com sede em Paris, emergiu rapidamente como uma das empresas locais de IA mais influentes na Europa. A startup lançou seis modelos de linguagem que podem responder perguntas, gerar código e realizar raciocínios básicos.

Em junho, a Mistral AI disse que levantou US$ 645 milhões em uma rodada de financiamento que a avaliou em mais de US$ 6 bilhões. Em fevereiro, eles fecharam um acordo com a Microsoft para disponibilizar seus modelos aos clientes desta última em troca de acesso aos recursos computacionais da Microsoft.

O cofundador e CEO da Mistral AI, Arthur Mensch, fala sobre o debate sobre a histórica Lei de Inteligência ArtificialEm vez de regulamentar modelos fundamentais como o Mistral, os legisladores deveriam concentrar-se em regular a forma como outros utilizam estes modelos. . Ele também se opõe às restrições aos desenvolvedores de IA que compartilham livremente suas criações. “Não vejo nenhum risco no modelo de código aberto. Só vejo os benefícios”, disse ele.

A TIME conversou com Mensch sobre como atrair talentos escassos em IA, como a IA Mistral pode se tornar lucrativa e a falta de um ecossistema de IA na Europa.

P: Há alguns meses, seu diretor comercial, Florian Bressand, disse à CNBC que mais da metade da equipe de P&D da Llama agora trabalha na Mistral. Como você atraiu tantos pesquisadores excelentes do Meta?

No início, nós amarramos nossos próprios amigos. Podemos fazer isso porque fizemos algumas contribuições significativas na área, então as pessoas sabem que é divertido trabalhar conosco. Aí, a partir de dezembro, começamos a contratar algumas pessoas que não conhecíamos muito bem. Isto se deve à estratégia que estamos seguindo para levar o campo para uma direção mais aberta. Esta é também a missão de muitos cientistas. Eles têm razões semelhantes às nossas e gostam da antiga forma de comunicação e fluxo de informações livres.

P: Muito poucas pessoas no mundo podem treinar um sistema de IA como o Mistral. Eu sei que a indústria de IA na França está muito desenvolvida, mas você acha que recrutou com sucesso uma parte considerável (ou mesmo todas) das pessoas que entendem de IA?

(Claro) Nem todos. Muitos de nossos amigos estão na indústria, estão no Google, OpenAI e algumas pessoas ainda estão na Meta. Mas certamente atraímos 15 pessoas que souberam treinar esses modelos. Embora seja difícil estimar o tamanho do conjunto de talentos, eu diria que provavelmente eram 10% das pessoas que sabiam como trabalhar nessas coisas na época.

P: A Mistral AI tem arrecadado fundos, onde você gastou o dinheiro?

Gastávamos principalmente nosso dinheiro em computação. A estrutura dessa indústria é diferente da indústria de software, pois no início é preciso investir muito dinheiro para formar uma equipe de pesquisa científica e construir modelos de ponta.

P: Executivos de quase todas as outras empresas de modelo básico falaram sobre como esperam gastar US$ 100 bilhões em computação nos próximos anos. Você tem expectativas semelhantes?

Gastámos cerca de 25 milhões de euros nos últimos 12 meses para chegar onde estamos hoje - temos uma presença global e os nossos modelos são líderes em termos de desempenho e eficiência. O nosso argumento é que podemos utilizar o capital de forma mais eficiente e a tecnologia que estamos a desenvolver é, na verdade, intensiva em capital, mas com uma boa ideia pode ser implementada com menos despesas do que os nossos concorrentes. Provámos isto em 2023-2024 e esperamos que continue em 2024-2025. Obviamente, vamos gastar mais. Mas os nossos gastos ainda serão uma fração dos nossos concorrentes.

P: Você é lucrativo atualmente?

ainda não. Nosso investimento foi bastante grande e, para uma startup com apenas 12 meses, a rentabilidade não era esperada.

P: Qual é o plano de lucro? Qual é o seu modelo de negócios?

Nosso modelo de negócios é construir modelos de ponta e disponibilizá-los aos desenvolvedores. Estamos construindo uma plataforma de desenvolvimento que permite aos desenvolvedores personalizar modelos de IA e desenvolver aplicativos de IA diferenciados - eles podem implantar a tecnologia onde quiserem, potencialmente sem usar serviços de nuvem pública, o que lhes permite personalizar modelos em vez de usar modelos genéricos por trás de APIs fechadas e opacas como é o caso atualmente. Finalmente, também prestamos muita atenção à eficiência do modelo, para que possamos atingir um certo nível de capacidade de inferência para tornar o modelo o mais rápido e barato possível.

É isso que estamos construindo: uma plataforma de desenvolvedor que nós mesmos hospedamos e depois atendemos os clientes por meio de APIs e serviços gerenciados. Mas também implantamos a plataforma para clientes que desejam controle total sobre a tecnologia, para que possamos oferecer aos clientes acesso ao software e controle total sobre os dados usados ​​em seus aplicativos.

P: É justo dizer que seu plano é criar modelos de IA para você e seus clientes a um custo mais baixo, quase comparável aos de seus concorrentes, e tornar esses modelos mais disponíveis ao público? Ou você espera igualar os modelos mais avançados ou “modelos de ponta” de seus concorrentes em termos de capacidades?

Planejamos continuar a nos atualizar e, eventualmente, ser tão competitivos quanto outras empresas. Mas, na verdade, o nosso modelo de negócio é algo que outras empresas não têm. Preferimos compartilhar, personalizar e implantar nossa tecnologia. Não temos mais controle nessas áreas.

P: Recentemente, você forneceu serviços para seus modelos mais poderosos como APIs, e todos os seus modelos no início eram abertos. Por que você fez essa mudança?

Não mudamos neste momento. Queremos sempre ter um modelo líder no espaço de código aberto, mas também ter alguns recursos avançados que só estão disponíveis através de serviços monetizados.

Uma grande parte do que oferecemos é de código aberto, o que permite que os desenvolvedores adotem nossa tecnologia e construam o que precisarem com ela. Em última análise, esses desenvolvedores usarão nossa plataforma quando você quiser migrar as cargas de trabalho que eles construíram para a produção ou quiser torná-las melhores, mais eficientes, mais bem gerenciadas e com manutenção mais barata, usando nosso modelo de otimização latente para melhorar o desempenho e a velocidade dos recursos de inferência.

Continuaremos fazendo isso. O código aberto é muito importante para nós. Estamos construindo uma plataforma de desenvolvimento em cima disso, que obviamente será monetizada porque realmente precisamos de um modelo de negócios que funcione. Mas esperamos agregar valor adicional aos desenvolvedores que usam nosso modelo de código aberto.

P: Você costuma dizer que a Europa não pode confiar nas empresas americanas de IA e precisa de um modelo local de ponta. A Mistral AI é uma das empresas de IA mais conhecidas na Europa, mas tem uma parceria com a Microsoft para obter o poder computacional de que necessita. Será que a dependência da Mistral AI da Microsoft neste aspecto limitará a sua capacidade de desempenhar um papel soberano de vanguarda na IA?

Temos quatro provedores de nuvem. Somos independentes da nuvem desde o início e essa tem sido nossa estratégia desde o primeiro dia. Nossos modelos estão disponíveis no Microsoft Azure, bem como no Amazon Web Services e no Google Cloud Platform. Usamos todos os três como provedores de nuvem. Também usamos diferentes provedores de nuvem, principalmente CoreWeave, para fornecer treinamento. Construímos nossa própria pilha de tecnologia e canais de distribuição para criar a independência que achávamos que nossos clientes precisavam.

P: Além de estabelecer laboratórios de IA na Europa, a Europa deveria também tentar estabelecer a sua própria infra-estrutura informática soberana?

Acho que será bom para o ecossistema. Mas a Europa não é um actor que toma decisões por si só e constrói algo do nada. Isto envolve uma questão ecossistémica, ou seja, como garantir que a Europa possa fornecer eficazmente algumas infra-estruturas informáticas.

Isto é muito importante para os nossos clientes porque alguns deles são clientes europeus e querem alguma forma de soberania sobre a infra-estrutura de nuvem que utilizam. A este respeito, algumas das acessibilidades, inferências e plataformas dos nossos modelos já estão implementadas na Europa. Mas pode haver algumas melhorias. Isto não é decidido pela Europa. É um ecossistema e é preciso reconhecer que algumas necessidades podem ser resolvidas. Esperamos ter alguns parceiros europeus na nuvem num futuro próximo.

P: Cedric O, ex-ministro francês de Assuntos Digitais e um de seus cofundadores, alertou que o projeto de lei de inteligência artificial poderia “matar” a IA Mistral. O projeto de lei foi aprovado, mas ainda não foi desenvolvido um código de conduta para modelos de IA de uso geral. Como eles deveriam ser?

De um modo geral, a Lei da Inteligência Artificial é muito viável porque as restrições a que estamos sujeitos são restrições que já cumprimos. Documentamos a forma como usamos o modelo, a forma como avaliamos o modelo, e isso se tornou um requisito para modelos de ponta. Então não há problema em fazer isso.

Ainda há alguma discussão sobre a transparência do conjunto de dados de treinamento, que é algo que gostaríamos muito de alcançar, mas precisa ser ponderado em relação à confidencialidade comercial. Muitos dos nossos direitos de propriedade intelectual também se refletem na forma como processamos e selecionamos dados. São também os direitos de propriedade intelectual de terceiros. Como somos uma pequena empresa, temos muito cuidado com a nossa propriedade intelectual porque é a única coisa que possuímos. Portanto, a partir dessa perspectiva, estamos confiantes de que poderemos encontrar uma forma que seja aceitável para todas as partes.

Somos solicitados a participar e fornecer informações no desenvolvimento de especificações técnicas. Queremos também que a Europa seja capaz de fazer escolhas independentes que promovam o desenvolvimento do ecossistema e deixem todos felizes.

P: Os executivos dos seus concorrentes têm muito a dizer sobre como a IA mudará o mundo nos próximos cinco ou dez anos, o que os preocupa e os tipos de coisas que o desenvolvimento de sistemas de IA mais poderosos pode trazer para a mudança. . Você previu como a IA mudará o mundo?

Construímos uma tecnologia poderosa, mas penso que agora há uma tendência para assumir que esta tecnologia poderosa pode resolver todos os problemas. Na Mistral AI, estamos muito focados em garantir que a nossa tecnologia possa melhorar a produtividade, trazer capacidades de raciocínio para certas indústrias verticais, certos campos e, assim, gerar benefícios sociais.

Tudo o que os humanos criam é uma ferramenta, e as novas ferramentas que trazemos trazem novas capacidades abstratas. Então, de certa forma, você pode pensar nela como uma linguagem de programação mais abstrata. Há 50 anos programamos em linguagens que os computadores entendem. Hoje em dia podemos criar sistemas apenas conversando com eles em inglês, francês ou qualquer outro idioma. Isto traz um novo método de abstração para trabalhadores e desenvolvedores, o que obviamente mudará a forma como trabalhamos nos próximos 10 anos.

Penso que se fizermos bem e garantirmos que todos têm esta ferramenta nas mãos - e foi por isso que criámos o Mistral - podemos garantir que melhora a vida de todas as pessoas em todo o mundo, de pessoas de todos os níveis socioeconómicos. . Para conseguir isso, para nós, devemos primeiro alcançar aplicações diferenciadas na medicina, na educação e em outras áreas. É também muito importante garantir que as pessoas sejam formadas e tenham acesso à tecnologia, mas também que a tecnologia seja acessível às pessoas - disponibilizar a tecnologia de uma forma mais aberta do que seria de outra forma é uma forma de acelerar o desenvolvimento tecnológico. Se isto não bastasse, os decisores políticos também devem desenvolver programas de apoio para acelerar o acesso à Internet em áreas do mundo que ainda não têm acesso à Internet. Mas penso que as novas ferramentas que estamos a desenvolver – IA generativa – têm um efeito positivo ao ajudar as pessoas a utilizar esta nova ferramenta.

P: Você pode imaginar o que acontecerá no futuro? Se você desenvolveu um modelo de IA, ou está desenvolvendo um modelo, e percebe alguns de seus recursos. Nesse caso, você decidiria que é melhor não abrir o código-fonte do modelo, mas mantê-lo atrás de uma API, ou nem mesmo implantá-lo atrás de uma API?

Não seremos assim no futuro próximo. Os modelos que construímos têm capacidades preditivas. Descobrimos que a única maneira de gerenciar coletivamente o software e como usá-lo era ser de código aberto. É disso que se trata a segurança cibernética. O mesmo vale para sistemas operacionais. Portanto, a tecnologia mais segura hoje é a tecnologia de código aberto.

De certa forma, a IA não muda nada no software. É apenas uma forma mais abstrata de definir software. Portanto, não vejo nenhum risco no modelo de código aberto. Só vejo os benefícios. Esta é uma ferramenta neutra que pode ser usada para qualquer coisa. Não estamos proibindo o uso de C só porque você pode criar malware em C. O modelo que lançamos não é diferente. Por isso, continua a ser muito importante controlar a qualidade das aplicações colocadas no mercado. Mas a tecnologia utilizada para construir estas aplicações não é a única coisa que pode ser regulamentada.

Autor original: Will Henshall