por que o google gemini é tão impopular entre os desenvolvedores? a capacidade de realizar operações complexas não é excelente o suficiente

por que o google gemini é tão impopular entre os desenvolvedores? a capacidade de realizar operações complexas não é suficientemente notável

2024-09-18

tencent technology news de acordo com relatos da mídia estrangeira, o google fez grandes investimentos em grandes modelos de linguagem, mas a gemini ainda enfrenta o duplo desafio de operações complexas e a tendência dos desenvolvedores de escolher produtos rivais. esses problemas podem afetar seus serviços em nuvem e negócios de inteligência artificial. . o crescimento cobra seu preço. gemini fez alguns progressos desde o seu lançamento, mas ainda existe uma lacuna significativa em comparação com concorrentes como a openai em termos de fiabilidade e quota de mercado.

alguns desenvolvedores e funcionários do google reclamaram que a inteligência artificial conversacional gemini do google é muito complexa para ser usada em comparação com tecnologias concorrentes. entre os desenvolvedores que reclamaram do gemini estava aidan mclaughlin, fundador da startup topology. a empresa desenvolve software para melhorar as capacidades de raciocínio dos modelos de inteligência artificial existentes.

ele disse que a primeira vez que tentou usar a api openai demorou apenas 30 segundos, mas demorou quatro horas com o gemini porque o google exigiu que ele criasse uma conta na nuvem e fizesse muitas configurações. além disso, vulnerabilidades nos sistemas do google às vezes o forçavam a voltar atrás. mclaughlin disse: “se o modelo fornecido pelo google superar significativamente os modelos fornecidos pela openai e anthropic em termos de capacidades, estou disposto a superar todas essas dificuldades. algumas circunstâncias especiais, o modelo do google parece estar em terceiro lugar.”

as dificuldades que os desenvolvedores enfrentam ao usar o gemini podem ter um impacto nos negócios de nuvem do google, já que o google espera usar o gemini para atrair mais clientes para o seu negócio de aluguel de servidores. além disso, alguns funcionários do google disseram que isso também pode causar problemas potenciais para o desenvolvimento da própria inteligência artificial do google. ao atrair milhões de usuários pagantes para comprar seus modelos de inteligência artificial ou usar chatgpt, a openai obtém uma grande quantidade de feedback implícito e explícito sobre o desempenho de sua inteligência artificial, permitindo-lhe melhorar ainda mais seus modelos. se o gemini do google não obtiver o mesmo nível de uso, a empresa poderá usar um roteiro mais vago para as mesmas melhorias.

a gemini também é importante para o desenvolvimento dos produtos de consumo e de publicidade do google, que exigem busca de respostas por conversação e assistentes de voz. “ter desenvolvedores usando o gemini para resolver problemas complexos do mundo real é um feedback crítico para a próxima geração do gemini”, disse bindu reddy, ceo da abacus ai. o software da empresa ajuda os desenvolvedores a construir aplicativos de inteligência artificial. “quanto mais feedback você tiver, melhor”, disse ela.

embora o gemini tenha melhorado bastante este ano, ainda não é tão confiável quanto os modelos concorrentes quando se trata de alimentar aplicações comerciais de inteligência artificial. um porta-voz do google disse que o feedback dos desenvolvedores é importante para melhorar o modelo gemini, mas não é a única fonte de dados. alguns investigadores de ia também afirmam que é possível alcançar grandes melhorias ensinando a ia a aprender com especialistas humanos em vários campos.

pequenos desenvolvedores e grandes empresas adotam grandes modelos de linguagem como o gpt-4 da openai para desenvolver aplicativos que podem automatizar tudo, desde atendimento ao cliente e análise de dados até detecção de fraudes e geração de código de computador. openai e microsoft ganham cada uma cerca de us$ 100 milhões por mês fornecendo grandes serviços de modelos de linguagem para desenvolvedores. esses desenvolvedores incluem empresas de comércio quantitativo como jane street, bancos como morgan stanley e empresas de tecnologia financeira como stripe.

o google também lista vários clientes gemini, incluindo mercedes-benz, goldman sachs e uber. as empresas disseram em comunicados que usam inteligência artificial para impulsionar tudo, desde atendimento ao cliente até assistência de codificação, embora a extensão de suas compras seja desconhecida (o google estabeleceu anteriormente uma meta de lançar um serviço de nuvem de ia na américa do norte este ano, com receita de us$ 1 bilhão , mas vende mais serviços de ia do que apenas grandes modelos de linguagem.

sundar pichai, ceo da alphabet, controladora do google, disse durante a teleconferência de resultados do segundo trimestre da empresa em julho que mais de 2 milhões de desenvolvedores usaram o gemini desde o início do ano, mas atualmente não está claro se isso inclui desenvolvedores que apenas experimentaram o modelo uma ou duas vezes.

em relação aos modelos da openai, a impopularidade do gemini entre os desenvolvedores parece ser um segredo aberto na indústria. ainda assim, o gemini do google continua a fazer progressos, e a empresa está a tomar medidas activas para melhorar o seu desempenho e fiabilidade num esforço para se manter competitiva no espaço da ia.

vantagem competitiva

por exemplo, uma pesquisa de junho com mais de 750 trabalhadores de tecnologia realizada pela startup de software empresarial retool descobriu que apenas 2,6% dos entrevistados disseram que usam o gemini com mais frequência para construir aplicativos de ia, enquanto 76% disseram que usam o gemini com mais frequência para construir aplicativos de ia. disseram que usam openai. gemini superou por pouco claude da anthropic, que recebeu 2,3% dos votos. mas é importante notar que o uso de claude mais do que quadruplicou desde o relatório de novembro de 2023 da retool. gemini não estava disponível para desenvolvedores até dezembro do ano passado.

a similarweb, que rastreia o tráfego do site, disse que a página do desenvolvedor de aplicativos da openai recebeu 82,8 milhões de visitas de junho a agosto, enquanto a página do google teve apenas 8,4 milhões de visualizações durante o mesmo período. pesquisas menores forneceram evidências semelhantes. no final do mês passado, o fundador da finetune, julian saks, perguntou a 50 desenvolvedores de startups de ia em seu espaço de trabalho compartilhado em são francisco quais modelos de ia conversacional eles usam com mais frequência. quase todos disseram que usaram principalmente modelos da anthropic ou openai, e nenhum usou principalmente o gemini. sacks não ficou surpreso com os resultados. “sinto que o gemini não se destaca em comparação com outros modelos quando se trata de codificação”, disse ele.

o google levou quase um ano e uma grande reorganização para lançar um modelo que pudesse competir com o lançamento gpt-4 da openai no início de 2023. o google começará a dar aos desenvolvedores acesso aos modelos gemini em dezembro de 2023, e seu desempenho é semelhante ao dos modelos openai em avaliações comparativas populares.

mas alguns funcionários do google dizem que o primeiro movimento da openai conquistou o reconhecimento da marca entre os desenvolvedores. a anthropic, outra jovem startup de ia, teve um aumento no marketing boca a boca este ano, à medida que os desenvolvedores se tornaram conhecidos como uma alternativa ao openai, especialmente para assistência de codificação.

problemas do desenvolvedor

gêmeos não parece atrair muita atenção. os desenvolvedores entrevistados disseram que os modelos gemini são úteis na análise de documentos longos ou bases de código porque podem processar mais informações de uma vez do que outros modelos. mas eles também apontaram que o google oferece opções de uso confusas e inúmeras etapas em comparação com os concorrentes, e que seu sistema de desenvolvedor difere do openai, tornando mais difícil o uso desses modelos.

às vezes, as diferentes opções que o google oferece para usar o gemini até competem entre si nos próprios resultados de pesquisa do google. por um tempo, nesta primavera, o vertex ai studio – um serviço que o google promove para grandes empresas que desejam usar o gemini – tornou-se um resultado patrocinado do google ai studio, uma ferramenta mais simples que permite aos desenvolvedores usar o gemini.

“as pessoas ficam confusas quando tentam descobrir as opções”, disse alex atallah, ex-diretor de tecnologia da opensea. ele encontrou dificuldades semelhantes ao tentar usar o gemini em sua startup openrouter, que fabrica software para desenvolvedores que trabalham com grandes modelos de linguagem.

embora o google tenha lançado seu serviço ai studio em dezembro para facilitar o uso do gemini pelos desenvolvedores, eles devem usar um método de envio de consultas diferente do gpt e claude, que compartilham um formato semelhante. mclaughlin disse que essa diferença torna menos atraente para os desenvolvedores mudarem para o gemini.

gêmeos é frequentemente criticado nas redes sociais – especialmente na plataforma de mídia social x. brendan dolan-gavitt, pesquisador de ia da startup de segurança xbow, postou no x no início deste mês sobre sua jornada pelo vertex, outro aplicativo de desenvolvimento de aplicativos de ia do google. postagens sobre as muitas etapas necessárias para usar o gemini atraíram ampla atenção. outros desenvolvedores também se juntaram às reclamações e expressaram insatisfação com o google gemini.

participação de mercado estável

o google está tentando mudar essa imagem, inclusive no x para responder às críticas do gemini. também realiza eventos para desenvolvedores promoverem o gemini. o google também está experimentando outros incentivos, como a realização de uma competição de desenvolvedores para construir o melhor aplicativo com tecnologia gemini. o primeiro vencedor receberá um veículo elétrico personalizado da marca delorean com a placa “g3m1n1”. de acordo com o plano, o google anunciará os resultados finais da premiação no final deste ano.

logan kilpatrick, que trabalha no desenvolvimento de produtos no google, revelou que o google também está considerando fundir recursos de alguns produtos de construção de aplicativos sobrepostos para reduzir a confusão entre os desenvolvedores. “o openai fornece aos desenvolvedores algo útil por um pouco mais de tempo, um pouco mais do que o google, no contexto de uma api de modelo de linguagem grande”, disse ele. ele ingressou no google em abril como líder de produto do ai studio e anteriormente trabalhou na openai como responsável pelo desenvolvedor. relações. “temos que lutar contra a sólida participação de mercado que eles têm atualmente entre os desenvolvedores”.

esta semana, a openai lançou o1-preview, um modelo de inferência que supera grandes modelos de linguagem em algumas tarefas técnicas ou complexas. isso poderia pressionar o google para lançar tecnologia semelhante ou correr o risco de perder mais terreno na opinião pública dos desenvolvedores.

serviço "luva branca"

o google está desenvolvendo ativamente a versão 2.0 do gemini, com o objetivo de alcançar uma vitória prolongada na competição no campo da inteligência artificial, na esperança de alcançar ou até mesmo superar a tecnologia da openai. ainda assim, o gemini conquistou alguns fãs, principalmente por superar outros modelos na quantidade de informações que consegue lidar. a fundadora da starcycle, jaclyn siu, disse que sua empresa está usando o gemini 1.5 pro, o modelo de linguagem grande mais avançado do google para desenvolvedores, principalmente para extrair dados de documentos. a thomson reuters também está usando o gemini para auxiliar com ferramentas jurídicas que podem comparar documentos jurídicos longos e identificar inconsistências.

para empresas maiores, a dificuldade de usar a ia do google não é um grande obstáculo. fiona tan, diretora de tecnologia da wayfair, revelou que a empresa desfruta de serviços “luvas brancas” fornecidos pelos funcionários do google, que estão ajudando a empresa a usar o gemini para converter bancos de dados tradicionais em um formato mais fácil de usar. o chamado serviço “luva branca” costuma se referir ao tipo de atendimento muito atencioso e que exige muita atenção e cuidado aos detalhes.

no entanto, alguns desenvolvedores não estão planejando experimentar o gemini porque as soluções existentes são suficientemente eficazes. martyn strydom, que está desenvolvendo um aplicativo chamado dots, observou que sua empresa prefere usar claude como assistente de codificação e o modelo gpt mais antigo da openai para responder aos clientes porque eles não têm tempo e testam continuamente diferentes modelos de linguagem.

ele disse: "atualmente, quase todo mundo está usando openai, claude ou cursor. se os principais engenheiros do mundo estão usando essas ferramentas, por que deveríamos tentar outras?" assistente de código. (compilado/wuji)

notícias

por que o google gemini é tão impopular entre os desenvolvedores? a capacidade de realizar operações complexas não é suficientemente notável

introdução

minhas informações de contato