pourquoi google gemini est-il si impopulaire auprès des développeurs ? la capacité à effectuer des opérations complexes n’est pas assez exceptionnelle

2024-09-18

tencent technology news selon les médias étrangers, google a réalisé d'énormes investissements dans de grands modèles de langage, mais gemini est toujours confronté au double défi des opérations complexes et de la tendance des développeurs à choisir des produits concurrents. ces problèmes peuvent affecter ses services cloud et ses activités d'intelligence artificielle. la croissance a des conséquences néfastes. gemini a fait quelques progrès depuis sa sortie, mais il existe encore un écart important par rapport à des concurrents comme openai en termes de fiabilité et de part de marché.

certains développeurs et employés de google se sont plaints du fait que l'ia conversationnelle gemini de google est trop complexe à utiliser par rapport aux technologies concurrentes. parmi les développeurs qui se sont plaints de gemini figurait aidan mclaughlin, le fondateur de la startup topology. la société développe des logiciels pour améliorer les capacités de raisonnement des modèles d'intelligence artificielle existants.

il a déclaré que la première fois qu'il avait essayé d'utiliser l'api d'openai, cela n'avait pris que 30 secondes, mais que cela avait pris quatre heures avec gemini, car google lui avait demandé de créer un compte cloud et d'effectuer de nombreuses configurations. de plus, des vulnérabilités dans les systèmes de google l'ont parfois contraint à faire marche arrière. mclaughlin a déclaré : « si le modèle fourni par google surpasse largement les modèles fournis par openai et anthropic en termes de capacités, je suis prêt à surmonter toutes ces difficultés. la chose la plus importante au monde est la qualité du modèle, mais à part dans certaines circonstances particulières, le modèle de google semble être classé troisième.

les difficultés rencontrées par les développeurs lors de l'utilisation de gemini pourraient avoir un impact sur l'activité cloud de google, car google espère utiliser gemini pour attirer davantage de clients vers son activité de location de serveurs. en outre, certains employés de google ont déclaré que cela pourrait également entraîner des problèmes potentiels pour le développement de la propre intelligence artificielle de google. en incitant des millions d'utilisateurs payants à acheter ses modèles d'intelligence artificielle ou à utiliser chatgpt, openai obtient une grande quantité de retours implicites et explicites sur les performances de son intelligence artificielle, lui permettant d'améliorer encore ses modèles. si gemini de google n'obtient pas le même niveau d'utilisation, l'entreprise pourrait utiliser une feuille de route plus vague pour les mêmes améliorations.

gemini est également important pour le développement des produits grand public et publicitaires de google, qui nécessitent une recherche de réponses conversationnelle et des assistants vocaux. "le fait que les développeurs utilisent gemini pour résoudre des problèmes complexes du monde réel constitue un retour essentiel pour la prochaine génération de gemini", a déclaré bindu reddy, pdg d'abacus ai. les logiciels de la société aident les développeurs à créer des applications d'intelligence artificielle. "plus vous avez de retours, mieux c'est", a-t-elle déclaré.

bien que le gemini ait été considérablement amélioré cette année, il n’est toujours pas aussi fiable que les modèles concurrents lorsqu’il s’agit d’alimenter des applications commerciales d’intelligence artificielle. un porte-parole de google a déclaré que les commentaires des développeurs sont importants pour améliorer le modèle gemini, mais qu'ils ne constituent pas la seule source de données. certains chercheurs en ia affirment également qu’il est possible d’obtenir des améliorations majeures en apprenant à l’ia à apprendre des experts humains dans divers domaines.

les petits développeurs et les grandes entreprises adoptent de grands modèles de langage comme gpt-4 d'openai pour développer des applications capables de tout automatiser, du service client et de l'analyse des données à la détection des fraudes et à la génération de code informatique. openai et microsoft gagnent chacun environ 100 millions de dollars par mois en fournissant de grands services de modèles de langage aux développeurs. ces développeurs incluent des sociétés de trading quantitatif comme jane street, des banques comme morgan stanley et des sociétés de technologie financière comme stripe.

google répertorie également plusieurs clients gemini, dont mercedes-benz, goldman sachs et uber. les entreprises ont déclaré dans des déclarations qu'elles utilisaient l'intelligence artificielle pour tout faire fonctionner, du service client à l'assistance au codage, bien que l'ampleur de leurs achats soit inconnue (google s'était précédemment fixé comme objectif de lancer un service cloud d'ia en amérique du nord cette année, avec un chiffre d'affaires d'un milliard de dollars). , mais il vend plus de services d'ia que de simples grands modèles de langage.

sundar pichai, pdg d'alphabet, société mère de google, a déclaré lors de la conférence téléphonique sur les résultats du deuxième trimestre de la société en juillet que plus de 2 millions de développeurs ont utilisé gemini depuis le début de l'année, mais il n'est pas clair actuellement si cela inclut les développeurs qui ont seulement essayé le modèle. une ou deux fois.

par rapport aux modèles d'openai, l'impopularité de gemini parmi les développeurs semble être un secret de polichinelle dans l'industrie. néanmoins, gemini de google continue de progresser et la société prend activement des mesures pour améliorer ses performances et sa fiabilité afin de rester compétitive dans le domaine de l'ia.

avantage concurrentiel

par exemple, une enquête réalisée en juin auprès de plus de 750 techniciens par la startup de logiciels d'entreprise retool a révélé que seulement 2,6 % des personnes interrogées ont déclaré qu'elles utilisaient le plus fréquemment gemini pour créer des applications d'ia, tandis que 76 % ont déclaré qu'elles utilisaient le plus fréquemment gemini pour créer des applications d'ia. ont déclaré qu'ils utilisaient openai. gemini a devancé de peu claude d'anthropic, qui a obtenu 2,3 % des voix. mais il convient de noter que l’utilisation de claude a plus que quadruplé depuis le rapport de retool de novembre 2023. gemini n'était disponible pour les développeurs qu'en décembre de l'année dernière.

similarweb, qui suit le trafic du site web, a déclaré que la page des développeurs d'applications d'openai avait reçu 82,8 millions de visites de juin à août, tandis que la page de google n'avait que 8,4 millions de vues au cours de la même période. des enquêtes plus petites ont fourni des preuves similaires. à la fin du mois dernier, le fondateur de finetune, julian saks, a demandé à 50 développeurs de startups d'ia dans son espace de travail partagé à san francisco quels modèles d'ia conversationnelle ils utilisent le plus couramment. presque tous ont déclaré utiliser principalement des modèles d’anthropic ou d’openai, et aucun n’utilisait principalement gemini. sacks n'a pas été surpris par les résultats. "j'ai l'impression que gemini ne se démarque pas des autres modèles en matière de codage", a-t-il déclaré.

il a fallu à google près d'un an et une réorganisation majeure pour lancer un modèle capable de concurrencer la version gpt-4 d'openai début 2023. google commencera à donner aux développeurs l'accès aux modèles gemini en décembre 2023, et leurs performances sont similaires à celles des modèles openai dans les évaluations comparatives populaires.

mais certains employés de google affirment que la première initiative d'openai lui a valu une reconnaissance de marque parmi les développeurs. anthropic, une autre jeune startup d'ia, a connu un essor du marketing de bouche à oreille cette année, les développeurs se faisant un nom comme alternative à openai, notamment pour l'aide au codage.

problèmes du développeur

les gémeaux ne semblent pas attirer beaucoup d'attention. les développeurs interrogés ont déclaré que les modèles gemini sont utiles lors de l'analyse de documents longs ou de bases de code, car ils peuvent traiter plus d'informations à la fois que les autres modèles. mais ils ont également souligné que google propose des options d'utilisation déroutantes et de nombreuses étapes par rapport à ses concurrents, et que son système de développement diffère d'openai, ce qui rend plus difficile l'utilisation de ces modèles.

parfois, les différentes options proposées par google pour utiliser gemini se font même concurrence dans les propres résultats de recherche de google. ce printemps, vertex ai studio, un service que google promeut auprès des grandes entreprises susceptibles de vouloir utiliser gemini, est devenu pendant un certain temps un résultat sponsorisé de google ai studio, un outil plus simple qui permet aux développeurs d'utiliser gemini.

"les gens sont confus lorsqu'ils essaient de comprendre les options", a déclaré alex atallah, ancien directeur de la technologie d'opensea. il a rencontré des difficultés similaires en essayant d'utiliser gemini pour sa startup openrouter, qui crée des logiciels destinés aux développeurs travaillant avec de grands modèles de langage.

bien que google ait lancé son service ai studio en décembre pour faciliter l'utilisation de gemini par les développeurs, ils doivent utiliser une méthode d'envoi de requêtes différente de celle de gpt et claude, qui partagent un format similaire. mclaughlin a déclaré que cette différence rend moins attrayant pour les développeurs de passer à gemini.

les gémeaux sont souvent critiqués sur les réseaux sociaux, en particulier sur la plateforme de réseaux sociaux x. brendan dolan-gavitt, chercheur en ia chez xbow, une start-up de sécurité, a publié sur x plus tôt ce mois-ci son parcours à travers vertex, une autre des applications de développement d'applications d'ia de google. les articles sur les nombreuses étapes nécessaires à l'utilisation de gemini ont attiré une large attention. d'autres développeurs ont également rejoint les rangs des plaintes et ont exprimé leur mécontentement à l'égard de google gemini.

part de marché stable

google tente de changer cette image, notamment sur le x pour répondre aux critiques de gemini. il organise également des événements pour les développeurs afin de promouvoir gemini. google expérimente également d'autres incitations, comme l'organisation d'un concours de développeurs pour créer la meilleure application propulsée par gemini. le premier gagnant recevra un véhicule électrique personnalisé de marque delorean portant le numéro de plaque d'immatriculation « g3m1n1 ». selon le plan, google annoncera les résultats finaux du prix à la fin de cette année.

logan kilpatrick, qui travaille dans le développement de produits chez google, a révélé que google envisageait également de fusionner les fonctionnalités de certains produits de création d'applications qui se chevauchent afin de réduire la confusion parmi les développeurs. "openai fournit aux développeurs quelque chose d'utile pendant un peu plus longtemps, un peu plus longtemps que google, dans le contexte d'une api de modèle de langage à grande échelle", a-t-il déclaré. il a rejoint google en avril en tant que chef de produit pour ai studio et a auparavant travaillé chez openai en tant que responsable des développeurs. rapports. "nous devons lutter contre la solide part de marché qu'ils détiennent actuellement parmi les développeurs."

cette semaine, openai a lancé o1-preview, un modèle d'inférence qui surpasse les grands modèles de langage sur certaines tâches techniques ou complexes. cela pourrait faire pression sur google pour qu'il publie une technologie similaire ou risquer de perdre encore plus de terrain dans l'opinion publique des développeurs.

prestation « gant blanc »

google développe activement la version 2.0 de gemini, dans le but de remporter une victoire prolongée dans la concurrence dans le domaine de l'intelligence artificielle, dans l'espoir de rattraper voire surpasser la technologie openai. néanmoins, gemini a conquis certains fans, notamment parce qu’il surpasse les autres modèles en termes de quantité d’informations qu’il peut gérer. la fondatrice de starcycle, jaclyn siu, a déclaré que son entreprise utilisait gemini 1.5 pro, le modèle de langage étendu le plus avancé de google pour les développeurs, principalement pour extraire des données de documents. thomson reuters utilise également gemini pour l'aider avec des outils juridiques capables de comparer de longs documents juridiques et d'identifier les incohérences.

pour les grandes entreprises, la difficulté d’utiliser l’ia de google ne constitue pas un obstacle majeur. fiona tan, directrice de la technologie chez wayfair, a révélé que l'entreprise bénéficie des services "gants blancs" fournis par les employés de google, qui aident l'entreprise à utiliser gemini pour convertir les bases de données traditionnelles dans un format plus convivial. le service dit « gants blancs » fait généralement référence au type de service très attentif qui nécessite une grande attention et un grand soin aux détails.

cependant, certains développeurs n’envisagent pas d’essayer gemini car leurs solutions existantes sont suffisamment efficaces. martyn strydom, qui développe une application appelée dots, a noté que son entreprise préfère utiliser claude comme assistant de codage et l'ancien modèle gpt d'openai pour répondre aux clients, car ils n'ont pas le temps de tester en permanence différents modèles de langage.

il a déclaré : « actuellement, presque tout le monde utilise openai, claude ou cursor. si les meilleurs ingénieurs du monde utilisent ces outils, pourquoi devrions-nous en essayer d'autres ? » cursor est un outil d'intelligence artificielle alimenté par les modèles openai et anthropic smart. assistant de code. (compilé/wuji)

nouvelles

pourquoi google gemini est-il si impopulaire auprès des développeurs ? la capacité à effectuer des opérations complexes n’est pas assez exceptionnelle

introduction

mes coordonnées