warum ist google gemini bei entwicklern so unbeliebt? die fähigkeit, komplexe operationen durchzuführen, ist nicht herausragend genug

2024-09-18

tencent technology news laut ausländischen medienberichten hat google enorme investitionen in große sprachmodelle getätigt, gemini steht jedoch immer noch vor der doppelten herausforderung komplexer abläufe und der tendenz der entwickler, sich für konkurrenzprodukte zu entscheiden. diese probleme können sich auf sein cloud-dienste- und künstliche-intelligenz-geschäft auswirken . das wachstum fordert seinen tribut. gemini hat seit seiner veröffentlichung einige fortschritte gemacht, aber im hinblick auf zuverlässigkeit und marktanteil besteht immer noch ein erheblicher rückstand im vergleich zu konkurrenten wie openai.

einige entwickler und google-mitarbeiter haben sich darüber beschwert, dass die dialogorientierte künstliche intelligenz gemini von google im vergleich zu konkurrierenden technologien zu komplex sei. zu den entwicklern, die sich über gemini beschwerten, gehörte aidan mclaughlin, der gründer des startups topology. das unternehmen entwickelt software, um die argumentationsfähigkeiten bestehender modelle der künstlichen intelligenz zu verbessern.

er sagte, dass es beim ersten versuch, die api von openai zu verwenden, nur 30 sekunden gedauert habe, bei gemini hingegen vier stunden, weil google von ihm verlangte, ein cloud-konto einzurichten und viele konfigurationen vorzunehmen. darüber hinaus zwangen ihn schwachstellen in den systemen von google manchmal, einen rückzieher zu machen. mclaughlin sagte: „wenn das von google bereitgestellte modell die von openai und anthropic bereitgestellten modelle hinsichtlich der fähigkeiten deutlich übertrifft, bin ich bereit, all diese schwierigkeiten zu überwinden. das wichtigste auf der welt ist die qualität des modells, aber außer.“ unter bestimmten umständen scheint googles modell an dritter stelle zu stehen.“

die schwierigkeiten, mit denen entwickler bei der nutzung von gemini konfrontiert sind, könnten auswirkungen auf das cloud-geschäft von google haben, da google hofft, mit gemini mehr kunden für sein server-mietgeschäft zu gewinnen. darüber hinaus sagten einige google-mitarbeiter, dass dies auch potenzielle probleme für die entwicklung von googles eigener künstlicher intelligenz mit sich bringen könnte. indem openai millionen zahlender benutzer zum kauf seiner modelle für künstliche intelligenz oder zur nutzung von chatgpt anlockt, erhält es eine große menge an implizitem und explizitem feedback zur leistung seiner künstlichen intelligenz und kann so seine modelle weiter verbessern. wenn googles gemini nicht den gleichen grad an nutzung erreicht, könnte das unternehmen eine vagere roadmap für die gleichen verbesserungen verwenden.

gemini ist auch wichtig für die entwicklung der verbraucher- und werbeprodukte von google, die eine konversationale antwortsuche und sprachassistenten erfordern. „dass entwickler gemini nutzen, um komplexe reale probleme zu lösen, ist ein entscheidendes feedback für die nächste generation von gemini“, sagte bindu reddy, ceo von abacus ai. die software des unternehmens hilft entwicklern bei der entwicklung von anwendungen für künstliche intelligenz. „je mehr feedback sie haben, desto besser“, sagte sie.

obwohl gemini in diesem jahr erheblich verbessert wurde, ist es immer noch nicht so zuverlässig wie konkurrenzmodelle, wenn es darum geht, kommerzielle anwendungen künstlicher intelligenz voranzutreiben. ein google-sprecher sagte, dass das feedback der entwickler für die verbesserung des gemini-modells wichtig sei, aber nicht die einzige datenquelle sei. einige ki-forscher sagen auch, dass es möglich ist, erhebliche verbesserungen zu erzielen, indem man der ki beibringt, von menschlichen experten in verschiedenen bereichen zu lernen.

kleine entwickler und große unternehmen übernehmen große sprachmodelle wie gpt-4 von openai, um anwendungen zu entwickeln, die alles automatisieren können, vom kundenservice und der datenanalyse bis hin zur betrugserkennung und computercodegenerierung. openai und microsoft verdienen jeweils etwa 100 millionen us-dollar pro monat, indem sie entwicklern umfangreiche sprachmodelldienste anbieten. zu diesen entwicklern gehören quantitative handelsunternehmen wie jane street, banken wie morgan stanley und finanztechnologieunternehmen wie stripe.

google listet auch mehrere gemini-kunden auf, darunter mercedes-benz, goldman sachs und uber. die unternehmen sagten in erklärungen, dass sie künstliche intelligenz nutzen, um alles vom kundenservice bis zur codierungsunterstützung voranzutreiben, obwohl der umfang ihrer käufe unbekannt ist (google hatte sich zuvor das ziel gesetzt, in diesem jahr einen ki-cloud-dienst in nordamerika einzuführen, der einen umsatz von 1 milliarde us-dollar erzielt). , aber es verkauft mehr ki-dienste als nur große sprachmodelle.

sundar pichai, ceo der google-muttergesellschaft alphabet, sagte während der telefonkonferenz zu den ergebnissen des zweiten quartals im juli, dass seit jahresbeginn mehr als 2 millionen entwickler gemini genutzt hätten, es sei aber derzeit unklar, ob darunter auch entwickler seien, die das modell nur ausprobiert hätten ein- oder zweimal.

im vergleich zu den openai-modellen scheint die unbeliebtheit von gemini bei entwicklern ein offenes geheimnis in der branche zu sein. dennoch macht googles gemini weiterhin fortschritte und das unternehmen unternimmt aktiv schritte zur verbesserung seiner leistung und zuverlässigkeit, um im ki-bereich wettbewerbsfähig zu bleiben.

wettbewerbsvorteil

beispielsweise ergab eine juni-umfrage des unternehmenssoftware-startups retool unter mehr als 750 technikern, dass nur 2,6 % der befragten angaben, gemini am häufigsten zum erstellen von ki-anwendungen zu verwenden, während 76 % angaben, gemini am häufigsten zum erstellen von ki-anwendungen zu verwenden %. sagte, sie verwenden openai. gemini setzte sich knapp gegen claude von anthropic durch, der 2,3 % der stimmen erhielt. es ist jedoch erwähnenswert, dass sich die nutzung von claude seit dem retool-bericht vom november 2023 mehr als vervierfacht hat. gemini war für entwickler erst im dezember letzten jahres verfügbar.

similarweb, das den website-verkehr verfolgt, sagte, dass die app-entwicklerseite von openai von juni bis august 82,8 millionen besuche verzeichnete, während die seite von google im gleichen zeitraum nur 8,4 millionen aufrufe verzeichnete. kleinere umfragen haben ähnliche beweise geliefert. ende letzten monats fragte finetune-gründer julian saks in seinem gemeinsamen arbeitsbereich in san francisco 50 ki-startup-entwickler, welche konversations-ki-modelle sie am häufigsten verwenden. fast alle gaben an, hauptsächlich modelle von anthropic oder openai zu verwenden, und keiner verwendete hauptsächlich gemini. sacks war von den ergebnissen nicht überrascht. „ich habe das gefühl, dass sich gemini in puncto codierung nicht von anderen modellen abhebt“, sagte er.

google brauchte fast ein jahr und eine umfassende umstrukturierung, um anfang 2023 ein modell auf den markt zu bringen, das mit der gpt-4-veröffentlichung von openai konkurrieren kann. google wird entwicklern ab dezember 2023 zugriff auf gemini-modelle gewähren, und ihre leistung ähnelt in beliebten vergleichsbewertungen den modellen von openai.

einige google-mitarbeiter sagen jedoch, dass der erste schritt von openai der marke bei entwicklern bekanntheit verschafft hat. anthropic, ein weiteres junges ki-startup, erlebte in diesem jahr einen aufschwung im mundpropaganda-marketing, da sich entwickler einen namen als alternative zu openai machten, insbesondere durch codierungsunterstützung.

probleme des entwicklers

zwillinge scheinen nicht viel aufmerksamkeit zu erregen. befragte entwickler gaben an, dass gemini-modelle bei der analyse langer dokumente oder codebasen nützlich sind, da sie mehr informationen auf einmal verarbeiten können als andere modelle. sie wiesen aber auch darauf hin, dass google im vergleich zu wettbewerbern verwirrende nutzungsmöglichkeiten und zahlreiche schritte bietet und dass sich sein entwicklersystem von openai unterscheidet, was die nutzung dieser modelle erschwert.

manchmal konkurrieren die verschiedenen möglichkeiten, die google für die nutzung von gemini bietet, in den google-eigenen suchergebnissen sogar miteinander. in diesem frühjahr wurde vertex ai studio – ein dienst, den google für große unternehmen bewirbt, die gemini nutzen möchten – ein gesponsertes ergebnis von google ai studio, einem einfacheren tool, mit dem entwickler gemini verwenden können.

„die leute sind verwirrt, wenn sie versuchen, die optionen herauszufinden“, sagte alex atallah, ehemaliger chief technology officer von opensea. er stieß auf ähnliche schwierigkeiten, als er versuchte, gemini für sein startup openrouter zu verwenden, das software für entwickler herstellt, die mit großen sprachmodellen arbeiten.

obwohl google im dezember seinen ai studio-dienst eingeführt hat, um entwicklern die verwendung von gemini zu erleichtern, müssen sie eine andere methode zum senden von abfragen verwenden als gpt und claude, die ein ähnliches format haben. mclaughlin sagte, dieser unterschied mache es für entwickler weniger attraktiv, zu gemini zu wechseln.

zwillinge werden in den sozialen medien häufig kritisiert – insbesondere auf der social-media-plattform x. brendan dolan-gavitt, ein ki-forscher beim sicherheits-startup xbow, veröffentlichte anfang des monats auf auch andere entwickler haben sich den beschwerden angeschlossen und ihre unzufriedenheit mit google gemini zum ausdruck gebracht.

stabiler marktanteil

google versucht, dieses bild zu ändern, auch auf dem x, um auf die kritiker von gemini zu reagieren. es werden auch veranstaltungen für entwickler abgehalten, um für gemini zu werben. google experimentiert auch mit anderen anreizen, beispielsweise mit der durchführung eines entwicklerwettbewerbs zur entwicklung der besten gemini-basierten anwendung. der erste gewinner erhält ein maßgeschneidertes elektrofahrzeug der marke delorean mit dem nummernschild „g3m1n1“. dem plan zufolge wird google die endgültigen auszeichnungsergebnisse ende dieses jahres bekannt geben.

logan kilpatrick, der in der produktentwicklung bei google arbeitet, gab bekannt, dass google auch darüber nachdenkt, funktionen einiger sich überschneidender app-building-produkte zusammenzuführen, um die verwirrung unter entwicklern zu verringern. „openai bietet entwicklern etwas nützliches für etwas länger, etwas länger als google, im kontext einer großen sprachmodell-api“, sagte er. er kam im april als produktleiter für ai studio zu google und war zuvor bei openai als entwickler verantwortlich beziehungen. „wir müssen gegen den soliden marktanteil kämpfen, den sie derzeit unter den entwicklern haben.“

diese woche hat openai o1-preview eingeführt, ein inferenzmodell, das große sprachmodelle bei einigen technischen oder komplexen aufgaben übertrifft. dies könnte druck auf google ausüben, eine ähnliche technologie auf den markt zu bringen, oder das risiko eingehen, in der öffentlichen meinung der entwickler weiter an boden zu verlieren.

service „weißer handschuh“.

google entwickelt aktiv die version 2.0 von gemini mit dem ziel, einen längeren sieg im wettbewerb im bereich der künstlichen intelligenz zu erringen und mit der technologie von openai gleichzuziehen oder sie sogar zu übertreffen. dennoch hat gemini einige fans überzeugt, insbesondere weil es andere modelle in der menge an informationen übertrifft, die es verarbeiten kann. starcycle-gründerin jaclyn siu sagte, ihr unternehmen verwende gemini 1.5 pro, googles modernstes großes sprachmodell für entwickler, hauptsächlich zum extrahieren von daten aus dokumenten. thomson reuters nutzt gemini auch zur unterstützung bei juristischen tools, mit denen lange rechtsdokumente verglichen und inkonsistenzen identifiziert werden können.

für größere unternehmen stellt die schwierigkeit der nutzung von google ai kein großes hindernis dar. fiona tan, chief technology officer von wayfair, gab bekannt, dass das unternehmen „white glove“-dienste von google-mitarbeitern nutzt, die das unternehmen dabei unterstützen, gemini zu nutzen, um traditionelle datenbanken in ein benutzerfreundlicheres format umzuwandeln. der sogenannte „white-glove“-service bezieht sich in der regel auf einen sehr aufmerksamen service, der große aufmerksamkeit und liebe zum detail erfordert.

einige entwickler planen jedoch nicht, gemini auszuprobieren, da ihre vorhandenen lösungen effektiv genug sind. martyn strydom, der eine app namens dots entwickelt, bemerkte, dass sein unternehmen lieber claude als codierungsassistenten und das ältere gpt-modell von openai verwendet, um auf kunden zu reagieren, weil diese keine zeit haben, verschiedene sprachmodelle kontinuierlich zu testen.

er sagte: „derzeit verwendet fast jeder openai, claude oder cursor. wenn die besten ingenieure der welt diese tools verwenden, warum sollten wir dann andere ausprobieren?“ cursor ist ein tool für künstliche intelligenz, das auf openai- und anthropic-modellen basiert code-assistent. (zusammengestellt/wuji)

nachricht

warum ist google gemini bei entwicklern so unbeliebt? die fähigkeit, komplexe operationen durchzuführen, ist nicht herausragend genug

einführung

meine kontaktdaten