google gemini はなぜ開発者の間でこれほど不人気なのでしょうか?複雑な操作を実行する能力は十分ではありません

2024-09-18

tencent technology news 海外メディアの報道によると、googleは大規模な言語モデルに巨額の投資を行っているが、geminiは依然として複雑な運用と開発者が競合製品を選択する傾向という二重の課題に直面しており、これらの問題は同社のクラウドサービスと人工知能ビジネスに影響を与える可能性がある。 . 成長には代償が伴います。 gemini はリリース以来ある程度の進歩を遂げてきましたが、信頼性と市場シェアの点では、openai などの競合他社と比較してまだ大きな差があります。

一部の開発者やグーグル従業員は、グーグルの会話型人工知能「ジェミニ」は競合技術と比べて複雑すぎて使いにくいと不満を抱いている。 gemini について苦情を言った開発者の中には、スタートアップ topology の創設者である aidan mclaughlin も含まれていました。同社は、既存の人工知能モデルの推論能力を向上させるソフトウェアを開発しています。

初めて openai の api を使用しようとしたときは、わずか 30 秒しかかかりませんでしたが、gemini では 4 時間かかりました。これは、google が彼にクラウドアカウントのセットアップと多くの構成を要求したためだと彼は言いました。さらに、google のシステムの脆弱性により、後戻りを余儀なくされることもありました。マクラフリン氏は、「googleが提供するモデルが機能の点でopenaiやanthropicが提供するモデルを大幅に上回るのであれば、私はこれらすべての困難を喜んで克服するつもりだ。世界で最も重要なことはモデルの品質だが、例外はある」と語った。特殊な状況により、google のモデルは 3 位にランクされるようです。」

googleはgeminiを利用してサーバーレンタルビジネスにより多くの顧客を引きつけたいと考えているため、geminiを使用する際に開発者が直面する困難はgoogleのクラウドビジネスに影響を与える可能性がある。さらに、一部の google 従業員は、これが google 独自の人工知能の開発にも潜在的な問題を引き起こす可能性があると述べています。何百万人もの有料ユーザーを引き付けて人工知能モデルを購入したり、chatgpt を使用したりすることで、openai は人工知能のパフォーマンスに関する暗黙的および明示的なフィードバックを大量に取得し、モデルをさらに改善できるようになります。 googleのgeminiが同じレベルの使用率を得られない場合、同社は同じ改善のためにより曖昧なロードマップを使用する可能性がある。

gemini は、会話型回答検索や音声アシスタントを必要とする google の消費者向け製品や広告製品の開発にも重要です。「開発者が現実世界の複雑な問題を解決するために gemini を使用することは、次世代の gemini への重要なフィードバックです」と abacus ai の ceo、bindu reddy 氏は述べています。同社のソフトウェアは、開発者が人工知能アプリケーションを構築するのに役立ちます。「フィードバックが多ければ多いほど良いのです」と彼女は言いました。

gemini は今年大幅に改良されましたが、人工知能の商用アプリケーションを強化するという点では、競合モデルほど信頼性が高くありません。 googleの広報担当者は、geminiモデルを改善するには開発者のフィードバックが重要だが、それだけがデータ源ではないと述べた。 ai 研究者の中には、ai にさまざまな分野の人間の専門家から学ぶように教えることで、大幅な改善が可能であると言う人もいます。

小規模の開発者や大企業は、openai の gpt-4 のような大規模な言語モデルを採用して、顧客サービスやデータ分析から不正行為の検出やコンピューターコードの生成まで、あらゆるものを自動化できるアプリケーションを開発しています。 openai と microsoft は、開発者に大規模な言語モデルサービスを提供することで、それぞれ月に約 1 億ドルを稼いでいます。これらの開発者には、ジェーンストリートなどの定量的取引会社、モルガンスタンレーなどの銀行、ストライプなどの金融テクノロジー企業が含まれます。

googleはまた、メルセデス・ベンツ、ゴールドマン・サックス、ウーバーなど、ジェミニの顧客を数社挙げている。両社は声明の中で、顧客サービスからコーディング支援まであらゆるものに人工知能を活用していると述べたが、買収額は不明だった（googleは以前、北米でaiクラウドサービスを立ち上げ、今年の収益は10億ドルとするという目標を設定していた） , しかし、大きな言語モデルだけでなく、より多くの ai サービスを販売しています。

googleの親会社であるalphabetのceo、sundar pichai氏は、7月の同社の第2四半期決算会見で、年初以来200万人以上の開発者がgeminiを使用していると述べたが、現時点ではこのモデルを試しただけの開発者が含まれているかどうかは不明である。一度か二度。

openai のモデルと比較して、開発者の間で gemini の不人気は業界では公然の秘密のようです。それでも、google の gemini は進歩を続けており、同社は ai 分野での競争力を維持するために、パフォーマンスと信頼性を向上させるための措置を積極的に講じています。

競争上の優位性

たとえば、エンタープライズソフトウェアのスタートアップである retool が 750 人以上の技術系従業員を対象に実施した 6 月の調査では、回答者のわずか 2.6% が ai アプリケーションの構築に gemini を最も頻繁に使用していると回答し、76% が ai アプリケーションの構築に最も頻繁に gemini を使用していると回答しました。 openaiを使っているとのこと。ジェミニは得票率2.3%を獲得したanthropicのクロードを僅差で上回った。しかし、retool の 2023 年 11 月のレポート以来、claude の使用量が 4 倍以上に増加していることは注目に値します。 gemini は、昨年 12 月まで開発者が利用できませんでした。

ウェブサイトのトラフィックを追跡するsimilarwebによると、6月から8月にかけてopenaiのアプリ開発者ページには8,280万回の訪問があったのに対し、googleのページは同じ期間に840万回しか閲覧されなかったという。小規模な調査でも同様の証拠が得られています。先月下旬、finetune の創設者ジュリアン・サックス氏は、サンフランシスコの共有ワークスペースで 50 人の ai スタートアップ開発者に、最も一般的に使用している会話型 ai モデルを尋ねました。ほぼ全員が anthropic または openai のモデルを主に使用していると述べており、gemini を主に使用している人はいませんでした。サックス氏はこの結果に驚かなかった。「コーディングに関しては、gemini が他のモデルに比べて際立っているように感じません」と彼は言いました。

googleが2023年初めにリリースしたopenaiのgpt-4と競合できるモデルを立ち上げるまでに、1年近くと大規模な組織再編を要した。 google は 2023 年 12 月に開発者に gemini モデルへのアクセスを提供し始める予定で、そのパフォーマンスは一般的な比較評価で openai のモデルと同様です。

しかし一部のgoogle従業員は、openaiの最初の動きによって開発者の間でブランド認知が得られたと述べている。もう 1 つの若い ai スタートアップである anthropic は、開発者が特にコーディング支援において openai の代替手段として名を上げたため、今年口コミマーケティングの急増を享受しました。

開発者の悩み

双子座はあまり注目を集めていないようです。調査対象の開発者は、gemini モデルは他のモデルよりも一度に多くの情報を処理できるため、長いドキュメントやコードベースを分析する場合に便利であると述べています。しかし彼らはまた、googleが競合他社に比べて使用方法のオプションがわかりにくく、手順が多いこと、開発者システムがopenaiとは異なるため、これらのモデルの使用がより困難になっているとも指摘した。

場合によっては、gemini を使用するために google が提供するさまざまなオプションが、google 自身の検索結果で互いに競合することもあります。この春からしばらくの間、vertex ai studio (gemini を使用したいと考えている大企業向けに google が宣伝しているサービス) は、開発者が gemini を使用できるようにするシンプルなツールである google ai studio のスポンサーとなりました。

opensea の元最高技術責任者である alex atallah 氏は、「人々は選択肢を理解しようとすると混乱してしまいます」と述べています。彼は、大規模な言語モデルを扱う開発者向けのソフトウェアを作成するスタートアップ openrouter で gemini を使用しようとしたときにも、同様の困難に遭遇しました。

google は開発者が gemini を使いやすくするために 12 月に ai studio サービスを開始しましたが、同様の形式を共有する gpt や claude とは異なるクエリ送信方法を使用する必要があります。マクラフリン氏は、この違いにより、開発者にとって gemini に切り替える魅力が薄れると述べた。

双子座はソーシャルメディア、特にソーシャルメディアプラットフォームxでよく批判されています。セキュリティスタートアップ xbow の ai 研究者である brendan dolan-gavitt 氏は、google の ai アプリ開発アプリの 1 つである vertex を通じた旅について今月初めに x に投稿しました。gemini を使用するために必要な多くの手順に関する投稿は、幅広い注目を集めました。他の開発者も苦情の仲間入りをし、google geminiに対する不満を表明している。

安定した市場シェア

googleは、geminiに対する批判に応えるためにxを含めて、そのイメージを変えようとしている。 gemini を宣伝する開発者向けのイベントも開催します。 googleは、geminiを搭載した最高のアプリケーションを構築するための開発者コンテストを開催するなど、他のインセンティブも実験しており、最初の勝者にはナンバープレート番号「g3m1n1」のカスタマイズされたdeloreanブランドの電気自動車が贈られる。計画によれば、googleは今年末に最終的な受賞結果を発表する予定だ。

google で製品開発に携わる logan kilpatrick 氏は、google が開発者の混乱を軽減するために、一部の重複するアプリ構築製品の機能を統合することも検討していることを明らかにしました。「openai は、大規模な言語モデル api のコンテキストにおいて、google よりも少し長く、役に立つものを開発者に提供します」と同氏は 4 月に ai studio のプロダクトリードとして google に入社し、以前は openai の開発担当者として働いていました。関係。「私たちは、開発者の間で彼らが現在持っている堅実な市場シェアと戦わなければなりません。」

今週、openai は、一部の技術的または複雑なタスクにおいて大規模な言語モデルよりも優れたパフォーマンスを発揮する推論モデルである o1-preview を発表しました。これにより、googleに対して同様の技術をリリースするよう圧力がかかる可能性があり、あるいは開発者の世論でさらに立場を失うリスクが生じる可能性がある。

「白い手袋」サービス

google は、openai のテクノロジーに追いつき、あるいはそれを超えることを期待して、人工知能分野の競争で長期にわたる勝利を収めることを目指して、gemini のバージョン 2.0 の開発を積極的に行っています。それでも、gemini は、特に処理できる情報量が他のモデルよりも優れているため、一部のファンを獲得しています。 starcycle の創設者 jaclyn siu 氏は、彼女の会社では、主にドキュメントからデータを抽出するために、google の開発者向けの最先端の大規模言語モデルである gemini 1.5 pro を使用していると述べました。トムソン・ロイターはまた、長い法的文書を比較して矛盾を特定できる法的ツールを支援するために gemini を使用しています。

大企業にとって、google ai の使用の難しさは大きな障害ではありません。 wayfair の最高技術責任者である fiona tan 氏は、同社が gemini を使用して従来のデータベースをよりユーザーフレンドリーな形式に変換するのを支援している google 従業員によって提供される「ホワイトグローブ」サービスを同社が利用していることを明らかにしました。いわゆる「ホワイトグローブ」サービスは、通常、細心の注意と細心の注意を必要とする、非常に行き届いたサービスを指します。

ただし、既存のソリューションが十分に効果的であるため、gemini を試す予定がない開発者もいます。 dots というアプリを開発している martyn strydom 氏は、顧客には go を使ってさまざまな言語モデルを継続的にテストする時間がないため、彼の会社ではコーディングアシスタントとして claude を使用し、顧客に対応するために openai の古い gpt モデルを使用することを好んでいると述べました。

同氏は、「現在、ほぼ全員が openai、claude、または cursor を使用しています。世界のトップエンジニアがこれらのツールを使用しているのであれば、なぜ他のツールを試す必要があるでしょうか。cursor は、openai と anthropic smart モデルを活用した人工知能ツールです。」と述べました。コードアシスタント。（構成／ウージ）

ニュース

google gemini はなぜ開発者の間でこれほど不人気なのでしょうか?複雑な操作を実行する能力は十分ではありません

導入

私の連絡先情報