ニュース

DB 向け AI が新たな競争サイクルに突入 エンタープライズ サービスの国際観察 |

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


DB 向け AI は静かにホットトラックになりつつあります。最も重要な機能の 1 つは、昨年ヒットしたベクトル データベース/ベクトル検索テクノロジーであり、大規模な AI モデルの実装でますます人気が高まっています。

AI for DBとは、データベースサービスとしてのAIに注目することを意味します。ユーザーの問題点の観点から見ると、従来のデータベース インフラストラクチャは大規模な AI モデル向けに設計されておらず、今日のベクトル検索にも対応できるように設計されていません。

たとえば、企業が大規模なモデル アプリケーションを実装する場合、必然的に、モデルをトレーニングするための高品質で高密度のデータのみがより正確な結果を得ることができます。しかし、このような大量のデータを取得して管理するには、多くの場合、ストレージ リソース、コンピューティング能力、データ処理能力など、多くのリソースが必要になります。同時に、さまざまな形式、品質、粒度、異質性を持つデータ ソースを統合すると、モデルのトレーニング プロセスも複雑になります。これが、企業が生成 AI に関して依然として慎重ながらも楽観的な理由の 1 つです。

TMTpost Media は、昨年以来、海外市場において、大手データベース/データ ウェアハウス企業、さらには大規模なモデル企業が、AI データベースの市場機会をつかむために製品のリリース、買収、協力を積極的に採用していることに気づきました。たとえば、クラウド データ ウェアハウス会社の Snowflake は、企業向けに AI モデルをカスタマイズするために NVIDIA と協力すると発表しました。Databricks は、Apache Iceberg を開発した会社である Tabular を 10 億ドルで買収しました。 5億米ドル…

しかし、現在の観点から見ると、AIとデータベースを組み合わせるというアイデアはベクトル検索だけに関係するものではありません。ここ数年、自律型データベース、データベースの自己監視と自己診断、text2SQL へのローコード + AI の導入など、すべての方向性は業界の企業顧客が引き続き模索しており、まだ結論に達していません。

しかし、業界関係者の中には、AIとデータベースの組み合わせはまだ非常に新しい技術方向であり、技術的な欠点がある可能性があると警告する人もいます。

DB 向け AI のトレンドに関係なく、最初に存在する疑問は「なぜ今なのか?」です。そして、新しい解決策とは何でしょうか?

データの適用と使用を簡素化する

オラクルを例に挙げます。

過去 2 か月の間に、Oracle は 2 つの中核データベース管理システムである Oracle Database と MySQL HeatWave データベースの AI 再構築を発表しました。データベース名の変更には明らかな方向性があります。前者は Database 23c から Database 23ai に直接変更され、後者は HeatWave GenAI にアップグレードされました。 「i」インターネット、「g」グリッド、「c」クラウド、「ai」人工知能、「GenAI」生成AIに至るまでのさまざまな時代におけるバージョンの変化は、さまざまな時代における顧客の要求の転換点に対するオラクルの鋭い洞察を反映している可能性があります。 。その中で、Database 23aiは、前述のベクトルデータベースと300以上の主要機能をアップグレードしました。

開発者は自然言語を使用して Oracle データベースと「対話」し、生成 AI の機能を呼び出し、SQL を生成して最終結果を実行し、データベースと対話するという目的を達成できます。

具体的には、23ai のベクトル検索機能により、LLM (Large Language Model) が自然言語インターフェイスを使用してプライベート ビジネス データをクエリできるようになり、LLM がより正確で関連性の高い結果を提供できるようになります。お客様は、Vector Search 機能を使用して、データを移動またはコピーすることなく、プライベート ビジネス データと組み合わせてドキュメント、画像、その他の非構造化データを安全に検索できます。これは、AI アルゴリズムの場所にデータを移行することなく、AI アルゴリズムをデータの場所に導入できることを意味し、Oracle データベースでの AI のリアルタイム実行が可能になり、効率が大幅に向上します。 AI の効率性とセキュリティ。

HeatWave GenAI には主に、データベース内 LLM、自動化されたデータベース内ベクトル ストレージ、スケーラブルなベクトル処理、および非構造化コンテンツに基づく自然言語コンテキスト ダイアログが含まれています。 HeatWave GenAI を使用すると、開発者は組み込みの埋め込みモデルを使用して、単一の SQL コマンドでエンタープライズ非構造化コンテンツ用のベクター ストアを作成できます。ユーザーは、データベース内または外部 LLM を使用して、1 ステップで自然言語検索を実行できます。データをデータベースから出す必要はなく、HeatWave の大規模なスケールと超高性能により、ユーザーは GPU をプロビジョニングする必要がありません。その結果、開発者はアプリケーションの複雑さを軽減し、パフォーマンスを向上させ、データのセキュリティを強化し、コストを削減することができます。

Oracle のアイデアが AI とデータのための統合オペレーティング プラットフォームを提供することであることは、他のデータベース製品とは大きく対照的であることを理解するのは難しくありません。

たとえば、データベース内 LLM 機能を使用すると、ユーザーは安全でない可能性がある環境にデータをエクスポートしたり、安全でない可能性がある LLM をデータ環境にインポートしたりすることなく、モデルやアプリケーションの開発に必要なタスクを実行できます。エクスポートまたはインポートする必要がないため、大量のデータのエクスポートや大量の LLM のインポートに通常伴うコストは発生しません。ユーザーはデータを別のベクトル データベースに移動する必要がなくなり、コストもかかりません。 AIの専門知識が必要です。

業界で懸念されているベクトルデータベースに関して、Titanium Media は以前、データベースメーカーが独自にベクトルデータベースを開発しない場合、基本的にネイティブのベクトル単語埋め込みとベクトル検索エンジンのサポートを主張するだろうと分析しました。

現在、23ai は製品の自己認証にも合格しています。ベクトル検索は、スタンドアロン製品ではなく、データベースの組み込み機能である必要があります。ビジネス データとセマンティック データの組み合わせの検索は、両方の種類のデータが 1 つのデータベースで管理されている場合、より簡単、高速、より正確になります。この道をサポートするソリューションは、すべてのデータを管理し、高性能かつ非常に経済的な方法で管理できるデータベースです。オラクルの副社長兼中国マネージングディレクターのウー・チェンヤン氏は、「すべてのデータは一か所に置かれるべきだ。そうすれば、質問や問い合わせがずっと簡単になるだろう」と述べた。

「今日、ほとんどの人が行っていることは、データベース データを AI に取り込んでから取り出すことですが、これには多くの場合、データ セキュリティの問題や管理権限の問題などが伴います。オラクルのアプローチは、AI をデータベースに導入し、ベクター データベースをシステム全体に組み込むことです。ベクトルだけでなく、テキスト、グラフ、JSON などの複数の種類のデータを統合できる融合データベースは Oracle だけが実現できます。」呉承陽は言った。

Oracle Chinaのテクニカル・コンサルティング部門のシニア・ディレクターであるLi Jia氏は、オープンソースのベクトル・データベースからOracle Fusion Databaseに移行した企業顧客の事例をTMTpostに共有しました。その背後には 3 つの主要な推進要因があります。まず、アプリケーション アーキテクチャに関して言えば、元のアプリケーション アーキテクチャにはさまざまなテクノロジ スタックが含まれており、管理が非常に複雑で効率が低くなります。第 2 に、データとアーキテクチャを拡張するとパフォーマンスの問題が発生します。第 3 に、既存のビジネス データと統合できません。全体的なリンクの効率は高くないことがよくあります。Li Jia 氏の見解では、そのような選択をする顧客はますます増えており、これはもはや例外ではありません。

「一部の顧客は、タグ情報を MongoDB に、権限情報と ID 情報を MySQL に、ナレッジ グラフをグラフ データベースに配置し、ドキュメントなどのベクトル データをベクトル データベースに保存しています。これにより、アプリケーションの統合が困難になります。」

ウー・チェンヤン氏は、移住自体は複雑ではないと指摘した。重要なのは、顧客が比較を通じてどの技術ソリューション (フュージョンまたはその他) がより適しているかを感じる必要があるということです。顧客はデータが非常に重要であると考えていますが、プロの DBA を除いて、顧客はデータベースに無関心であることがよくあります。今日のデータベースでは、特に流行の専門用語は使用されていませんが、顧客の経験に基づいてデータベースをどのように作成するかを決定します。

この目的のために、オラクルはまた、最新のデータ プラットフォームに「4 Any」、つまり Anytime、Anywhere、Any Data、Anyone を含めることを提案しました。目標は、データの管理、開発、生成を簡素化することです。

DB 用 AI が次の競争サイクルに入る

全体として、Oracle の AI 戦略は、企業が AI を使用する実際のシナリオを中心に策定されており、テクノロジー スタック全体をカバーするエンドツーエンドの生成型 AI マトリックスを作成しています。 Oracle Cloud Infrastructure(OCI)をベースとしたAIインフラ構築支援をはじめ、AI用データを提供するOracle Database、Oracle Autonomous Database、MySQL HeatWaveなどのデータベース製品や、生成AI機能を組み込んだERP、HCM、CXなどのSaaSアプリケーション。

オラクルは、最近の会計年度財務報告書で重要な情報を発表しました。第 4 四半期だけで、オラクルは総額 125 億米ドルを超える 30 以上の AI 販売契約を締結しました。これには、Microsoft との重要な協力も含まれます。 Azure プラットフォームは、推論などのコンピューティング能力に対する OpenAI のニーズをサポートするために OCI に拡張されました。

現在、大規模モデルの競争は非常に熾烈を極めており、さまざまな大規模モデル製品の反復速度が大幅に加速されており、モデルのトレーニング速度に対して高い要件が求められています。 GPU の数が増えるほど、データ セットが大きくなり、コーパスが大きくなり、提供されるインフラストラクチャ機能が強化され、トレーニング時間が短縮され、新製品の更新速度が向上します。

「現在、Oracleの最大のコンピューティング能力クラスタは30,000枚のカードに達することができますが、将来的にはその規模はさらに大きくなる可能性があります。」とOracleの中国テクニカルコンサルティング部門のシニアディレクター、Ji Xiaofeng氏は、OCIは当初から高度なAIの提供に取り組んできたと指摘しました。日中および HPC インフラストラクチャ、Oracle特にネットワークを最適化し、ロスレス ネットワーク システムを構築して、GPU 全体の拡張性を高めました。

OCI Supercluster は、複数の GPU の共同作業を実現できます。同時に、Oracle は、顧客のトレーニング ニーズをより適切に満たすための高性能ファイル システムを間もなくリリースします。新しい OCI Compute ベアメタル インスタンス、超低レイテンシの RDMA ネットワーキング、および高性能ストレージにより、OCI Supercluster は大幅に高速化されます。 OCI は、企業が AI モデルに対する需要の増大に対応できるよう最大限に支援するために、NVIDIA B200 を使用したモデルを発売します。

Oracle と NVIDIA が 2022 年の長期協力を発表して以来、NVIDIA の完全なアクセラレーション コンピューティング スタックを OCI に導入することを目指していることは注目に値します。現在、OCI は NVIDIA の超大規模クラウド テクノロジー プロバイダーとなり、大規模な AI を提供しています。コンピューティング サービス NVIDIA DGX クラウド。

Ji Xiaofeng 氏は次のように説明しました。「MoE モデルが登場しましたが、推論段階では依然として多くのコンピューティング能力が必要です。Oracle と NVIDIA の協力は、これまでのパートナー間の協力とは異なります。一部のコア サービスの実装において、製品は、双方の部門は緊密に連携しています。」

ある意味、Oracle はもはや単なるデータベース会社ではありません。近年、OCI、SaaS、その他のレベルへの投資により、Oracle は真に Microsoft や Google のようなクラウド コンピューティング企業になりました。したがって、データベースレベルでオラクルの投資ロジックを理解するためには、データベーステクノロジー製品の限界を模倣することはできませんし、国内代替の観点からオラクルの中国市場におけるさらなる発展の道筋を判断することもできません。

現在、23aiのパブリッククラウド版がローンチされており、ローカル版は今年下半期にローンチされる予定だ。これは、中国の企業顧客が 23ai を使用する敷居も大幅に下がることを意味します。

オラクルはここ数年、中国の海外展開に貢献するという「デュアルサイクル」の拡大ロジックを継続的に強調しており、中国企業顧客との協力もまた、ユーザーの需要に対する理解を新たにしている。

(この記事は最初に Titanium Media APP に掲載されました。 著者 | Yang Li、編集者 | Gai Honda)