nouvelles

L'IA pour la base de données entre dans un nouveau cycle de concurrence | Enterprise Services International Observation

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


L’IA pour DB devient progressivement une piste brûlante. L’une des fonctionnalités les plus importantes est la technologie de base de données vectorielle/récupération de vecteurs qui a connu un succès l’année dernière et est de plus en plus populaire pour la mise en œuvre de grands modèles d’IA.

AI for DB signifie se concentrer sur l’IA en tant que service de base de données. Du point de vue des problèmes des utilisateurs, l'infrastructure de base de données traditionnelle n'est pas conçue pour les grands modèles d'IA, ni pour répondre aux besoins actuels de récupération de vecteurs.

Par exemple, lorsque les entreprises mettent en œuvre des applications de modèles à grande échelle, elles devront inévitablement créer d'énormes ensembles de données. Seules des données de haute qualité et haute densité pour former des modèles peuvent obtenir des résultats plus précis. Mais l’acquisition et la gestion d’aussi grandes quantités de données nécessitent souvent beaucoup de ressources, notamment des ressources de stockage, de la puissance de calcul et des capacités de traitement des données. Dans le même temps, l'intégration de sources de données avec différents formats, qualités, granularités et hétérogénéités compliquera également le processus de formation des modèles. C’est l’une des raisons pour lesquelles les entreprises restent prudemment optimistes à l’égard de l’IA générative.

TMTpost Media a remarqué que depuis l'année dernière, sur les marchés étrangers, les principales sociétés de bases de données/entrepôts de données et même les grandes sociétés modèles ont activement adopté les lancements de produits, les acquisitions et la coopération pour saisir les opportunités de marché dans les bases de données d'IA. Par exemple, la société d'entrepôt de données cloud Snowflake a annoncé qu'elle coopérerait avec NVIDIA pour personnaliser les modèles d'IA pour les entreprises ; Databricks a acquis Tabular, la société derrière Apache Iceberg, pour 1 milliard de dollars ; OpenAI a acquis Sockset, une société de bases de données dotée d'une technologie de récupération de vecteurs, pour 1 milliard de dollars ; 500 millions de dollars...

Cependant, du point de vue actuel, l’idée de combiner IA et base de données n’est pas uniquement liée à la récupération de vecteurs. Au cours des dernières années, les bases de données autonomes, l'autosurveillance et l'autodiagnostic des bases de données, l'introduction du low-code + IA dans text2SQL, etc. sont autant de directions que les entreprises clientes du secteur explorent encore et n'ont pas encore abouti à une conclusion.

Cependant, certains acteurs de l'industrie préviennent que la combinaison de l'IA et des bases de données est encore une direction technique très nouvelle et qu'elle peut présenter des lacunes techniques.

Quelle que soit la tendance de l’IA pour la base de données, la première question qui se pose est : pourquoi maintenant ? Et quelles sont les nouvelles solutions ?

Simplifiez l’application et l’utilisation des données

Prenons Oracle comme exemple.

Au cours des deux derniers mois, Oracle a annoncé la refonte de l'IA de ses deux principaux systèmes de gestion de bases de données : Oracle Database et MySQL HeatWave. Le changement de nom de sa base de données a une direction évidente : la première est passée directement de Database 23c à Database 23ai, tandis que la seconde a été mise à niveau vers HeatWave GenAI. Les changements de versions à différentes époques de « i » Internet, « g » grid, « c » cloud, « ai » intelligence artificielle et « GenAI » IA générative peuvent refléter la perspicacité d'Oracle dans les points de basculement des demandes des clients à différentes époques. . Parmi eux, Database 23ai a mis à niveau la base de données vectorielles mentionnée ci-dessus et plus de 300 fonctions principales.

Les développeurs peuvent utiliser le langage naturel pour « parler » avec la base de données Oracle, invoquer les capacités de l'IA générative, générer du SQL et exécuter le résultat final, atteignant ainsi l'objectif de communiquer avec la base de données.

Plus précisément, la fonction de recherche vectorielle de 23ai permet à LLM (Large Language Model) d'interroger des données commerciales privées à l'aide d'une interface en langage naturel et aide LLM à fournir des résultats plus précis et pertinents. Les clients peuvent utiliser la fonction de recherche vectorielle pour rechercher en toute sécurité des documents, des images et d'autres données non structurées en conjonction avec des données professionnelles privées sans avoir à déplacer ou copier les données. Cela signifie que l'algorithme d'IA peut être introduit dans l'emplacement des données sans avoir à migrer les données vers l'emplacement de l'algorithme d'IA, permettant ainsi l'exécution en temps réel de l'IA dans la base de données Oracle, améliorant considérablement l'efficacité. l’efficacité et la sécurité de l’IA.

HeatWave GenAI comprend principalement un LLM dans la base de données, un stockage vectoriel automatisé dans la base de données, un traitement vectoriel évolutif et un dialogue contextuel en langage naturel basé sur du contenu non structuré. Grâce à HeatWave GenAI, les développeurs peuvent utiliser des modèles d'intégration intégrés pour créer des magasins vectoriels pour le contenu non structuré d'entreprise avec une seule commande SQL. Les utilisateurs peuvent effectuer des recherches en langage naturel en une seule étape à l'aide d'une base de données ou d'un LLM externe. Les données n'ont pas besoin de quitter la base de données et, en raison de l'échelle massive et des performances ultra-élevées de HeatWave, les utilisateurs n'ont pas besoin de provisionner un GPU. En conséquence, les développeurs peuvent réduire la complexité des applications, améliorer les performances, renforcer la sécurité des données et réduire les coûts.

Il n'est pas difficile de comprendre que l'idée d'Oracle est de fournir une plate-forme d'exploitation unifiée pour l'IA et les données, ce qui contraste fortement avec les autres produits de bases de données.

Par exemple, la fonctionnalité LLM dans la base de données permet aux utilisateurs d'effectuer les tâches requises pour développer des modèles et des applications sans avoir à exporter des données vers un environnement potentiellement dangereux ou à importer un LLM potentiellement dangereux dans leur environnement de données. Puisqu'il n'est pas nécessaire d'exporter ou d'importer, il n'y a pas de coûts généralement associés à l'exportation de grandes quantités de données ou à l'importation de grandes quantités de stockage vectoriel dans la base de données, ce qui élimine le besoin pour les utilisateurs de déplacer les données vers une base de données vectorielle distincte. nécessitent une expertise en IA.

En ce qui concerne les bases de données vectorielles qui préoccupent l'industrie, Titanium Media a déjà analysé que si les fabricants de bases de données ne développent pas de manière indépendante des bases de données vectorielles, ils préconiseront essentiellement la prise en charge des intégrations de mots vectoriels natifs et des moteurs de recherche vectoriels.

Actuellement, 23ai passe également l’autocertification du produit :La récupération de vecteurs doit être une fonctionnalité intégrée à la base de données et non un produit autonome. La recherche d’une combinaison de données métiers et sémantiques est plus facile, plus rapide et plus précise si les deux types de données sont gérés par une seule base de données. La solution qui prend en charge cette voie est une base de données capable de gérer toutes les données, et de les gérer de manière performante et très économique. Selon Wu Chengyang, vice-président d'Oracle et directeur général de la Chine, "Toutes les données doivent être placées au même endroit. De cette façon, les questions et les demandes de renseignements deviendront beaucoup plus faciles".

« Ce que font la plupart des gens aujourd'hui, c'est transférer les données de la base de données vers l'IA, puis les supprimer, ce qui implique souvent des problèmes de sécurité des données, des problèmes d'autorisation de gestion, etc. L'approche d'Oracle consiste à amener l'IA dans la base de données et à intégrer la base de données vectorielle dans l'ensemble. Pas seulement des vecteurs, mais une base de données de fusion qui peut intégrer plusieurs types de données tels que du texte, des graphiques et du JSON. Seul Oracle peut le faire.» a déclaré Wu Chengyang.

Li Jia, directeur principal du département de conseil technique d'Oracle Chine, a partagé un cas avec TMTpost : une entreprise cliente a migré d'une base de données vectorielles open source vers Oracle Fusion Database. Il y a trois facteurs déterminants derrière cela :Premièrement, en termes d'architecture d'application, l'architecture d'application d'origine implique différentes piles technologiques et présente une complexité de gestion élevée et une faible efficacité ; deuxièmement, des problèmes de performances surviennent lorsque les données et l'architecture sont étendues ; troisièmement, elle ne peut pas être intégrée aux données commerciales existantes ; récupéré L'efficacité du lien global n'est souvent pas élevée.Selon Li Jia, de plus en plus de clients font de tels choix, et ce n 'est plus une exception.

"Certains clients placent des informations sur les balises dans MongoDB, des informations d'autorisation et des informations d'identité dans MySQL, des graphiques de connaissances dans des bases de données graphiques, puis stockent des données vectorielles telles que des documents dans des bases de données vectorielles, ce qui rend difficile l'intégration des applications."

Wu Chengyang a souligné que la migration en elle-même n'est pas compliquée. L’essentiel est que les clients doivent ressentir par comparaison quelle solution technique (fusion ou autre) leur conviendra le mieux. Les clients pensent que les données sont très importantes, mais à l'exception des administrateurs de base de données professionnels, les clients sont souvent indifférents aux bases de données. Les bases de données d'aujourd'hui ne parlent pas de termes techniques particulièrement à la mode, mais utilisent l'expérience du client pour déterminer la manière dont la base de données doit être créée.

À cette fin, Oracle a également proposé que la plateforme de données moderne comprenne « 4 Any », à savoir Anytime, Anywhere, Any Data, Any. L'objectif est de simplifier la gestion, le développement et la génération des données.

L'IA pour DB entre dans le prochain cycle de compétition

Dans l'ensemble, la stratégie d'IA d'Oracle est formulée autour des scénarios réels dans lesquels les entreprises utilisent l'IA, créant ainsi une matrice d'IA générative de bout en bout couvrant l'ensemble de la pile technologique. Y compris la prise en charge de la construction d'une infrastructure d'IA basée sur Oracle Cloud Infrastructure (OCI), des produits de base de données tels qu'Oracle Database, Oracle Autonomous Database et MySQL HeatWave qui fournissent des données pour l'IA, ainsi que des applications SaaS telles que ERP, HCM et CX avec des fonctions d'IA génératives intégrées. .

Dans son récent rapport financier pour l'exercice financier, Oracle a publié une information importante : au cours du seul quatrième trimestre, Oracle a signé plus de 30 contrats de vente d'IA d'une valeur totale de plus de 12,5 milliards de dollars américains, y compris une importante coopération pour amener Microsoft à La plateforme Azure a été étendue à OCI pour prendre en charge les besoins d'OpenAI en matière de puissance de calcul tels que le raisonnement.

La concurrence pour les grands modèles est désormais très féroce. Récemment, la vitesse d'itération de divers produits de grands modèles a été considérablement accélérée, ce qui imposera des exigences élevées en matière de rapidité de formation des modèles. Plus il y a de GPU, plus l'ensemble de données est grand, plus le corpus est grand, plus les capacités d'infrastructure fournies sont fortes, plus le temps de formation est court et plus il peut augmenter rapidement la vitesse des mises à jour des nouveaux produits.

"Actuellement, le plus grand cluster de puissance de calcul d'Oracle peut atteindre 30 000 cartes, et l'échelle pourrait être encore plus grande à l'avenir." Ji Xiaofeng, directeur principal du département de conseil technique d'Oracle en Chine, a souligné qu'OCI s'est engagé dès le début à fournir une IA avancée. jour et infrastructure HPC, OracleNous avons spécifiquement optimisé le réseau et construit un système réseau sans perte pour rendre l'ensemble du GPU plus évolutif.

OCI Supercluster peut réaliser le travail collaboratif de plusieurs GPU. Dans le même temps, Oracle publiera bientôt un système de fichiers hautes performances pour mieux répondre aux besoins de formation des clients. Avec les nouvelles instances nues OCI Compute, la mise en réseau RDMA à latence ultra faible et le stockage hautes performances, OCI Supercluster sera nettement plus rapide. OCI lancera des modèles utilisant NVIDIA B200 pour maximiser l'aide aux entreprises à répondre à la demande croissante de modèles d'IA.

Il convient de noter que depuis qu'Oracle et NVIDIA ont annoncé une coopération à long terme en 2022, ils visent à introduire la pile informatique accélérée complète de NVIDIA dans OCI. Aujourd'hui, OCI est devenu le fournisseur de technologie cloud à très grande échelle de NVIDIA, fournissant une IA à grande échelle. services informatiques NVIDIA DGX Cloud.

Ji Xiaofeng a expliqué : « Bien qu'il existe désormais un modèle MoE, une grande puissance de calcul est encore nécessaire dans la phase d'inférence. La coopération entre Oracle et NVIDIA est différente de la coopération précédente entre partenaires. Dans la mise en œuvre de certains services de base, le produit les départements des deux parties ont une collaboration approfondie.

D’une certaine manière, Oracle n’est plus seulement une société de bases de données. Ces dernières années, les investissements dans l'OCI, le SaaS et à d'autres niveaux ont fait d'Oracle une véritable entreprise de cloud computing comme Microsoft et Google. Par conséquent, pour comprendre la logique d'investissement d'Oracle au niveau des bases de données, nous ne pouvons pas copier les limites des produits technologiques de bases de données, ni juger les voies de développement d'Oracle sur le marché chinois du point de vue de la substitution nationale.

À l'heure actuelle, la version cloud public de 23ai a été lancée et une version locale devrait être lancée au second semestre de cette année. Cela signifie que le seuil permettant aux entreprises clientes chinoises d’utiliser 23ai sera également considérablement réduit.

Au cours des dernières années, Oracle n'a cessé de mettre l'accent sur la logique d'expansion à « double cycle » visant à répondre à l'expansion de la Chine à l'étranger et aux activités des sociétés multinationales en Chine. La coopération d'Oracle avec les entreprises clientes chinoises rafraîchit également sa compréhension des demandes des utilisateurs.

(Cet article a été publié pour la première fois sur Titanium Media APP Auteur | Yang Li, rédacteur | Gai Hongda)