notícias

AI para DB entra em um novo ciclo de competição Observação Internacional de Serviços Empresariais |

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


AI for DB está silenciosamente se tornando uma faixa quente. Um dos recursos mais significativos é a tecnologia de banco de dados vetorial/recuperação de vetores que foi um sucesso no ano passado e é cada vez mais popular para a implementação de grandes modelos de IA.

AI for DB significa focar na IA como um serviço de banco de dados. Do ponto de vista dos pontos problemáticos do usuário, a infraestrutura de banco de dados tradicional não foi projetada para grandes modelos de IA, nem para atender à recuperação de vetores atual.

Por exemplo, quando as empresas implementam aplicações de modelos em grande escala, inevitavelmente precisarão construir enormes conjuntos de dados. Somente dados de alta qualidade e alta densidade para treinar modelos podem alcançar resultados mais precisos. Mas adquirir e gerenciar grandes quantidades de dados geralmente requer muitos recursos, incluindo recursos de armazenamento, poder computacional e capacidades de processamento de dados. Ao mesmo tempo, a integração de fontes de dados com vários formatos, qualidade, granularidade e heterogeneidade também complicará o processo de treinamento do modelo. Esta é uma das razões pelas quais as empresas ainda estão cautelosamente optimistas em relação à IA generativa.

A TMTpost Media notou que, desde o ano passado, nos mercados internacionais, as principais empresas de banco de dados/data warehouse e até mesmo grandes empresas modelo têm adotado ativamente o lançamento de produtos, aquisições e cooperação para aproveitar as oportunidades de mercado em bancos de dados de IA. Por exemplo, a empresa de armazenamento de dados em nuvem Snowflake anunciou que cooperará com a NVIDIA para personalizar modelos de IA para empresas; a Databricks adquiriu a Tabular, a empresa por trás do Apache Iceberg, por US$ 1 bilhão, adquiriu a OpenAI, uma empresa de banco de dados com tecnologia de recuperação de vetores, por; US$ 500 milhões...

Porém, do ponto de vista atual, a ideia de combinar IA e banco de dados não está relacionada apenas à recuperação de vetores. Nos últimos anos, bancos de dados autônomos, automonitoramento e autodiagnóstico de bancos de dados, introdução de low-code + IA no text2SQL, etc. são direções que os clientes corporativos do setor ainda estão explorando e ainda não chegaram a uma conclusão.

No entanto, algumas pessoas na indústria alertam que a combinação de IA e banco de dados ainda é uma direção técnica muito nova e pode haver deficiências técnicas.

Independentemente da tendência da IA ​​para BD, a primeira pergunta que existe é: por que agora? E quais são as novas soluções?

Simplifique a aplicação e o uso de dados

Tomemos como exemplo a Oracle.

Nos últimos dois meses, a Oracle anunciou a reformulação da IA ​​de seus dois principais sistemas de gerenciamento de banco de dados - Oracle Database e MySQL HeatWave. Há uma direção óbvia na mudança do nome do banco de dados: o primeiro foi alterado diretamente de Banco de Dados 23c para Banco de Dados 23ai, enquanto o último foi atualizado para HeatWave GenAI. As mudanças nas versões em diferentes épocas de Internet "i", grade "g", nuvem "c", inteligência artificial "ai" e IA generativa "GenAI" podem refletir a visão aguçada da Oracle sobre os pontos críticos das demandas dos clientes em diferentes épocas . Entre eles, o Database 23ai atualizou o banco de dados vetorial mencionado acima e mais de 300 funções principais.

Os desenvolvedores podem usar linguagem natural para “conversar” com o banco de dados Oracle, invocar os recursos da IA ​​generativa, gerar SQL e executar o resultado final, atingindo o propósito de conversar com o banco de dados.

Especificamente, a função Vector Search da 23ai permite que o LLM (Large Language Model) consulte dados de negócios privados usando uma interface de linguagem natural e ajuda o LLM a fornecer resultados mais precisos e relevantes. Os clientes podem usar o recurso Vector Search para pesquisar com segurança documentos, imagens e outros dados não estruturados em conjunto com dados comerciais privados, sem precisar mover ou copiar os dados. Isso significa que o algoritmo de IA pode ser introduzido no local dos dados sem a necessidade de migrar os dados para o local do algoritmo de IA, permitindo a execução da IA ​​em tempo real no banco de dados Oracle, melhorando significativamente a eficácia, eficiência e segurança da IA.

HeatWave GenAI inclui principalmente LLM no banco de dados, armazenamento automatizado de vetores no banco de dados, processamento de vetores escalonável e diálogo contextual em linguagem natural baseado em conteúdo não estruturado. Usando HeatWave GenAI, os desenvolvedores podem usar modelos de incorporação integrados para criar armazenamentos de vetores para conteúdo empresarial não estruturado com um único comando SQL. Os usuários podem realizar pesquisas em linguagem natural em uma única etapa usando LLM no banco de dados ou externo. Os dados não precisam sair do banco de dados e, devido à enorme escala e ao desempenho ultra-alto do HeatWave, os usuários não precisam provisionar uma GPU. Como resultado, os desenvolvedores podem reduzir a complexidade dos aplicativos, melhorar o desempenho, aumentar a segurança dos dados e reduzir custos.

Não é difícil perceber que a ideia da Oracle é fornecer uma plataforma operacional unificada para IA e dados, o que contrasta fortemente com outros produtos de banco de dados.

Por exemplo, o recurso LLM no banco de dados permite que os usuários executem as tarefas necessárias para desenvolver modelos e aplicativos sem precisar exportar dados para um ambiente potencialmente inseguro ou importar um LLM potencialmente inseguro para seu ambiente de dados. Como não há necessidade de exportar ou importar, não há custos normalmente associados à exportação de grandes quantidades de dados ou à importação de grandes quantidades de armazenamento vetorial no banco de dados, eliminando a necessidade de os usuários moverem dados para um banco de dados vetorial separado; requerem experiência em IA.

Quanto aos bancos de dados vetoriais que são motivo de preocupação na indústria, a Titanium Media analisou anteriormente que, se os fabricantes de bancos de dados não desenvolverem bancos de dados vetoriais de forma independente, eles basicamente defenderão o suporte à incorporação de palavras vetoriais nativas e aos mecanismos de pesquisa vetorial.

Atualmente, 23ai também está passando pela autocertificação de produto:A recuperação de vetores deve ser um recurso integrado do banco de dados, e não um produto independente. Pesquisar uma combinação de dados comerciais e semânticos será mais fácil, rápido e preciso se ambos os tipos de dados forem gerenciados por um único banco de dados. A solução que suporta esse caminho é um banco de dados que consegue gerenciar todos os dados, e gerenciá-los de forma de alto desempenho e muito econômica. Na opinião de Wu Chengyang, vice-presidente da Oracle e diretor administrativo da China, "Todos os dados devem ser colocados em um só lugar. Dessa forma, perguntas e dúvidas ficarão muito mais fáceis".

“O que a maioria das pessoas faz hoje é levar os dados do banco de dados para a IA e depois retirá-los, o que geralmente envolve questões de segurança de dados, problemas de permissão de gerenciamento, etc. A abordagem da Oracle é trazer a IA para o banco de dados e incorporar o banco de dados vetorial em todo o banco de dados. Não apenas vetores, mas um banco de dados de fusão que pode integrar vários tipos de dados, como texto, gráficos e JSON. Somente a Oracle pode fazer isso.Wu Chengyang disse.

Li Jia, diretor sênior do Departamento de Consultoria Técnica da Oracle China, compartilhou um caso com a TMTpost: um cliente corporativo migrou de um banco de dados vetorial de código aberto para o Oracle Fusion Database. Existem três fatores principais por trás disso:Primeiro, em termos de arquitetura de aplicativos, a arquitetura original do aplicativo envolve diferentes pilhas de tecnologia e tem alta complexidade de gerenciamento e baixa eficiência; segundo, há problemas de desempenho quando os dados e a arquitetura são expandidos; terceiro, não pode ser integrado aos dados de negócios existentes; recuperado A eficiência do link geral geralmente não é alta.Na opinião de Li Jia, cada vez mais clientes estão fazendo essas escolhas e isso não é mais uma exceção.

“Alguns clientes colocam informações de tags no MongoDB, informações de permissão e informações de identidade no MySQL, gráficos de conhecimento em bancos de dados gráficos e, em seguida, armazenam dados vetoriais, como documentos em bancos de dados vetoriais, o que dificulta a integração de aplicativos.”

Wu Chengyang destacou que a migração em si não é complicada. A chave é que os clientes precisam sentir através da comparação qual solução técnica (fusão ou outra) será mais adequada para eles. Os clientes acham que os dados são muito importantes, mas, com exceção dos DBAs profissionais, os clientes costumam ser indiferentes aos bancos de dados. Os bancos de dados atuais não falam sobre termos técnicos particularmente em voga, mas usam a experiência do cliente para determinar como o banco de dados deve ser feito.

Para tal, a Oracle também propôs que a moderna plataforma de dados inclua "4 Any", nomeadamente Anytime, Anywhere, Any Data, Everyone. O objetivo é simplificar a gestão, o desenvolvimento e a geração de dados.

AI for DB entra no próximo ciclo de competição

No geral, a estratégia de IA da Oracle é formulada em torno dos cenários reais em que as empresas usam IA, criando uma matriz de IA generativa de ponta a ponta que abrange toda a pilha de tecnologia. Incluindo suporte à construção de infraestrutura de IA baseada em Oracle Cloud Infrastructure (OCI), produtos de banco de dados como Oracle Database, Oracle Autonomous Database e MySQL HeatWave que fornecem dados para IA, bem como aplicativos SaaS como ERP, HCM e CX com funções de IA generativas incorporadas .

Em seu recente relatório financeiro do ano fiscal, a Oracle divulgou uma informação importante: somente no quarto trimestre, a Oracle assinou mais de 30 contratos de vendas de IA com um valor total de mais de 12,5 bilhões de dólares americanos, incluindo uma importante cooperação para trazer a Microsoft The A plataforma Azure foi estendida à OCI para dar suporte às necessidades da OpenAI de poder de computação, como raciocínio.

A competição por modelos grandes é muito acirrada. Recentemente, a velocidade de iteração de vários produtos de modelos grandes foi significativamente acelerada, o que apresentará altos requisitos para a velocidade de treinamento de modelos. Quanto mais GPUs, maior o conjunto de dados, maior o corpus, mais fortes serão os recursos de infraestrutura fornecidos, menor será o tempo de treinamento e mais rápido poderá aumentar a velocidade de atualizações de novos produtos.

"Atualmente, o maior cluster de poder computacional da Oracle pode atingir 30.000 cartões, e a escala pode ser ainda maior no futuro." Ji Xiaofeng, diretor sênior do Departamento de Consultoria Técnica da Oracle na China, destacou que a OCI está comprometida em fornecer IA avançada desde o início. dia e infraestrutura de HPC, OracleOtimizamos especificamente a rede e construímos um sistema de rede sem perdas para tornar toda a GPU mais escalonável.

OCI Supercluster pode realizar o trabalho colaborativo de várias GPUs. Ao mesmo tempo, a Oracle lançará em breve um sistema de arquivos de alto desempenho para melhor atender às necessidades de treinamento dos clientes. Com as novas instâncias bare metal do OCI Compute, rede RDMA de latência ultrabaixa e armazenamento de alto desempenho, o OCI Supercluster será significativamente mais rápido. A OCI lançará modelos usando NVIDIA B200 para maximizar a ajuda das empresas a responder à crescente demanda por modelos de IA.

É importante notar que desde que a Oracle e a NVIDIA anunciaram uma cooperação de longo prazo em 2022, elas pretendem apresentar a pilha completa de computação acelerada da NVIDIA à OCI. Hoje, a OCI se tornou o fornecedor de tecnologia de nuvem de ultragrande escala da NVIDIA, fornecendo IA em grande escala. serviços de computação NVIDIA DGX Cloud.

Ji Xiaofeng explicou: "Embora exista agora um modelo MoE, ainda é necessário muito poder de computação na fase de inferência. A cooperação entre Oracle e NVIDIA é diferente da cooperação anterior entre parceiros. Na implementação de alguns serviços principais, o produto departamentos de ambos os lados têm colaboração profunda.”

De certa forma, a Oracle não é mais apenas uma empresa de bancos de dados. Nos últimos anos, o investimento em OCI, SaaS e outros níveis fez com que a Oracle se tornasse verdadeiramente uma empresa de computação em nuvem como a Microsoft e o Google. Portanto, para compreender a lógica de investimento da Oracle no nível de banco de dados, não podemos copiar as limitações dos produtos de tecnologia de banco de dados, nem podemos julgar os caminhos de desenvolvimento da Oracle no mercado chinês a partir da perspectiva da substituição doméstica.

Atualmente, a versão em nuvem pública do 23ai foi lançada e uma versão local deverá ser lançada no segundo semestre deste ano. Isso significa que o limite para os clientes empresariais chineses usarem o 23ai também será bastante reduzido.

Nos últimos anos, a Oracle tem enfatizado continuamente a lógica de expansão de "ciclo duplo" para servir a expansão externa da China e os negócios das empresas multinacionais na China. A cooperação da Oracle com clientes corporativos chineses também está atualizando sua compreensão das demandas dos usuários.

(Este artigo foi publicado pela primeira vez no Titanium Media APP Autor | Yang Li, Editor | Gai Hongda)