noticias

AI para DB entra en un nuevo ciclo de competencia Observación internacional de servicios empresariales |

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


La IA para bases de datos se está convirtiendo silenciosamente en un tema candente. Una de las características más importantes es la tecnología de base de datos y recuperación de vectores que fue un éxito el año pasado y es cada vez más popular para la implementación de grandes modelos de IA.

AI para DB significa centrarse en la IA como un servicio de base de datos. Desde la perspectiva de los puntos débiles del usuario, la infraestructura de base de datos tradicional no está diseñada para grandes modelos de IA ni para satisfacer la recuperación de vectores actual.

Por ejemplo, cuando las empresas implementan aplicaciones de modelos a gran escala, inevitablemente necesitarán crear enormes conjuntos de datos. Sólo datos de alta calidad y alta densidad para entrenar modelos pueden lograr resultados más precisos. Pero adquirir y gestionar cantidades tan grandes de datos a menudo requiere muchos recursos, incluidos recursos de almacenamiento, potencia informática y capacidades de procesamiento de datos. Al mismo tiempo, la integración de fuentes de datos con diversos formatos, calidad, granularidad y heterogeneidad también complicará el proceso de capacitación del modelo. Ésta es una de las razones por las que las empresas siguen siendo cautelosamente optimistas acerca de la IA generativa.

TMTpost Media ha notado que desde el año pasado, en los mercados extranjeros, las principales empresas de bases de datos/almacenamiento de datos e incluso grandes empresas modelo han estado adoptando activamente lanzamientos de productos, adquisiciones y cooperación para aprovechar las oportunidades de mercado en las bases de datos de IA. Por ejemplo, la empresa de almacenamiento de datos en la nube Snowflake anunció que cooperará con NVIDIA para personalizar los modelos de IA para empresas; Databricks adquirió Tabular, la empresa detrás de Apache Iceberg, por mil millones de dólares; OpenAI adquirió Sockset, una empresa de bases de datos con tecnología de recuperación de vectores, por mil millones de dólares; 500 millones de dólares...

Sin embargo, desde el punto de vista actual, la idea de combinar IA y bases de datos no solo está relacionada con la recuperación de vectores. En los últimos años, las bases de datos autónomas, el autocontrol y el autodiagnóstico de las bases de datos, la introducción de código bajo + IA en text2SQL, etc. son direcciones que los clientes empresariales de la industria todavía están explorando y aún no han llegado a una conclusión.

Sin embargo, algunas personas en la industria advierten que la combinación de IA y bases de datos es todavía una dirección técnica muy nueva y que puede haber deficiencias técnicas.

Independientemente de la tendencia de la IA para DB, la primera pregunta que existe es: ¿por qué ahora? ¿Y cuáles son las nuevas soluciones?

Simplifique la aplicación y el uso de datos

Tomemos a Oracle como ejemplo.

En los últimos dos meses, Oracle ha anunciado la remodelación de la IA de sus dos sistemas principales de gestión de bases de datos: Oracle Database y MySQL HeatWave. Hay una dirección obvia en el cambio de nombre de su base de datos: la primera se cambió directamente de Database 23c a Database 23ai, mientras que la segunda se actualizó a HeatWave GenAI. Los cambios en las versiones en diferentes eras de "i" Internet, "g" grid, "c" cloud, "ai" inteligencia artificial y "GenAI" IA generativa pueden reflejar la aguda visión de Oracle sobre los puntos de inflexión de las demandas de los clientes en diferentes eras. . Entre ellos, Database 23ai ha actualizado la base de datos vectorial mencionada anteriormente y más de 300 funciones principales.

Los desarrolladores pueden utilizar el lenguaje natural para "hablar" con la base de datos Oracle, invocar las capacidades de la IA generativa, generar SQL y ejecutar el resultado final, logrando el propósito de hablar con la base de datos.

Específicamente, la función de búsqueda vectorial de 23ai permite que LLM (modelo de lenguaje grande) consulte datos comerciales privados utilizando una interfaz de lenguaje natural y ayuda a LLM a proporcionar resultados más precisos y relevantes. Los clientes pueden utilizar la función Vector Search para buscar de forma segura documentos, imágenes y otros datos no estructurados junto con datos comerciales privados sin tener que mover o copiar los datos. Esto significa que el algoritmo de IA se puede introducir en la ubicación de los datos sin tener que migrar los datos a la ubicación del algoritmo de IA, lo que permite la ejecución de IA en tiempo real en la base de datos de Oracle, lo que mejora en gran medida la efectividad. eficiencia y seguridad de la IA.

HeatWave GenAI incluye principalmente LLM en la base de datos, almacenamiento vectorial automatizado en la base de datos, procesamiento de vectores escalable y diálogo contextual en lenguaje natural basado en contenido no estructurado. Con HeatWave GenAI, los desarrolladores pueden utilizar modelos de incrustación integrados para crear almacenes de vectores para contenido empresarial no estructurado con un solo comando SQL. Los usuarios pueden realizar búsquedas en lenguaje natural en un solo paso utilizando un LLM externo o en la base de datos. Los datos no tienen que salir de la base de datos y, debido a la escala masiva y el rendimiento ultraalto de HeatWave, los usuarios no necesitan aprovisionar una GPU. Como resultado, los desarrolladores pueden reducir la complejidad de las aplicaciones, mejorar el rendimiento, mejorar la seguridad de los datos y reducir los costos.

No es difícil ver que la idea de Oracle es proporcionar una plataforma operativa unificada para IA y datos, lo que contrasta marcadamente con otros productos de bases de datos.

Por ejemplo, la capacidad LLM en la base de datos permite a los usuarios realizar las tareas necesarias para desarrollar modelos y aplicaciones sin tener que exportar datos a un entorno potencialmente inseguro o importar un LLM potencialmente inseguro a su entorno de datos. Dado que no es necesario exportar ni importar, no existen costos asociados típicamente con la exportación de grandes cantidades de datos o la importación de grandes cantidades de almacenamiento vectorial en la base de datos, lo que elimina la necesidad de que los usuarios muevan datos a una base de datos vectorial separada y no lo hace; requieren experiencia en IA.

En cuanto a las bases de datos vectoriales que son motivo de preocupación en la industria, Titanium Media ha analizado anteriormente que si los fabricantes de bases de datos no desarrollan bases de datos vectoriales de forma independiente, básicamente abogarán por admitir incrustaciones de palabras vectoriales nativas y motores de búsqueda vectoriales.

Actualmente, 23ai también está pasando la autocertificación de productos:La recuperación de vectores debería ser una capacidad incorporada de la base de datos, no un producto independiente. Buscar una combinación de datos empresariales y semánticos es más fácil, rápido y preciso si ambos tipos de datos se gestionan en una única base de datos. La solución que respalda este camino es una base de datos que puede administrar todos los datos y administrarlos de una manera muy económica y de alto rendimiento. En opinión de Wu Chengyang, vicepresidente de Oracle y director general de China, "todos los datos deben colocarse en un solo lugar. De esta manera, las preguntas y consultas serán mucho más fáciles".

"Lo que la mayoría de la gente hace hoy es llevar los datos de la base de datos a la IA y luego sacarlos, lo que a menudo implica problemas de seguridad de los datos, problemas de permisos de gestión, etc. El enfoque de Oracle es llevar la IA a la base de datos e integrar la base de datos vectorial en toda "No solo vectores, sino una base de datos de fusión que puede integrar múltiples tipos de datos, como texto, gráficos y JSON. Solo Oracle puede hacer esto".Dijo Wu Chengyang.

Li Jia, director senior del Departamento de Consultoría Técnica de Oracle China, compartió un caso con TMTpost: un cliente empresarial migró de una base de datos vectorial de código abierto a Oracle Fusion Database. Hay tres factores impulsores fundamentales detrás de esto:En primer lugar, en términos de arquitectura de aplicaciones, la arquitectura de aplicaciones original implica diferentes pilas de tecnología y tiene una alta complejidad de gestión y baja eficiencia; en segundo lugar, existen problemas de rendimiento cuando se expanden los datos y la arquitectura; en tercer lugar, no se puede integrar con los datos comerciales existentes; recuperado La eficiencia del enlace general a menudo no es alta.En opinión de Li Jia, cada vez más clientes toman esas decisiones y ésta ya no es una excepción.

"Algunos clientes colocan información de etiquetas en MongoDB, información de permisos e información de identidad en MySQL, gráficos de conocimiento en bases de datos de gráficos y luego almacenan datos vectoriales como documentos en bases de datos vectoriales, lo que dificulta la integración de aplicaciones".

Wu Chengyang señaló que la migración en sí no es complicada. La clave es que los clientes deben sentir mediante la comparación qué solución técnica (fusión u otra) será más adecuada para ellos. Los clientes piensan que los datos son muy importantes, pero a excepción de los DBA profesionales, los clientes suelen ser indiferentes a las bases de datos. Las bases de datos actuales no hablan de términos técnicos particularmente de moda, sino que utilizan la experiencia del cliente para determinar cómo se debe hacer la base de datos.

Con este fin, Oracle también propuso que la plataforma de datos moderna incluya "4 Any", es decir, Anytime, Anywhere, Any Data, Everyone. El objetivo es simplificar la gestión, el desarrollo y la generación de datos.

AI for DB entra en el próximo ciclo de competencia

En general, la estrategia de IA de Oracle se formula en torno a los escenarios reales en los que las empresas utilizan la IA, creando una matriz de IA generativa de extremo a extremo que cubre toda la pila de tecnología. Incluyendo soporte para la construcción de infraestructura de IA basado en Oracle Cloud Infrastructure (OCI), productos de bases de datos como Oracle Database, Oracle Andalusian Database y MySQL HeatWave que proporcionan datos para IA, así como aplicaciones SaaS como ERP, HCM y CX con funciones de IA generativa integradas. .

En su reciente informe financiero del año fiscal, Oracle publicó un dato importante: sólo en el cuarto trimestre, Oracle firmó más de 30 contratos de venta de IA por un valor total de más de 12.500 millones de dólares, incluida una importante cooperación para llevar a Microsoft a La plataforma Azure se ha ampliado a OCI para respaldar las necesidades de potencia informática de OpenAI, como el razonamiento.

La competencia por los modelos grandes ahora es muy feroz. Recientemente, la velocidad de iteración de varios productos de modelos grandes se ha acelerado significativamente, lo que planteará altos requisitos para la velocidad del entrenamiento del modelo. Cuantas más GPU, mayor será el conjunto de datos, mayor será el corpus, más fuertes serán las capacidades de infraestructura proporcionadas, más corto será el tiempo de entrenamiento y más rápido podrá aumentar la velocidad de las actualizaciones de nuevos productos.

"Actualmente, el grupo de potencia informática más grande de Oracle puede alcanzar las 30.000 tarjetas, y la escala puede ser aún mayor en el futuro", Ji Xiaofeng, director senior del Departamento de Consultoría Técnica de Oracle en China, señaló que OCI se ha comprometido a proporcionar IA avanzada desde el principio. infraestructura diaria y HPC, OracleHemos optimizado específicamente la red y construido un sistema de red sin pérdidas para hacer que toda la GPU sea más escalable.

OCI Supercluster puede realizar el trabajo colaborativo de múltiples GPU. Al mismo tiempo, Oracle pronto lanzará un sistema de archivos de alto rendimiento para satisfacer mejor las necesidades de capacitación de los clientes. Con las nuevas instancias bare metal de OCI Compute, redes RDMA de latencia ultrabaja y almacenamiento de alto rendimiento, OCI Supercluster será significativamente más rápido. OCI lanzará modelos que utilizan NVIDIA B200 para maximizar la ayuda a las empresas a responder a la creciente demanda de modelos de IA.

Vale la pena señalar que desde que Oracle y NVIDIA anunciaron una cooperación a largo plazo en 2022, su objetivo es introducir la pila informática acelerada completa de NVIDIA en OCI. Hoy en día, OCI se ha convertido en el proveedor de tecnología de nube de ultra gran escala de NVIDIA y proporciona IA a gran escala. Servicios informáticos NVIDIA DGX Cloud.

Ji Xiaofeng explicó: "Aunque ahora existe un modelo MoE, todavía se requiere mucha potencia informática en la etapa de inferencia. La cooperación entre Oracle y NVIDIA es diferente de la cooperación anterior entre socios. En la implementación de algunos servicios centrales, el producto Los departamentos de ambas partes tienen una colaboración profunda”.

En cierto sentido, Oracle ya no es sólo una empresa de bases de datos. En los últimos años, la inversión en OCI, SaaS y otros niveles ha hecho que Oracle se convierta realmente en una empresa de computación en la nube como Microsoft y Google. Por lo tanto, para comprender la lógica de inversión de Oracle a nivel de base de datos, no podemos copiar las limitaciones de los productos de tecnología de bases de datos, ni podemos juzgar los caminos de mayor desarrollo de Oracle en el mercado chino desde la perspectiva de la sustitución nacional.

Actualmente, se lanzó la versión de nube pública de 23ai y se espera que se lance una versión local en la segunda mitad de este año. Esto significa que el umbral para que los clientes empresariales chinos utilicen 23ai también se reducirá considerablemente.

En los últimos años, Oracle ha enfatizado continuamente la lógica de expansión de "ciclo dual" para atender la expansión de China en el extranjero y los negocios de las empresas multinacionales en China. La cooperación de Oracle con los clientes corporativos chinos también está actualizando su comprensión de las demandas de los usuarios.

(Este artículo se publicó por primera vez en la aplicación Titanium Media Autor | Yang Li, Editor | Gai Hongda)