notizia

AI for DB entra in un nuovo ciclo competitivo |. Enterprise Services International Observation

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


L'intelligenza artificiale per DB sta tranquillamente diventando una pista calda. Una delle caratteristiche più significative è la tecnologia di database/recupero vettoriale che ha avuto successo lo scorso anno ed è sempre più popolare per l’implementazione di modelli di intelligenza artificiale di grandi dimensioni.

AI per DB significa concentrarsi sull'AI come servizio di database. Dal punto di vista dei punti critici degli utenti, l'infrastruttura di database tradizionale non è progettata per modelli di intelligenza artificiale di grandi dimensioni, né è progettata per soddisfare l'odierno recupero vettoriale.

Ad esempio, quando le aziende implementano applicazioni di modelli su larga scala, avranno inevitabilmente bisogno di creare enormi set di dati. Solo dati di alta qualità e ad alta densità per addestrare i modelli possono ottenere risultati più accurati. Ma acquisire e gestire quantità di dati così grandi spesso richiede molte risorse, comprese risorse di archiviazione, potenza di calcolo e capacità di elaborazione dei dati. Allo stesso tempo, anche l’integrazione di origini dati con vari formati, qualità, granularità ed eterogeneità complicherà il processo di training del modello. Questo è uno dei motivi per cui le aziende sono ancora cautamente ottimiste riguardo all’intelligenza artificiale generativa.

TMTpost Media ha notato che dallo scorso anno, nei mercati esteri, le principali società di database/data warehouse e persino grandi aziende di modelli hanno adottato attivamente rilasci di prodotti, acquisizioni e cooperazione per cogliere le opportunità di mercato nei database AI. Ad esempio, la società di data warehouse su cloud Snowflake ha annunciato che collaborerà con NVIDIA per personalizzare i modelli di intelligenza artificiale per le imprese; Databricks ha acquisito Tabular, la società dietro Apache Iceberg, per 1 miliardo di dollari; OpenAI ha acquisito Socketet, una società di database con tecnologia di recupero vettoriale 500 milioni di dollari...

Tuttavia, dal punto di vista attuale, l’idea di combinare AI e database non è solo legata al recupero dei vettori. Negli ultimi anni, i database autonomi, l'automonitoraggio e l'autodiagnosi dei database, l'introduzione del low-code + AI in text2SQL, ecc. sono tutte direzioni che i clienti aziendali del settore stanno ancora esplorando e devono ancora raggiungere una conclusione.

Tuttavia, alcuni operatori del settore avvertono che la combinazione di intelligenza artificiale e database rappresenta ancora una direzione tecnica molto nuova e che potrebbero esserci carenze tecniche.

Indipendentemente dall’andamento dell’AI per DB, la prima domanda che sorge è: perché adesso? E quali sono le nuove soluzioni?

Semplificare l'applicazione e l'utilizzo dei dati

Prendi Oracle come esempio.

Negli ultimi due mesi, Oracle ha annunciato il rimodellamento dell'intelligenza artificiale dei suoi due principali sistemi di gestione dei database: Oracle Database e MySQL HeatWave database. C'è una direzione ovvia dal cambio del nome del suo database: il primo è stato cambiato direttamente da Database 23c a Database 23ai, mentre il secondo è stato aggiornato a HeatWave GenAI. I cambiamenti nelle versioni in epoche diverse da "i" Internet, "g" grid, "c" cloud, intelligenza artificiale "ai" e intelligenza artificiale generativa "GenAI" possono riflettere la profonda conoscenza di Oracle dei punti critici delle richieste dei clienti in epoche diverse . Tra questi, il Database 23ai ha aggiornato il database vettoriale sopra menzionato e più di 300 funzioni principali.

Gli sviluppatori possono utilizzare il linguaggio naturale per "parlare" con il database Oracle, invocare le capacità dell'intelligenza artificiale generativa, generare SQL ed eseguire il risultato finale, raggiungendo lo scopo di parlare con il database.

Nello specifico, la funzione di ricerca vettoriale di 23ai consente al LLM (Large Language Model) di interrogare dati aziendali privati ​​utilizzando un'interfaccia in linguaggio naturale e aiuta LLM a fornire risultati più accurati e pertinenti. I clienti possono utilizzare la funzione di ricerca vettoriale per cercare in modo sicuro documenti, immagini e altri dati non strutturati insieme a dati aziendali privati ​​senza dover spostare o copiare i dati. Ciò significa che l'algoritmo AI può essere introdotto nella posizione dei dati senza dover migrare i dati nella posizione dell'algoritmo AI, consentendo l'esecuzione in tempo reale dell'AI nel database Oracle, migliorando notevolmente l'efficacia, efficienza e sicurezza dell’IA.

HeatWave GenAI include principalmente LLM nel database, archiviazione automatizzata di vettori nel database, elaborazione vettoriale scalabile e dialogo contestuale in linguaggio naturale basato su contenuti non strutturati. Utilizzando HeatWave GenAI, gli sviluppatori possono utilizzare modelli di incorporamento integrati per creare archivi vettoriali per contenuti aziendali non strutturati con un singolo comando SQL. Gli utenti possono eseguire ricerche in linguaggio naturale in un unico passaggio utilizzando il database o un LLM esterno. I dati non devono necessariamente lasciare il database e, grazie all'enorme scala e alle prestazioni elevatissime di HeatWave, gli utenti non hanno bisogno di fornire una GPU. Di conseguenza, gli sviluppatori possono ridurre la complessità delle applicazioni, migliorare le prestazioni, potenziare la sicurezza dei dati e ridurre i costi.

Non è difficile capire che l'idea di Oracle è quella di fornire una piattaforma operativa unificata per intelligenza artificiale e dati, il che è in netto contrasto con altri prodotti di database.

Ad esempio, la funzionalità LLM nel database consente agli utenti di eseguire le attività richieste per sviluppare modelli e applicazioni senza dover esportare dati in un ambiente potenzialmente pericoloso o importare un LLM potenzialmente non sicuro nel proprio ambiente dati. Poiché non è necessario esportare o importare, non ci sono costi generalmente associati all'esportazione di grandi quantità di dati o all'importazione di grandi quantità di LLM; l'archiviazione vettoriale nel database elimina la necessità per gli utenti di spostare i dati in un database vettoriale separato e non lo fa richiedono competenze in materia di intelligenza artificiale.

Per quanto riguarda i database vettoriali che destano preoccupazione nel settore, Titanium Media ha precedentemente analizzato che se i produttori di database non sviluppano database vettoriali in modo indipendente, fondamentalmente sosterranno il supporto degli incorporamenti di parole vettoriali native e dei motori di ricerca vettoriale.

Attualmente 23ai sta anche superando l’autocertificazione dei prodotti:Il recupero dei vettori dovrebbe essere una funzionalità integrata del database, non un prodotto autonomo. La ricerca di una combinazione di dati aziendali e semantici è più semplice, veloce e precisa se entrambi i tipi di dati sono gestiti da un unico database. La soluzione che supporta questo percorso è un database in grado di gestire tutti i dati, e gestirli in modo performante e molto economico. Secondo Wu Chengyang, vicepresidente di Oracle e amministratore delegato della Cina, "tutti i dati dovrebbero essere collocati in un unico posto. In questo modo, domande e richieste diventeranno molto più facili".

"Quello che la maggior parte delle persone fa oggi è portare i dati del database nell'intelligenza artificiale e poi eliminarli, il che spesso comporta problemi di sicurezza dei dati, problemi di autorizzazione alla gestione, ecc. L'approccio di Oracle è quello di portare l'intelligenza artificiale nel database e incorporare il database vettoriale nell'intero database. Non solo vettori, ma un database di fusione in grado di integrare più tipi di dati come testo, grafici e JSON. Solo Oracle può farlo.Ha detto Wu Chengyang.

Li Jia, direttore senior del dipartimento di consulenza tecnica di Oracle China, ha condiviso un caso con TMTpost: un cliente aziendale è migrato da un database vettoriale open source a Oracle Fusion Database. Ci sono tre fattori chiave alla base di ciò:In primo luogo, in termini di architettura dell'applicazione, l'architettura dell'applicazione originale coinvolge diversi stack tecnologici e presenta un'elevata complessità di gestione e una bassa efficienza; in secondo luogo, ci sono problemi di prestazioni quando i dati e l'architettura vengono espansi; in terzo luogo, non possono essere integrati con i dati aziendali esistenti; recuperato L'efficienza complessiva del collegamento spesso non è elevata.Secondo Li Jia, sempre più clienti fanno queste scelte e questa non è più un'eccezione.

"Alcuni clienti inseriscono informazioni sui tag in MongoDB, informazioni sui permessi e informazioni sull'identità in MySQL, grafici della conoscenza in database a grafo e quindi archiviano dati vettoriali come documenti in database vettoriali, il che rende difficile l'integrazione delle applicazioni."

Wu Chengyang ha sottolineato che la migrazione in sé non è complicata. La chiave è che i clienti abbiano bisogno di sentire attraverso il confronto quale soluzione tecnica (fusion o altro) sarà più adatta a loro. I clienti ritengono che i dati siano molto importanti ma, ad eccezione dei DBA professionisti, sono spesso indifferenti ai database. I database di oggi non parlano di termini tecnici particolarmente alla moda, ma utilizzano l'esperienza del cliente per determinare come dovrebbe essere realizzato il database.

A tal fine, Oracle ha anche proposto che la moderna piattaforma dati includa "4 Any", ovvero Anytime, Anywhere, Any Data, Everyone. L'obiettivo è semplificare la gestione, lo sviluppo e la generazione dei dati.

AI for DB entra nel prossimo ciclo competitivo

Nel complesso, la strategia AI di Oracle è formulata attorno agli scenari reali in cui le aziende utilizzano l'AI, creando una matrice AI generativa end-to-end che copre l'intero stack tecnologico. Compreso il supporto per la costruzione di infrastrutture AI basate su Oracle Cloud Infrastructure (OCI), prodotti database come Oracle Database, Oracle Autonomous Database e MySQL HeatWave che forniscono dati per l'AI, nonché applicazioni SaaS come ERP, HCM e CX con funzioni AI generative integrate .

Nel suo recente rapporto finanziario sull'anno fiscale, Oracle ha rilasciato un'informazione importante: solo nel quarto trimestre, Oracle ha firmato più di 30 contratti di vendita di AI per un valore totale di oltre 12,5 miliardi di dollari USA, inclusa un'importante collaborazione per portare Microsoft The La piattaforma Azure è stata estesa a OCI per supportare le esigenze di OpenAI in termini di potenza di calcolo come il ragionamento.

La competizione per i modelli di grandi dimensioni è ora molto agguerrita. Recentemente, la velocità di iterazione di vari prodotti di modelli di grandi dimensioni è stata notevolmente accelerata, il che porrà requisiti elevati per la velocità di addestramento dei modelli. Maggiore è il numero di GPU, più grande è il set di dati, più ampio il corpus, più potenti sono le capacità dell'infrastruttura fornite, più breve è il tempo di formazione e più velocemente può aumentare la velocità degli aggiornamenti dei nuovi prodotti.

"Attualmente il più grande cluster di potenza di calcolo di Oracle può raggiungere le 30.000 schede e la portata potrebbe essere ancora maggiore in futuro." Ji Xiaofeng, direttore senior del dipartimento di consulenza tecnica cinese di Oracle, ha sottolineato che OCI si è impegnata a fornire un'intelligenza artificiale avanzata fin dall'inizio. giorno e infrastruttura HPC, OracleAbbiamo ottimizzato specificamente la rete e creato un sistema di rete senza perdite per rendere l'intera GPU più scalabile.

OCI Supercluster può realizzare il lavoro collaborativo di più GPU. Allo stesso tempo, Oracle rilascerà presto un file system ad alte prestazioni per soddisfare meglio le esigenze di formazione dei clienti. Con le nuove istanze bare metal OCI Compute, la rete RDMA a latenza ultra bassa e lo storage ad alte prestazioni, OCI Supercluster sarà significativamente più veloce. OCI lancerà modelli che utilizzano NVIDIA B200 per massimizzare l'aiuto delle aziende a rispondere alla crescente domanda di modelli AI.

Vale la pena notare che, da quando Oracle e NVIDIA hanno annunciato una cooperazione a lungo termine nel 2022, mirano a introdurre lo stack di calcolo accelerato completo di NVIDIA in OCI. Oggi, OCI è diventato il fornitore di tecnologia cloud su larga scala di NVIDIA, fornendo intelligenza artificiale su larga scala servizi informatici NVIDIA DGX Cloud.

Ji Xiaofeng ha spiegato: "Sebbene ora esista un modello MoE, è ancora necessaria molta potenza di calcolo nella fase di inferenza. La cooperazione tra Oracle e NVIDIA è diversa dalla precedente cooperazione tra partner. Nell'implementazione di alcuni servizi principali, il prodotto i dipartimenti di entrambe le parti hanno una profonda collaborazione.

In un certo senso, Oracle non è più solo una società di database. Negli ultimi anni, gli investimenti in OCI, SaaS e altri livelli hanno fatto sì che Oracle diventasse davvero una società di cloud computing come Microsoft e Google. Pertanto, per comprendere la logica di investimento di Oracle a livello di database, non possiamo copiare i limiti dei prodotti tecnologici di database, né possiamo giudicare i percorsi di sviluppo di Oracle nel mercato cinese dal punto di vista della sostituzione interna.

Attualmente è stata lanciata la versione cloud pubblica di 23ai e si prevede che nella seconda metà di quest'anno verrà lanciata anche una versione locale. Ciò significa che anche la soglia per l’utilizzo del 23ai da parte dei clienti aziendali cinesi sarà notevolmente ridotta.

Negli ultimi anni, Oracle ha continuamente sottolineato la logica di espansione del "doppio ciclo" volta a servire l'espansione della Cina all'estero e le attività delle multinazionali in Cina. La cooperazione di Oracle con i clienti aziendali cinesi sta inoltre migliorando la sua comprensione delle richieste degli utenti.

(Questo articolo è stato pubblicato per la prima volta su Titanium Media APP Autore | Yang Li, Editor | Gai Hongda)