Tekoäly DB:lle siirtyy uuteen kilpailusykliin Enterprise Services International Observation

DB:n tekoäly siirtyy uuteen kilpailusykliin Enterprise Services International Observation |

2024-07-15

DB:n tekoäly on hiljaa tulossa kuumaksi kappaleeksi. Yksi merkittävimmistä ominaisuuksista on viime vuonna menestynyt vektoritietokanta/vektorihakutekniikka, joka on yhä suositumpi suurten tekoälymallien toteuttamisessa.

AI for DB tarkoittaa keskittymistä tekoälyyn tietokantapalveluna. Käyttäjien kipupisteiden näkökulmasta perinteistä tietokantainfrastruktuuria ei ole suunniteltu suurille tekoälymalleille, eikä sitä ole suunniteltu vastaamaan nykypäivän vektorihakua.

Esimerkiksi suurten mallisovellusten toteuttamiseksi yritysten on väistämättä rakennettava valtavia tietojoukkoja. Tarkempia tuloksia voidaan saavuttaa vain korkealaatuisella ja tiheällä tiedolla. Mutta näin suurten tietomäärien hankkiminen ja hallinta vaatii usein paljon resursseja, mukaan lukien tallennusresurssit, laskentateho ja tietojenkäsittelyominaisuudet. Samanaikaisesti tietolähteiden integrointi eri formaattien, laadun, tarkkuuden ja heterogeenisyyden kanssa vaikeuttaa myös mallin koulutusprosessia. Tämä on yksi syy siihen, miksi yritykset ovat edelleen varovaisen optimistisia generatiivisen tekoälyn suhteen.

TMTpost Media on huomannut, että viime vuodesta lähtien johtavat tietokanta-/tietovarastoyritykset ja jopa suuret malliyritykset ovat ottaneet aktiivisesti käyttöön tuotejulkaisuja, yritysostoja ja yhteistyötä tarttuakseen markkinoiden mahdollisuuksiin tekoälytietokannassa. Esimerkiksi pilvitietovarastoyritys Snowflake ilmoitti tekevänsä yhteistyötä NVIDIA:n kanssa tehdäkseen tekoälymalleja yrityksille. Databricks osti Tabularin, Apache Icebergin takana, 1 miljardilla dollarilla OpenAI osti vektorihakutekniikkaa käyttävän tietokantayhtiön 500 miljoonaa dollaria...

Nykyisestä näkökulmasta ajatus tekoälyn ja tietokannan yhdistämisestä ei kuitenkaan liity pelkästään vektorinhakuun. Muutaman viime vuoden aikana itsenäiset tietokannat, tietokantojen itsevalvonta ja -diagnoosit, matalakoodin + tekoälyn käyttöönotto text2SQL:ssä jne. ovat kaikki suuntauksia, joita alan yritysasiakkaat tutkivat edelleen eivätkä ole vielä päässeet päätökseen.

Jotkut alan ihmiset kuitenkin varoittavat, että tekoälyn ja tietokannan yhdistäminen on vielä hyvin uusi tekninen suunta ja siinä voi olla teknisiä puutteita.

DB:n tekoälyn trendistä riippumatta ensimmäinen olemassa oleva kysymys on: miksi nyt? Ja mitkä ovat uudet ratkaisut?

Yksinkertaista datan sovellus ja käyttö

Ota Oracle esimerkkinä.

Viimeisten kahden kuukauden aikana Oracle on ilmoittanut kahden ydintietokannan hallintajärjestelmän, Oracle Database ja MySQL HeatWave -tietokannan, tekoälyn muokkaamisesta. Tietokannan nimen muutoksella on selvä suunta: edellinen muutettiin suoraan Database 23c:stä Database 23ai:ksi, kun taas jälkimmäinen päivitettiin HeatWave GenAI:ksi. Versioiden muutokset eri aikakausina "i" Internetistä, "g" gridistä, "c" pilvestä, "ai" tekoälystä ja "GenAI" generatiivisesta tekoälystä voivat heijastaa Oraclen tarkkaa näkemystä asiakkaiden tarpeiden kääntöpisteistä eri aikakausina. . Niiden joukossa Database 23ai on päivittänyt yllä mainitun vektoritietokannan ja yli 300 päätoimintoa.

Kehittäjät voivat käyttää luonnollista kieltä "puhuakseen" Oracle-tietokannan kanssa, käyttääkseen generatiivisen tekoälyn ominaisuuksia, luodakseen SQL:ää ja suorittaakseen lopputuloksen saavuttaakseen tietokannan kanssa puhumisen tarkoituksen.

Tarkemmin sanottuna 23ain Vector Search -toiminto mahdollistaa LLM:n (Large Language Model) kyselyn yksityisen yritysdatan avulla luonnollisen kielen käyttöliittymän avulla ja auttaa LLM:tä tarjoamaan tarkempia ja osuvampia tuloksia. Vektorihakuominaisuuden avulla asiakkaat voivat hakea turvallisesti asiakirjoja, kuvia ja muuta jäsentämätöntä dataa yhdessä yksityisten yritystietojen kanssa ilman, että tietoja tarvitsee siirtää tai kopioida. Tämä tarkoittaa, että tekoälyalgoritmi voidaan tuoda tietojen sijaintiin ilman, että tietoja tarvitsee siirtää tekoälyalgoritmin sijaintiin, mikä mahdollistaa tekoälyn reaaliaikaisen käytön Oracle-tietokannassa, mikä parantaa huomattavasti tehokkuutta, tekoälyn tehokkuus ja turvallisuus.

HeatWave GenAI sisältää pääasiassa tietokannan sisäisen LLM:n, automatisoidun tietokannan sisäisen vektoritallennustilan, skaalautuvan vektorinkäsittelyn ja luonnollisen kielen kontekstuaalisen dialogin, joka perustuu strukturoimattomaan sisältöön. HeatWave GenAI:n avulla kehittäjät voivat käyttää sisäänrakennettuja upotusmalleja luodakseen vektorivarastoja yrityssisällölle yhdellä SQL-komennolla. Käyttäjät voivat tehdä luonnollisen kielen hakuja yhdessä vaiheessa käyttämällä tietokannan sisäistä tai ulkoista LLM:ää. Tietojen ei tarvitse poistua tietokannasta, ja HeatWaven massiivisen mittakaavan ja erittäin korkean suorituskyvyn vuoksi käyttäjien ei tarvitse tarjota GPU:ta. Tämän seurauksena kehittäjät voivat vähentää sovellusten monimutkaisuutta, parantaa suorituskykyä, parantaa tietoturvaa ja vähentää kustannuksia.

Ei ole vaikea nähdä, että Oraclen ideana on tarjota yhtenäinen toiminta-alusta tekoälylle ja datalle, mikä on jyrkässä ristiriidassa muiden tietokantatuotteiden kanssa.

Esimerkiksi tietokannan sisäisen LLM-ominaisuuden avulla käyttäjät voivat suorittaa mallien ja sovellusten kehittämiseen tarvittavia tehtäviä ilman, että heidän tarvitsee viedä tietoja mahdollisesti vaaralliseen ympäristöön tai tuoda mahdollisesti vaarallista LLM:ää tietoympäristöönsä. Koska vientiä tai tuontia ei tarvita, suurten tietomäärien vientiin tai suurten tietokannan sisäisen vektoritallennusmäärien tuontiin ei liity kustannuksia, joten käyttäjien ei tarvitse siirtää tietoja erilliseen vektoritietokantaan vaatii tekoälyn asiantuntemusta.

Mitä tulee alalla huolenaiheisiin vektoritietokantoihin, Titanium Media on aiemmin analysoinut, että jos tietokantavalmistajat eivät kehitä itsenäisesti vektoritietokantoja, ne periaatteessa kannattavat alkuperäisten vektorisanojen upotusten ja vektorihakukoneiden tukemista.

Tällä hetkellä 23ai on myös läpäissyt tuotteiden itsesertifioinnin:Vektorihaun tulee olla tietokannan sisäänrakennettu ominaisuus, ei erillinen tuote. Yritystietojen ja semanttisten tietojen yhdistelmän etsiminen on helpompaa, nopeampaa ja tarkempaa, jos molempia tietotyyppejä hallinnoidaan yhdessä tietokannassa. Ratkaisu, joka tukee tätä polkua, on tietokanta, joka voi hallita kaikkia tietoja ja hallita sitä tehokkaalla ja erittäin taloudellisella tavalla. Oraclen varapuheenjohtajan ja Kiinan toimitusjohtajan Wu Chengyangin mukaan "Kaikki tiedot tulisi sijoittaa yhteen paikkaan. Tällä tavalla kysymyksistä ja tiedusteluista tulee paljon helpompaa."

"Se, mitä useimmat ihmiset tekevät nykyään, on viedä tietokantatiedot tekoälyyn ja sitten ottaa ne pois, mikä usein sisältää tietoturvaongelmia, hallinnan lupaongelmia jne. Oraclen lähestymistapa on tuoda tekoäly tietokantaan ja upottaa vektoritietokanta koko Ei vain vektoreita, vaan fuusiotietokanta, joka voi integroida monenlaisia tietoja, kuten tekstiä, kaavioita ja JSON:ia.Wu Chengyang sanoi.

Li Jia, Oracle Kiinan teknisen konsulttiosaston vanhempi johtaja, jakoi tapauksen TMTpostin kanssa: yritysasiakas siirtyi avoimen lähdekoodin vektoritietokannasta Oracle Fusion Databaseen. Sen takana on kolme keskeistä tekijää:Ensinnäkin, mitä tulee sovellusarkkitehtuuriin, alkuperäinen sovellusarkkitehtuuri sisältää erilaisia teknologiapinoja, ja sen hallinta on erittäin monimutkaista ja tehokkuutta on alhainen. Toiseksi, kun tietoja ja arkkitehtuuria laajennetaan, sitä ei voida integroida olemassa oleviin liiketoimintatietoihin haettu Kokonaislinkin tehokkuus ei usein ole korkea.Li Jian näkemyksen mukaan yhä useammat asiakkaat tekevät tällaisia valintoja, eikä tämä ole enää poikkeus.

"Jotkut asiakkaat asettavat tunnistetiedot MongoDB:hen, käyttöoikeustiedot ja identiteettitiedot MySQL:ään, tietokaaviot kaaviotietokantoihin ja tallentavat sitten vektoritietoja, kuten asiakirjoja, vektoritietokantoihin, mikä vaikeuttaa sovellusten integrointia."

Wu Chengyang huomautti, että muuttoliike itsessään ei ole monimutkaista. Keskeistä on, että asiakkaiden tulee tuntea vertailun kautta, mikä tekninen ratkaisu (fuusio tai muu) on hänelle sopivampi. Asiakkaat pitävät dataa erittäin tärkeänä, mutta ammattimaisia DBA:ita lukuun ottamatta asiakkaat suhtautuvat tietokantoihin usein välinpitämättömästi. Nykypäivän tietokannat eivät puhu erityisen muodikkaista teknisistä termeistä, vaan asiakkaan kokemuksen perusteella päätetään, miten tietokanta tulisi tehdä.

Tätä varten Oracle ehdotti myös, että moderni tietoalusta sisältää "4 Any", eli Anytime, Anywhere, Any Data, Anyone Tavoitteena on yksinkertaistaa tietojen hallintaa, kehitystä ja luomista.

AI for DB siirtyy seuraavaan kilpailujaksoon

Kaiken kaikkiaan Oraclen tekoälystrategia on muotoiltu niiden todellisten skenaarioiden ympärille, joissa yritykset käyttävät tekoälyä, luoden päästä päähän generatiivisen tekoälymatriisin, joka kattaa koko teknologiapinon. Sisältää Oracle Cloud Infrastructure (OCI) -pohjaisen tekoälyinfrastruktuurin rakentamisen, tietokantatuotteet, kuten Oracle Database, Oracle Autonomous Database ja MySQL HeatWave, jotka tarjoavat tietoja tekoälylle, sekä SaaS-sovellukset, kuten ERP, HCM ja CX, joissa on sulautetut generatiiviset tekoälytoiminnot .

Oracle julkaisi äskettäisessä tilikauden talousraportissaan tärkeän tiedon: Pelkästään neljännellä vuosineljänneksellä Oracle allekirjoitti yli 30 tekoälyn myyntisopimusta, joiden yhteisarvo oli yli 12,5 miljardia Yhdysvaltain dollaria, mukaan lukien tärkeä yhteistyö tuodakseen Microsoftin Azure-alusta on laajennettu OCI:lle tukemaan OpenAI:n laskentatehon tarpeita, kuten päättelyä.

Kilpailu suurista malleista on nyt erittäin kovaa. Viime aikoina erilaisten suurten mallituotteiden iteraationopeus on kiihtynyt, mikä asettaa korkeat vaatimukset mallikoulutuksen nopeudelle. Mitä enemmän grafiikkasuorituksia, mitä suurempi tietojoukko, sitä suurempi korpus, sitä vahvemmat infrastruktuuriominaisuudet ovat, sitä lyhyempi koulutusaika ja sitä nopeammin se voi nopeuttaa uusien tuotteiden päivityksiä.

"Tällä hetkellä Oraclen suurin laskentatehoklusteri voi saavuttaa 30 000 korttia, ja mittakaava saattaa olla vielä suurempi tulevaisuudessa, Oraclen Kiinan teknisen konsulttiosaston vanhempi johtaja Ji Xiaofeng huomautti, että OCI on sitoutunut tarjoamaan edistyksellistä tekoälyä alusta alkaen." päivä ja HPC-infrastruktuuri, OracleOlemme erityisesti optimoineet verkon ja rakentaneet häviöttömän verkkojärjestelmän tehdäksemme koko GPU:sta skaalautuvampaa.

OCI Supercluster voi toteuttaa useiden GPU:iden yhteistyön. Samaan aikaan Oracle julkaisee pian tehokkaan tiedostojärjestelmän vastatakseen paremmin asiakkaiden koulutustarpeisiin. Uusien OCI Compute -paljasmetalliesiintymien, erittäin alhaisen latenssin RDMA-verkon ja tehokkaan tallennustilan ansiosta OCI Supercluster on huomattavasti nopeampi. OCI tuo markkinoille NVIDIA B200 -malleja, jotka auttavat yrityksiä vastaamaan AI-mallien kasvavaan kysyntään.

On syytä huomata, että koska Oracle ja NVIDIA ilmoittivat pitkäaikaisesta yhteistyöstä vuonna 2022, ne pyrkivät tuomaan NVIDIAn täydellisen nopeutetun laskentapinon OCI:lle. Nykyään OCI:sta on tullut NVIDIA:n erittäin laajamittainen pilviteknologian toimittaja, joka tarjoaa laajan mittakaavan tekoälyä laskentapalvelut NVIDIA DGX Cloud.

Ji Xiaofeng selitti: "Vaikka MoE-malli on nyt olemassa, laskentatehoa tarvitaan silti päättelyvaiheessa. Oraclen ja NVIDIAn välinen yhteistyö eroaa aiemmasta kumppaneiden yhteistyöstä. Joidenkin ydinpalvelujen toteutuksessa tuote molempien osapuolten osastot tekevät syvää yhteistyötä."

Eräässä mielessä Oracle ei ole enää vain tietokantayhtiö. Viime vuosina investoinnit OCI-, SaaS- ja muille tasoille ovat tehneet Oraclesta todella pilvipalveluyrityksen, kuten Microsoftin ja Googlen. Ymmärtääksemme Oraclen investointilogiikkaa tietokantatasolla emme voi kopioida tietokantateknologiatuotteiden rajoituksia, emmekä voi arvioida Oraclen kehityspolkuja Kiinan markkinoilla kotimaisen korvaamisen näkökulmasta.

Tällä hetkellä 23ai:n julkinen pilviversio on julkaistu, ja paikallinen versio julkaistaan tämän vuoden toisella puoliskolla. Tämä tarkoittaa, että myös kiinalaisten yritysasiakkaiden kynnys käyttää 23ai:ta pienenee huomattavasti.

Viime vuosina Oracle on jatkuvasti korostanut "kaksisyklistä" laajentumislogiikkaa palvelemaan Kiinan ulkomaista laajentumista ja monikansallisten yritysten liiketoimintaa Kiinassa.

(Tämä artikkeli julkaistiin ensimmäisen kerran Titanium Media APP:n kirjoittajassa | Yang Li, toimittaja | Gai Hongda)

uutiset

DB:n tekoäly siirtyy uuteen kilpailusykliin Enterprise Services International Observation |

Johdanto

yhteystietoni