berita

AI untuk DB memasuki siklus kompetisi baru |. Pengamatan Internasional Layanan Perusahaan

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


AI untuk DB diam-diam menjadi jalur yang populer. Salah satu fitur yang paling signifikan adalah teknologi pengambilan basis data/vektor vektor yang populer tahun lalu, dan semakin populer untuk penerapan model AI berukuran besar.

AI untuk DB berarti berfokus pada AI sebagai layanan database. Dari perspektif permasalahan pengguna, infrastruktur database tradisional tidak dirancang untuk model AI berukuran besar, juga tidak dirancang untuk memenuhi pengambilan vektor saat ini.

Misalnya, ketika perusahaan menerapkan aplikasi model skala besar, mereka pasti perlu membangun kumpulan data yang besar. Hanya data berkualitas tinggi dan kepadatan tinggi untuk melatih model yang dapat mencapai hasil yang lebih akurat. Namun memperoleh dan mengelola data dalam jumlah besar seringkali memerlukan banyak sumber daya, termasuk sumber daya penyimpanan, daya komputasi, dan kemampuan pemrosesan data. Pada saat yang sama, mengintegrasikan sumber data dengan berbagai format, kualitas, granularitas, dan heterogenitas juga akan mempersulit proses pelatihan model. Inilah salah satu alasan mengapa perusahaan masih optimis terhadap AI generatif.

TMTpost Media telah memperhatikan bahwa sejak tahun lalu, di pasar luar negeri, perusahaan database/gudang data terkemuka dan bahkan perusahaan model besar telah secara aktif mengadopsi peluncuran produk, akuisisi, dan kerja sama untuk meraih peluang pasar dalam database AI. Misalnya, perusahaan gudang data cloud Snowflake mengumumkan bahwa mereka akan bekerja sama dengan NVIDIA untuk menyesuaikan model AI untuk perusahaan; Databricks mengakuisisi Tabular, perusahaan di balik Apache Iceberg, senilai US$1 miliar, mengakuisisi Sockset, sebuah perusahaan database dengan teknologi pengambilan vektor, untuk US$500 juta...

Namun, dari sudut pandang saat ini, gagasan menggabungkan AI dan database tidak hanya terkait dengan pengambilan vektor saja. Dalam beberapa tahun terakhir, database otonom, pemantauan mandiri database dan diagnosis mandiri, pengenalan kode rendah + AI ke text2SQL, dll. merupakan arah yang masih dieksplorasi oleh pelanggan perusahaan di industri ini dan belum mencapai kesimpulan.

Namun, beberapa orang di industri ini memperingatkan bahwa kombinasi AI dan database masih merupakan arah teknis yang sangat baru, dan mungkin terdapat kekurangan teknis.

Terlepas dari tren AI untuk DB, pertanyaan pertama yang muncul adalah: mengapa sekarang? Dan apa solusi barunya?

Sederhanakan aplikasi dan penggunaan data

Ambil Oracle sebagai contoh.

Dalam dua bulan terakhir, Oracle telah mengumumkan perubahan AI pada dua sistem manajemen basis data intinya-Oracle Database dan database MySQL HeatWave. Ada arah yang jelas dari perubahan nama databasenya: yang pertama langsung diubah dari Database 23c menjadi Database 23ai, sedangkan yang kedua ditingkatkan menjadi HeatWave GenAI. Perubahan versi di berbagai era mulai dari Internet "i", grid "g", cloud "c", kecerdasan buatan "ai", dan AI generatif "GenAI" dapat mencerminkan wawasan tajam Oracle mengenai titik kritis permintaan pelanggan di berbagai era. . Diantaranya, Database 23ai telah meningkatkan database vektor yang disebutkan di atas dan lebih dari 300 fungsi utama.

Pengembang dapat menggunakan bahasa alami untuk "berbicara" dengan database Oracle, menggunakan kemampuan AI generatif, menghasilkan SQL, dan mengeksekusi hasil akhir, sehingga mencapai tujuan berbicara dengan database.

Secara khusus, fungsi Pencarian Vektor 23ai memungkinkan LLM (Model Bahasa Besar) untuk menanyakan data bisnis pribadi menggunakan antarmuka bahasa alami, dan membantu LLM memberikan hasil yang lebih akurat dan relevan. Pelanggan dapat menggunakan fitur Pencarian Vektor untuk mencari dokumen, gambar, dan data tidak terstruktur lainnya dengan aman bersama dengan data bisnis pribadi tanpa harus memindahkan atau menyalin data tersebut. Ini berarti bahwa algoritma AI dapat diperkenalkan ke lokasi data tanpa harus memigrasikan data ke lokasi algoritma AI, memungkinkan berjalannya AI secara real-time di database Oracle, sangat meningkatkan efektivitas, efisiensi dan keamanan AI.

HeatWave GenAI terutama mencakup LLM dalam basis data, penyimpanan vektor dalam basis data otomatis, pemrosesan vektor yang dapat diskalakan, dan dialog kontekstual bahasa alami berdasarkan konten tidak terstruktur. Dengan menggunakan HeatWave GenAI, pengembang dapat menggunakan model penyematan bawaan untuk membuat penyimpanan vektor untuk konten tidak terstruktur perusahaan dengan satu perintah SQL. Pengguna dapat melakukan pencarian bahasa alami dalam satu langkah menggunakan LLM dalam database atau eksternal. Data tidak harus keluar dari database, dan karena skala besar HeatWave dan kinerja ultra-tinggi, pengguna tidak perlu menyediakan GPU. Hasilnya, pengembang dapat mengurangi kompleksitas aplikasi, meningkatkan kinerja, meningkatkan keamanan data, dan mengurangi biaya.

Tidak sulit untuk melihat bahwa ide Oracle adalah menyediakan platform operasi terpadu untuk AI dan data, yang sangat berbeda dengan produk database lainnya.

Misalnya, kemampuan LLM dalam database memungkinkan pengguna melakukan tugas yang diperlukan untuk mengembangkan model dan aplikasi tanpa harus mengekspor data ke lingkungan yang berpotensi tidak aman atau mengimpor LLM yang berpotensi tidak aman ke dalam lingkungan data mereka. Karena tidak perlu mengekspor atau mengimpor, tidak ada biaya yang biasanya terkait dengan mengekspor data dalam jumlah besar atau mengimpor LLM dalam jumlah besar; penyimpanan vektor dalam basis data menghilangkan kebutuhan pengguna untuk memindahkan data ke basis data vektor terpisah dan tidak memerlukannya membutuhkan keahlian AI.

Mengenai database vektor yang menjadi perhatian industri, Titanium Media sebelumnya telah menganalisis bahwa jika produsen database tidak mengembangkan database vektor secara mandiri, mereka pada dasarnya akan menganjurkan dukungan untuk penyematan kata vektor asli dan mesin pencari vektor.

Saat ini, 23ai juga sedang menjalani sertifikasi mandiri produk:Pengambilan vektor harus merupakan kemampuan bawaan dari database, bukan produk yang berdiri sendiri. Pencarian kombinasi data bisnis dan semantik menjadi lebih mudah, cepat, dan tepat jika kedua jenis data tersebut dikelola oleh satu database. Solusi yang mendukung jalur ini adalah database yang dapat mengelola seluruh data, dan mengelolanya dengan performa tinggi dan sangat ekonomis. Dalam pandangan Wu Chengyang, wakil presiden Oracle dan direktur pelaksana Tiongkok, "Semua data harus ditempatkan di satu tempat. Dengan cara ini, pertanyaan dan pertanyaan akan menjadi lebih mudah."

“Apa yang dilakukan kebanyakan orang saat ini adalah membawa data database ke AI dan kemudian mengeluarkannya, yang sering kali melibatkan masalah keamanan data, masalah izin manajemen, dll. Pendekatan Oracle adalah menghadirkan AI ke dalam database dan menyematkan database vektor ke dalam keseluruhan. Bukan hanya vektor, tetapi database fusi yang dapat mengintegrasikan berbagai jenis data seperti teks, grafik, dan JSON. Hanya Oracle yang dapat melakukan ini.”kata Wu Chengyang.

Li Jia, direktur senior Departemen Konsultasi Teknis Oracle China, berbagi kasus dengan TMTpost: pelanggan perusahaan bermigrasi dari database vektor sumber terbuka ke Oracle Fusion Database. Ada tiga faktor pendorong utama di baliknya:Pertama, dalam hal arsitektur aplikasi, arsitektur aplikasi asli melibatkan tumpukan teknologi yang berbeda, dan memiliki kompleksitas manajemen yang tinggi dan efisiensi yang rendah; kedua, terdapat masalah kinerja ketika data dan arsitektur diperluas, ketiga, tidak dapat diintegrasikan dengan data bisnis yang ada dan diambil Efisiensi keseluruhan tautan seringkali tidak tinggi.Dalam pandangan Li Jia, semakin banyak pelanggan yang membuat pilihan seperti itu, dan ini tidak terkecuali.

"Beberapa pelanggan memasukkan informasi tag di MongoDB, informasi izin dan informasi identitas di MySQL, grafik pengetahuan di database grafik, dan kemudian menyimpan data vektor seperti dokumen di database vektor, sehingga menyulitkan integrasi aplikasi Li Jia express."

Wu Chengyang menekankan bahwa migrasi itu sendiri tidaklah rumit. Kuncinya adalah pelanggan perlu merasakan melalui perbandingan solusi teknis mana (fusi atau lainnya) yang lebih cocok untuk mereka. Pelanggan menganggap data sangat penting, tetapi kecuali DBA profesional, pelanggan sering kali tidak peduli dengan database. Basis data saat ini tidak berbicara tentang istilah-istilah teknis yang modis, namun menggunakan pengalaman pelanggan untuk menentukan bagaimana basis data harus dilakukan.

Untuk tujuan ini, Oracle juga mengusulkan agar platform data modern mencakup "4 Apa Saja", yaitu Kapan Saja, Di Mana Saja, Data Apa Pun, Siapa Saja. Tujuannya adalah untuk menyederhanakan pengelolaan, pengembangan, dan pembuatan data.

AI untuk DB memasuki siklus kompetisi berikutnya

Secara keseluruhan, strategi AI Oracle dirumuskan berdasarkan skenario aktual di mana perusahaan menggunakan AI, menciptakan matriks AI generatif end-to-end yang mencakup keseluruhan teknologi. Termasuk dukungan pembangunan infrastruktur AI berbasis Oracle Cloud Infrastructure (OCI), produk database seperti Oracle Database, Oracle Autonomous Database, dan MySQL HeatWave yang menyediakan data untuk AI, serta aplikasi SaaS seperti ERP, HCM, dan CX dengan fungsi AI generatif yang tertanam. .

Dalam laporan keuangan tahun fiskal baru-baru ini, Oracle merilis informasi penting: Pada kuartal keempat saja, Oracle menandatangani lebih dari 30 kontrak penjualan AI dengan nilai total lebih dari 12,5 miliar dolar AS, termasuk kerja sama penting untuk menghadirkan Microsoft The Platform Azure telah diperluas ke OCI untuk mendukung kebutuhan OpenAI akan daya komputasi seperti penalaran.

Persaingan untuk model besar saat ini sangat ketat. Akhir-akhir ini, kecepatan iterasi berbagai produk model besar telah dipercepat secara signifikan, yang akan menuntut kecepatan pelatihan model yang tinggi. Semakin banyak GPU, semakin besar kumpulan datanya, semakin besar korpusnya, semakin kuat kemampuan infrastruktur yang disediakan, semakin singkat waktu pelatihannya, dan semakin cepat pula kecepatan pembaruan produk baru dapat ditingkatkan.

“Saat ini cluster daya komputasi terbesar Oracle dapat mencapai 30.000 kartu, dan skalanya mungkin akan lebih besar lagi di masa depan.” Ji Xiaofeng, direktur senior Departemen Konsultasi Teknis Oracle di Tiongkok, menunjukkan bahwa OCI telah berkomitmen untuk menyediakan AI tingkat lanjut sejak awal. hari dan infrastruktur HPC, OracleKami telah mengoptimalkan jaringan secara khusus dan membangun sistem jaringan lossless untuk membuat keseluruhan GPU lebih skalabel.

OCI Supercluster dapat mewujudkan kerja kolaboratif beberapa GPU. Pada saat yang sama, Oracle akan segera merilis sistem file berkinerja tinggi untuk lebih memenuhi kebutuhan pelatihan pelanggan. Dengan instans bare metal OCI Compute yang baru, jaringan RDMA dengan latensi sangat rendah, dan penyimpanan berkinerja tinggi, OCI Supercluster akan jauh lebih cepat. OCI akan meluncurkan model menggunakan NVIDIA B200 untuk memaksimalkan bantuan perusahaan dalam menanggapi permintaan model AI yang terus meningkat.

Perlu dicatat bahwa sejak Oracle dan NVIDIA mengumumkan kerja sama jangka panjang pada tahun 2022, mereka bertujuan untuk memperkenalkan tumpukan komputasi akselerasi lengkap NVIDIA ke OCI. Saat ini, OCI telah menjadi penyedia teknologi cloud berskala ultra besar milik NVIDIA, yang menyediakan AI berskala besar layanan komputasi NVIDIA DGX Cloud.

Ji Xiaofeng menjelaskan: "Meskipun sekarang ada model MoE, banyak daya komputasi yang masih dibutuhkan dalam tahap inferensi. Kerja sama antara Oracle dan NVIDIA berbeda dengan kerja sama antar mitra sebelumnya. Dalam implementasi beberapa layanan inti, produk departemen di kedua belah pihak memiliki kolaborasi yang mendalam.”

Dalam arti tertentu, Oracle bukan lagi sekedar perusahaan database. Dalam beberapa tahun terakhir, investasi di OCI, SaaS, dan level lainnya telah menjadikan Oracle benar-benar menjadi perusahaan komputasi awan seperti Microsoft dan Google. Oleh karena itu, untuk memahami logika investasi Oracle di tingkat basis data, kami tidak dapat meniru keterbatasan produk teknologi basis data, kami juga tidak dapat menilai jalur pengembangan Oracle di pasar Cina dari perspektif substitusi domestik.

Saat ini, 23ai versi cloud publik telah diluncurkan, dan versi lokal diharapkan akan diluncurkan pada paruh kedua tahun ini. Artinya, ambang batas bagi pelanggan perusahaan Tiongkok untuk menggunakan 23ai juga akan sangat berkurang.

Dalam beberapa tahun terakhir, Oracle terus menekankan logika ekspansi "siklus ganda" dalam melayani ekspansi luar negeri Tiongkok dan bisnis perusahaan multinasional di Tiongkok. Kerja sama Oracle dengan pelanggan korporat Tiongkok juga menyegarkan pemahamannya tentang permintaan pengguna.

(Artikel ini pertama kali diterbitkan di Titanium Media APP Penulis | Yang Li, Editor | Gai Hongda)