Νέα

Η τεχνητή νοημοσύνη για το DB εισέρχεται σε έναν νέο κύκλο ανταγωνισμού |

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Το AI για DB γίνεται αθόρυβα ένα hot κομμάτι. Ένα από τα πιο σημαντικά χαρακτηριστικά είναι η τεχνολογία διανυσματικής βάσης δεδομένων/ανάκτησης διανυσμάτων που έγινε επιτυχία πέρυσι και είναι ολοένα και πιο δημοφιλής για την εφαρμογή μεγάλων μοντέλων τεχνητής νοημοσύνης.

AI για DB σημαίνει εστίαση στην τεχνητή νοημοσύνη ως υπηρεσία βάσης δεδομένων. Από την άποψη των σημείων πόνου των χρηστών, η παραδοσιακή υποδομή βάσεων δεδομένων δεν έχει σχεδιαστεί για μεγάλα μοντέλα τεχνητής νοημοσύνης, ούτε έχει σχεδιαστεί για να ανταποκρίνεται στη σημερινή ανάκτηση διανυσμάτων.

Για παράδειγμα, όταν οι επιχειρήσεις εφαρμόζουν εφαρμογές μοντέλων μεγάλης κλίμακας, θα χρειαστεί αναπόφευκτα να δημιουργήσουν τεράστια σύνολα δεδομένων Μόνο υψηλής ποιότητας, υψηλής πυκνότητας δεδομένα για να εκπαιδεύσουν μοντέλα μπορούν να επιτύχουν πιο ακριβή αποτελέσματα. Αλλά η απόκτηση και η διαχείριση τόσο μεγάλων ποσοτήτων δεδομένων απαιτεί συχνά πολλούς πόρους, συμπεριλαμβανομένων των πόρων αποθήκευσης, της υπολογιστικής ισχύος και των δυνατοτήτων επεξεργασίας δεδομένων. Ταυτόχρονα, η ενσωμάτωση πηγών δεδομένων με διάφορες μορφές, ποιότητα, ευαισθησία και ετερογένεια θα περιπλέξει επίσης τη διαδικασία εκπαίδευσης του μοντέλου. Αυτός είναι ένας από τους λόγους για τους οποίους οι εταιρείες εξακολουθούν να είναι συγκρατημένα αισιόδοξες σχετικά με τη γενετική τεχνητή νοημοσύνη.

Η TMTpost Media παρατήρησε ότι από πέρυσι, στις αγορές του εξωτερικού, οι κορυφαίες εταιρείες αποθήκευσης βάσεων δεδομένων και ακόμη και μεγάλες εταιρείες μοντέλων υιοθετούν ενεργά εκδόσεις προϊόντων, εξαγορές και συνεργασίες για να εκμεταλλευτούν τις ευκαιρίες της αγοράς σε βάσεις δεδομένων AI. Για παράδειγμα, η εταιρεία αποθήκευσης δεδομένων Cloud Snowflake ανακοίνωσε ότι θα συνεργαστεί με την NVIDIA για την προσαρμογή των μοντέλων τεχνητής νοημοσύνης για επιχειρήσεις που εξαγόρασε η Databricks, η εταιρεία πίσω από την Apache Iceberg, έναντι 1 δισεκατομμυρίου δολαρίων που εξαγόρασε τη Sockset 500 εκατομμύρια δολάρια...

Ωστόσο, από την τρέχουσα άποψη, η ιδέα του συνδυασμού AI και βάσης δεδομένων δεν σχετίζεται μόνο με την ανάκτηση διανύσματος. Τα τελευταία χρόνια, οι αυτόνομες βάσεις δεδομένων, η αυτο-παρακολούθηση και η αυτοδιάγνωση βάσεων δεδομένων, η εισαγωγή χαμηλού κώδικα + AI στο text2SQL, κ.λπ. είναι όλες οι κατευθύνσεις που οι εταιρικοί πελάτες του κλάδου εξακολουθούν να εξερευνούν και δεν έχουν καταλήξει ακόμη σε κάποιο συμπέρασμα.

Ωστόσο, ορισμένοι άνθρωποι του κλάδου προειδοποιούν ότι ο συνδυασμός AI και βάσης δεδομένων εξακολουθεί να είναι μια πολύ νέα τεχνική κατεύθυνση και μπορεί να υπάρχουν τεχνικές ελλείψεις.

Ανεξάρτητα από την τάση της AI για DB, το πρώτο ερώτημα που υπάρχει είναι: γιατί τώρα; Και ποιες είναι οι νέες λύσεις;

Απλοποιήστε την εφαρμογή και χρήση δεδομένων

Πάρτε ως παράδειγμα την Oracle.

Τους τελευταίους δύο μήνες, η Oracle ανακοίνωσε την αναμόρφωση της τεχνητής νοημοσύνης των δύο βασικών συστημάτων διαχείρισης βάσεων δεδομένων της - της βάσης δεδομένων Oracle και της βάσης δεδομένων MySQL HeatWave. Υπάρχει μια προφανής κατεύθυνση από την αλλαγή του ονόματος της βάσης δεδομένων: η πρώτη άλλαξε απευθείας από Database 23c σε Database 23ai, ενώ η δεύτερη αναβαθμίστηκε σε HeatWave GenAI. Οι αλλαγές στις εκδόσεις σε διαφορετικές εποχές από το "i" Internet, το "g" grid, το "c" cloud, το "ai" τεχνητή νοημοσύνη και το γενεσιουργό AI "GenAI" μπορούν να αντικατοπτρίζουν την έντονη γνώση της Oracle σχετικά με τα σημεία αιχμής των απαιτήσεων των πελατών σε διαφορετικές εποχές . Μεταξύ αυτών, η βάση δεδομένων 23ai έχει αναβαθμίσει τη διανυσματική βάση δεδομένων που αναφέρθηκε παραπάνω και περισσότερες από 300 κύριες λειτουργίες.

Οι προγραμματιστές μπορούν να χρησιμοποιήσουν φυσική γλώσσα για να «μιλήσουν» στη βάση δεδομένων της Oracle, να επικαλεστούν τις δυνατότητες της γενετικής τεχνητής νοημοσύνης, να δημιουργήσουν SQL και να εκτελέσουν το τελικό αποτέλεσμα, επιτυγχάνοντας τον σκοπό της συνομιλίας με τη βάση δεδομένων.

Συγκεκριμένα, η λειτουργία Vector Search του 23ai επιτρέπει στο LLM (Large Language Model) να αναζητά δεδομένα ιδιωτικής επιχείρησης χρησιμοποιώντας μια διεπαφή φυσικής γλώσσας και βοηθά το LLM να παρέχει πιο ακριβή και σχετικά αποτελέσματα. Οι πελάτες μπορούν να χρησιμοποιήσουν τη λειτουργία Vector Search για την ασφαλή αναζήτηση εγγράφων, εικόνων και άλλων μη δομημένων δεδομένων σε συνδυασμό με ιδιωτικά επιχειρηματικά δεδομένα χωρίς να χρειάζεται να μετακινήσουν ή να αντιγράψουν τα δεδομένα. Αυτό σημαίνει ότι ο αλγόριθμος AI μπορεί να εισαχθεί στη θέση των δεδομένων χωρίς να χρειάζεται να μεταφέρει τα δεδομένα στη θέση του αλγόριθμου AI, επιτρέποντας την εκτέλεση του AI σε πραγματικό χρόνο στη βάση δεδομένων Oracle, βελτιώνοντας σημαντικά την αποτελεσματικότητα, αποτελεσματικότητα και ασφάλεια της τεχνητής νοημοσύνης.

Το HeatWave GenAI περιλαμβάνει κυρίως LLM εντός βάσης δεδομένων, αυτοματοποιημένη διανυσματική αποθήκευση στη βάση δεδομένων, επεκτάσιμη διανυσματική επεξεργασία και διάλογο με βάση τα συμφραζόμενα σε φυσική γλώσσα που βασίζεται σε μη δομημένο περιεχόμενο. Χρησιμοποιώντας το HeatWave GenAI, οι προγραμματιστές μπορούν να χρησιμοποιήσουν ενσωματωμένα μοντέλα ενσωμάτωσης για να δημιουργήσουν διανυσματικά καταστήματα για μη δομημένο περιεχόμενο επιχειρήσεων με μία μόνο εντολή SQL. Οι χρήστες μπορούν να πραγματοποιήσουν αναζητήσεις φυσικής γλώσσας σε ένα μόνο βήμα χρησιμοποιώντας τη βάση δεδομένων ή το εξωτερικό LLM. Τα δεδομένα δεν χρειάζεται να φύγουν από τη βάση δεδομένων και λόγω της τεράστιας κλίμακας και της εξαιρετικά υψηλής απόδοσης του HeatWave, οι χρήστες δεν χρειάζεται να παρέχουν GPU. Ως αποτέλεσμα, οι προγραμματιστές μπορούν να μειώσουν την πολυπλοκότητα της εφαρμογής, να βελτιώσουν την απόδοση, να βελτιώσουν την ασφάλεια των δεδομένων και να μειώσουν το κόστος.

Δεν είναι δύσκολο να καταλάβει κανείς ότι η ιδέα της Oracle είναι να παρέχει μια ενοποιημένη λειτουργική πλατφόρμα για τεχνητή νοημοσύνη και δεδομένα, η οποία έρχεται σε έντονη αντίθεση με άλλα προϊόντα βάσης δεδομένων.

Για παράδειγμα, η δυνατότητα LLM εντός της βάσης δεδομένων επιτρέπει στους χρήστες να εκτελούν τις εργασίες που απαιτούνται για την ανάπτυξη μοντέλων και εφαρμογών χωρίς να χρειάζεται να εξάγουν δεδομένα σε ένα δυνητικά μη ασφαλές περιβάλλον ή να εισάγουν ένα δυνητικά μη ασφαλές LLM στο περιβάλλον δεδομένων τους. Δεδομένου ότι δεν υπάρχει ανάγκη εξαγωγής ή εισαγωγής, δεν υπάρχει κόστος που συνήθως σχετίζεται με την εξαγωγή μεγάλων ποσοτήτων δεδομένων ή την εισαγωγή μεγάλων ποσοτήτων διανυσματικής αποθήκευσης στη βάση δεδομένων εξαλείφει την ανάγκη για τους χρήστες να μετακινούν δεδομένα σε ξεχωριστή διανυσματική βάση δεδομένων απαιτούν τεχνογνωσία τεχνητής νοημοσύνης.

Όσον αφορά τις διανυσματικές βάσεις δεδομένων που προκαλούν ανησυχία στον κλάδο, η Titanium Media έχει αναλύσει προηγουμένως ότι εάν οι κατασκευαστές βάσεων δεδομένων δεν αναπτύξουν ανεξάρτητα διανυσματικές βάσεις δεδομένων, βασικά θα υποστηρίξουν την υποστήριξη εγγενών διανυσματικών ενσωματώσεων λέξεων και διανυσματικών μηχανών αναζήτησης.

Επί του παρόντος, η 23ai περνά επίσης από την αυτοπιστοποίηση προϊόντος:Η ανάκτηση διανύσματος θα πρέπει να είναι μια ενσωματωμένη δυνατότητα της βάσης δεδομένων, όχι ένα αυτόνομο προϊόν. Η αναζήτηση ενός συνδυασμού επιχειρηματικών και σημασιολογικών δεδομένων είναι ευκολότερη, ταχύτερη και ακριβέστερη εάν και οι δύο τύποι δεδομένων διαχειρίζονται από μια ενιαία βάση δεδομένων. Η λύση που υποστηρίζει αυτή τη διαδρομή είναι μια βάση δεδομένων που μπορεί να διαχειρίζεται όλα τα δεδομένα και να τα διαχειρίζεται με υψηλή απόδοση και πολύ οικονομικό τρόπο. Κατά την άποψη του Wu Chengyang, αντιπροέδρου της Oracle και διευθύνοντος συμβούλου της Κίνας, "Όλα τα δεδομένα πρέπει να τοποθετούνται σε ένα μέρος. Με αυτόν τον τρόπο, οι ερωτήσεις και οι ερωτήσεις θα γίνουν πολύ πιο εύκολες."

«Αυτό που κάνουν οι περισσότεροι σήμερα είναι να μεταφέρουν τα δεδομένα της βάσης δεδομένων στο AI και μετά να τα αφαιρέσουν, κάτι που συχνά περιλαμβάνει ζητήματα ασφάλειας δεδομένων, ζητήματα αδειών διαχείρισης κ.λπ. Η προσέγγιση της Oracle είναι να φέρει την τεχνητή νοημοσύνη στη βάση δεδομένων και να ενσωματώσει τη διανυσματική βάση δεδομένων στο σύνολο Όχι μόνο διανύσματα, αλλά μια βάση δεδομένων σύντηξης που μπορεί να ενσωματώσει πολλούς τύπους δεδομένων, όπως κείμενο, γραφήματα και JSON.είπε ο Γου Τσενγκγιάνγκ.

Ο Li Jia, ανώτερος διευθυντής του Τμήματος Τεχνικών Συμβούλων της Oracle China, μοιράστηκε μια υπόθεση με την TMTpost: ένας εταιρικός πελάτης μετέφερε από μια διανυσματική βάση δεδομένων ανοιχτού κώδικα στη βάση δεδομένων Oracle Fusion. Υπάρχουν τρεις βασικοί κινητήριοι παράγοντες πίσω από αυτό:Πρώτον, όσον αφορά την αρχιτεκτονική εφαρμογών, η αρχική αρχιτεκτονική εφαρμογών περιλαμβάνει διαφορετικές στοίβες τεχνολογίας και έχει υψηλή πολυπλοκότητα διαχείρισης και χαμηλή απόδοση, δεύτερον, υπάρχουν προβλήματα απόδοσης όταν επεκτείνονται τα δεδομένα και η αρχιτεκτονική ανακτήθηκε Η αποτελεσματικότητα της συνολικής σύνδεσης συχνά δεν είναι υψηλή.Κατά την άποψη του Li Jia, όλο και περισσότεροι πελάτες κάνουν τέτοιες επιλογές και αυτό δεν αποτελεί πλέον εξαίρεση.

"Ορισμένοι πελάτες τοποθετούν πληροφορίες ετικετών στο MongoDB, πληροφορίες αδειών και πληροφορίες ταυτότητας στο MySQL, γραφήματα γνώσης σε βάσεις δεδομένων γραφημάτων και στη συνέχεια αποθηκεύουν διανυσματικά δεδομένα, όπως έγγραφα σε διανυσματικές βάσεις δεδομένων, γεγονός που καθιστά δύσκολη την ενοποίηση εφαρμογών."

Ο Wu Chengyang επεσήμανε ότι η ίδια η μετανάστευση δεν είναι περίπλοκη. Το κλειδί είναι ότι οι πελάτες πρέπει να αισθάνονται μέσω της σύγκρισης ποια τεχνική λύση (fusion ή άλλη) θα είναι πιο κατάλληλη για αυτούς. Οι πελάτες πιστεύουν ότι τα δεδομένα είναι πολύ σημαντικά, αλλά εκτός από τα επαγγελματικά DBA, οι πελάτες συχνά αδιαφορούν για τις βάσεις δεδομένων. Οι σημερινές βάσεις δεδομένων δεν μιλούν για ιδιαίτερα μοντέρνους τεχνικούς όρους, αλλά χρησιμοποιούν την εμπειρία του πελάτη για να καθορίσουν πώς πρέπει να γίνει η βάση δεδομένων.

Για το σκοπό αυτό, η Oracle πρότεινε επίσης ότι η σύγχρονη πλατφόρμα δεδομένων περιλαμβάνει "4 Any", δηλαδή Anytime, Anywhere, Any Data, Anyone. Ο στόχος είναι να απλοποιηθεί η διαχείριση, η ανάπτυξη και η παραγωγή δεδομένων.

Το AI for DB μπαίνει στον επόμενο κύκλο διαγωνισμών

Συνολικά, η στρατηγική AI της Oracle διατυπώνεται γύρω από τα πραγματικά σενάρια στα οποία οι επιχειρήσεις χρησιμοποιούν την τεχνητή νοημοσύνη, δημιουργώντας μια μήτρα τεχνητής νοημοσύνης από άκρο σε άκρο που καλύπτει ολόκληρη τη στοίβα τεχνολογίας. Συμπεριλαμβανομένης της υποστήριξης κατασκευής υποδομής AI που βασίζεται στο Oracle Cloud Infrastructure (OCI), προϊόντων βάσης δεδομένων όπως η Oracle Database, η Oracle Autonomous Database και η MySQL HeatWave που παρέχουν δεδομένα για AI, καθώς και εφαρμογές SaaS όπως ERP, HCM και CX με ενσωματωμένες λειτουργίες παραγωγής AI .

Στην πρόσφατη οικονομική έκθεσή της, η Oracle δημοσίευσε μια σημαντική πληροφορία: Μόνο το τέταρτο τρίμηνο, η Oracle υπέγραψε περισσότερα από 30 συμβόλαια πωλήσεων AI συνολικής αξίας άνω των 12,5 δισεκατομμυρίων δολαρίων ΗΠΑ, συμπεριλαμβανομένης μιας σημαντικής συνεργασίας για να φέρει τη Microsoft Η πλατφόρμα Azure έχει επεκταθεί στο OCI για να υποστηρίξει τις ανάγκες του OpenAI για υπολογιστική ισχύ, όπως η συλλογιστική.

Ο ανταγωνισμός για μεγάλα μοντέλα είναι πολύ σκληρός τώρα Πρόσφατα, η ταχύτητα επανάληψης διαφόρων προϊόντων μεγάλων μοντέλων έχει επιταχυνθεί σημαντικά, γεγονός που θα προβάλει υψηλές απαιτήσεις για την ταχύτητα εκπαίδευσης μοντέλων. Όσο περισσότερες GPU, όσο μεγαλύτερο είναι το σύνολο δεδομένων, τόσο μεγαλύτερο το σώμα, τόσο ισχυρότερες είναι οι δυνατότητες υποδομής που παρέχονται, τόσο μικρότερος είναι ο χρόνος εκπαίδευσης και τόσο πιο γρήγορα μπορεί να αυξηθεί η ταχύτητα των ενημερώσεων νέων προϊόντων.

«Αυτή τη στιγμή, το μεγαλύτερο σύμπλεγμα υπολογιστικής ισχύος της Oracle μπορεί να φτάσει τις 30.000 κάρτες και η κλίμακα μπορεί να είναι ακόμη μεγαλύτερη στο μέλλον, ο ανώτερος διευθυντής του τμήματος τεχνικών συμβούλων της Oracle στην Κίνα, επεσήμανε ότι η OCI έχει δεσμευτεί να παρέχει προηγμένη τεχνητή νοημοσύνη από την πρώτη στιγμή». ημέρα και υποδομή HPC, OracleΈχουμε βελτιστοποιήσει ειδικά το δίκτυο και δημιουργήσαμε ένα σύστημα δικτύου χωρίς απώλειες για να κάνουμε ολόκληρη την GPU πιο επεκτάσιμη.

Το OCI Supercluster μπορεί να πραγματοποιήσει τη συλλογική εργασία πολλών GPU Ταυτόχρονα, η Oracle θα κυκλοφορήσει σύντομα ένα σύστημα αρχείων υψηλής απόδοσης για να καλύψει καλύτερα τις εκπαιδευτικές ανάγκες των πελατών. Με νέα στιγμιότυπα γυμνού μετάλλου OCI Compute, δικτύωση RDMA εξαιρετικά χαμηλής καθυστέρησης και αποθήκευση υψηλής απόδοσης, το OCI Supercluster θα είναι σημαντικά πιο γρήγορο. Η OCI θα λανσάρει μοντέλα χρησιμοποιώντας το NVIDIA B200 για να μεγιστοποιήσει τη βοήθεια των επιχειρήσεων να ανταποκριθούν στην αυξανόμενη ζήτηση για μοντέλα τεχνητής νοημοσύνης.

Αξίζει να σημειωθεί ότι από τη στιγμή που η Oracle και η NVIDIA ανακοίνωσαν μια μακροπρόθεσμη συνεργασία το 2022, στοχεύουν να εισαγάγουν την πλήρη στοίβα υπολογιστών επιτάχυνσης της NVIDIA στην OCI Σήμερα, η OCI έχει γίνει ο πάροχος τεχνολογίας νέφους εξαιρετικά μεγάλης κλίμακας της NVIDIA, παρέχοντας τεχνητή νοημοσύνη μεγάλης κλίμακας. Υπηρεσίες υπολογιστών NVIDIA DGX Cloud.

Ο Ji Xiaofeng εξήγησε: "Αν και υπάρχει τώρα ένα μοντέλο MoE, απαιτείται ακόμη μεγάλη υπολογιστική ισχύς στο στάδιο του συμπερασμάτων. Η συνεργασία μεταξύ Oracle και NVIDIA είναι διαφορετική από την προηγούμενη συνεργασία μεταξύ συνεργατών. Κατά την υλοποίηση ορισμένων βασικών υπηρεσιών, το προϊόν Τα τμήματα και των δύο πλευρών έχουν βαθιά συνεργασία».

Κατά μία έννοια, η Oracle δεν είναι πλέον απλώς μια εταιρεία βάσεων δεδομένων. Τα τελευταία χρόνια, οι επενδύσεις σε OCI, SaaS και άλλα επίπεδα έχουν κάνει την Oracle να γίνει πραγματικά μια εταιρεία cloud computing όπως η Microsoft και η Google. Επομένως, για να κατανοήσουμε την επενδυτική λογική της Oracle σε επίπεδο βάσης δεδομένων, δεν μπορούμε να αντιγράψουμε τους περιορισμούς των προϊόντων τεχνολογίας βάσεων δεδομένων, ούτε μπορούμε να κρίνουμε τις περισσότερες διαδρομές ανάπτυξης της Oracle στην κινεζική αγορά από την προοπτική της εγχώριας υποκατάστασης.

Προς το παρόν, η έκδοση του 23ai για το δημόσιο cloud έχει κυκλοφορήσει και μια τοπική έκδοση αναμένεται να κυκλοφορήσει το δεύτερο εξάμηνο του τρέχοντος έτους. Αυτό σημαίνει ότι το όριο για τους Κινέζους εταιρικούς πελάτες να χρησιμοποιούν το 23ai θα μειωθεί επίσης σημαντικά.

Τα τελευταία χρόνια, η Oracle τονίζει συνεχώς τη λογική επέκτασης του "διπλού κύκλου" της εξυπηρέτησης της επέκτασης της Κίνας στο εξωτερικό και η συνεργασία της Oracle με Κινέζους εταιρικούς πελάτες ανανεώνει την κατανόησή της για τις απαιτήσεις των χρηστών.

(Αυτό το άρθρο δημοσιεύτηκε για πρώτη φορά στο Titanium Media APP Συγγραφέας | Yang Li, Editor | Gai Hongda)