νέα

η google ai λανσάρει το πλαίσιο αξιολόγησης cardbench: περιλαμβάνει 20 πραγματικές βάσεις δεδομένων για πιο ολοκληρωμένη αξιολόγηση μοντέλων εκτίμησης καρδιναικότητας

2024-09-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

το it house ανέφερε στις 3 σεπτεμβρίου ότι οι ερευνητές της google ai κυκλοφόρησαν πρόσφατα το σημείο αναφοράς cardbench, το οποίο ανταποκρίνεται κυρίως στις ανάγκες του πλαισίου αξιολόγησης συστήματος για την εκτίμηση της καρδιαλικότητας μάθησης.

το σημείο αναφοράς cardbench είναι ένα ολοκληρωμένο πλαίσιο αξιολόγησης που περιλαμβάνει χιλιάδες ερωτήματα σε 20 διαφορετικές βάσεις δεδομένων του πραγματικού κόσμου, υπερβαίνοντας σημαντικά κάθε προηγούμενο σημείο αναφοράς.

υπόβαθρο έργου

η εκτίμηση καρδιναλότητας (ce) είναι το κλειδί για τη βελτιστοποίηση της απόδοσης ερωτημάτων των σχεσιακών βάσεων δεδομένων. περιλαμβάνει την πρόβλεψη του αριθμού των ενδιάμεσων αποτελεσμάτων που θα εμφανίσει ένα ερώτημα βάσης δεδομένων και επηρεάζει άμεσα την επιλογή του σχεδίου εκτέλεσης του βελτιστοποιητή ερωτημάτων.

οι ακριβείς εκτιμήσεις εμβάπτισης είναι κρίσιμες για την επιλογή αποτελεσματικών αλληλουχιών σύνδεσης, την απόφαση για χρήση ευρετηρίων και την επιλογή της καλύτερης μεθόδου σύνδεσης.

αυτές οι αποφάσεις μπορούν να έχουν σημαντικό αντίκτυπο στον χρόνο εκτέλεσης του ερωτήματος και στη συνολική απόδοση της βάσης δεδομένων. οι ανακριβείς εκτιμήσεις μπορεί να οδηγήσουν σε κακά σχέδια εκτέλεσης που μειώνουν σημαντικά την απόδοση, μερικές φορές κατά τάξεις μεγέθους.

οι τεχνικές εκτίμησης καρδιναλότητας που χρησιμοποιούνται ευρέως στα σύγχρονα συστήματα βάσεων δεδομένων βασίζονται σε ευρετικές μεθόδους και απλουστευμένα μοντέλα, όπως η υπόθεση ομοιόμορφων δεδομένων και ανεξάρτητων στηλών.

αν και αυτές οι μέθοδοι είναι υπολογιστικά αποδοτικές, συχνά απαιτούν ακριβή πρόβλεψη καρδιαλικότητας, ειδικά σε πολύπλοκα ερωτήματα που περιλαμβάνουν πολλούς πίνακες και φίλτρα.

οι πιο πρόσφατες μέθοδοι που βασίζονται σε δεδομένα προσπαθούν να μοντελοποιήσουν την κατανομή δεδομένων εντός και μεταξύ των πινάκων χωρίς να εκτελούν ερωτήματα, μειώνοντας έτσι κάποια γενικά έξοδα, αλλά εξακολουθούν να απαιτούν επανεκπαίδευση όταν αλλάζουν τα δεδομένα.

παρά αυτές τις προόδους, η έλλειψη ολοκληρωμένων σημείων αναφοράς καθιστά δύσκολη τη σύγκριση διαφορετικών μοντέλων και την αξιολόγηση της γενίκευσής τους σε διαφορετικά σύνολα δεδομένων.

cardbench

το cardbench επιτρέπει μια πιο ολοκληρωμένη αξιολόγηση των μοντέλων μαθησιακής καρδιαλικότητας υπό διάφορες συνθήκες. το σημείο αναφοράς υποστηρίζει τρεις βασικές ρυθμίσεις:

μοντέλα που βασίζονται σε παραδείγματα, δηλαδή εκπαιδευμένα σε ένα ενιαίο σύνολο δεδομένων.

το μοντέλο μηδενικού σημείου εκπαιδεύεται εκ των προτέρων σε πολλαπλά σύνολα δεδομένων και στη συνέχεια δοκιμάζεται σε ένα αόρατο σύνολο δεδομένων.

βελτιστοποιήστε το μοντέλο, δηλαδή εκπαιδεύστε το εκ των προτέρων και, στη συνέχεια, βελτιστοποιήστε το χρησιμοποιώντας μια μικρή ποσότητα δεδομένων από το σύνολο δεδομένων στόχου.

το σημείο αναφοράς παρέχει δύο σετ δεδομένων εκπαίδευσης: ένα για ένα ερώτημα μεμονωμένου πίνακα με πολλαπλά κατηγορήματα φίλτρων και ένα για ένα ερώτημα δυαδικής σύνδεσης που περιλαμβάνει δύο πίνακες.

το σημείο αναφοράς περιλαμβάνει 9125 ερωτήματα ενός πίνακα και 8454 δυαδικά ερωτήματα σύνδεσης σε ένα από τα μικρότερα σύνολα δεδομένων, διασφαλίζοντας ένα ισχυρό και απαιτητικό περιβάλλον για την αξιολόγηση μοντέλων.

για παράδειγμα, το μοντέλο νευρωνικού δικτύου με λεπτομέρεια γραφήματος (gnn) έχει διάμεσο q-σφάλμα 1,32 και 95ο εκατοστημόριο 120 σε ερωτήματα δυαδικής σύνδεσης, το οποίο είναι σημαντικά καλύτερο από το μοντέλο μηδενικού σημείου. τα αποτελέσματα δείχνουν ότι η τελειοποίηση του προεκπαιδευμένου μοντέλου μπορεί να βελτιώσει σημαντικά την απόδοσή του ακόμη και για 500 ερωτήματα. αυτό τα καθιστά εφικτά για πρακτικές εφαρμογές όπου τα δεδομένα εκπαίδευσης είναι περιορισμένα.

συνοπτικά, το cardbench αντιπροσωπεύει μια σημαντική πρόοδο στην εκτίμηση της μαθημένης καρδιαλικότητας. οι ερευνητές μπορούν να διευκολύνουν την περαιτέρω καινοτομία σε αυτόν τον κρίσιμο τομέα παρέχοντας ολοκληρωμένα και ποικίλα σημεία αναφοράς για τη συστηματική αξιολόγηση και σύγκριση διαφορετικών μοντέλων ce.αυτό το σημείο αναφοράς επιτρέπει τη βελτίωση των μοντέλων που απαιτούν λιγότερα δεδομένα και χρόνο εκπαίδευσης,παρέχει μια πρακτική λύση για πρακτικές εφαρμογές όπου η εκπαίδευση νέων μοντέλων είναι πολύ ακριβή.