ακόμα παλεύετε με ξόρκια ai; το πανεπιστήμιο του πεκίνου-baichuan έχει αναπτύξει ένα σύστημα μηχανικής αυτόματης υπενθύμισης pas

2024-09-10

η στήλη aixiv είναι μια στήλη όπου το machine heart δημοσιεύει ακαδημαϊκό και τεχνικό περιεχόμενο. τα τελευταία χρόνια, η στήλη heart of the machine aixiv έχει λάβει περισσότερες από 2.000 αναφορές, που καλύπτουν κορυφαία εργαστήρια από μεγάλα πανεπιστήμια και εταιρείες σε όλο τον κόσμο, προωθώντας αποτελεσματικά τις ακαδημαϊκές ανταλλαγές και τη διάδοση. εάν έχετε εξαιρετική δουλειά που θέλετε να μοιραστείτε, μη διστάσετε να συνεισφέρετε ή να επικοινωνήσετε μαζί μας για αναφορά. email υποβολής: [email protected], [email protected]

ο zheng miao, ο πρώτος συγγραφέας της εργασίας, είναι από την ομάδα ευθυγράμμισης του baichuan, με επικεφαλής τον zhou zenan. τα ερευνητικά του ενδιαφέροντα περιλαμβάνουν μεγάλα γλωσσικά μοντέλα, πολλαπλή μάθηση και όραμα υπολογιστή έργα όπως το mmflow. ο συν-πρώτος συγγραφέας liang hao είναι διδακτορικός φοιτητής στο ινστιτούτο συνοριακών διεπιστημονικών σπουδών στο πανεπιστήμιο του πεκίνου. το κοινό εργαστήριο ευφυούς συστήματος τεχνητής νοημοσύνης του peking university-baichuan ιδρύθηκε τον ιανουάριο του 2024. στόχος του είναι να μελετήσει σημαντικά θέματα όπως η επιστημονική και συστηματική παραγωγή δεδομένων και στρατηγικές αξιολόγησης ποιότητας, η εκπαίδευση μεγάλων μοντέλων και η επιτάχυνση συμπερασμάτων γύρω από ολόκληρη την τεχνική διαδικασία συστημάτων μοντέλων τεχνητής νοημοσύνης . το κοινό εργαστήριο διευθύνεται από τον cui bin, διακεκριμένο καθηγητή boya στο πανεπιστήμιο του πεκίνου και τον chen weipeng, συνιδρυτή της baichuan intelligence.

τα μεγάλα γλωσσικά μοντέλα που βασίζονται στην αρχιτεκτονική του transformer επιτυγχάνουν πρωτοποριακά αποτελέσματα σε διάφορους τομείς. το prompt engineering παίζει κρίσιμο ρόλο σε αυτό.

με καλές υποδείξεις, οι ερευνητές και οι προγραμματιστές μπορούν να καθοδηγήσουν τα μοντέλα ώστε να αποδίδουν καλύτερα σε συγκεκριμένες εργασίες. αυτή η μέθοδος όχι μόνο μπορεί να βελτιώσει σημαντικά την απόδοση του μοντέλου, αλλά και να ενισχύσει την προσαρμοστικότητα του μοντέλου, καθιστώντας το πιο ευέλικτο και αποτελεσματικό όταν αντιμετωπίζετε διάφορες σύνθετες εργασίες.

επιπλέον, το prompt word project μπορεί επίσης να βελτιστοποιήσει τη διαδικασία εκμάθησης του μοντέλου, να βελτιώσει την αποτελεσματικότητα της επεξεργασίας πολύπλοκων προβλημάτων και να μειώσει τον χρόνο εκπαίδευσης και τις απαιτήσεις πόρων υπολογιστών.

σε σύγκριση με τις παραδοσιακές μεθόδους μικρορύθμισης, η άμεση μηχανική λέξεων μπορεί να προσαρμόσει το μοντέλο σε πολλαπλές μεταγενέστερες εργασίες με πολύ χαμηλό κόστος, εξοικονομώντας σημαντικά υπολογιστικούς πόρους και κόστος συλλογής δεδομένων. ωστόσο, ο σχεδιασμός αποτελεσματικών λέξεων υπόδειξης εξακολουθεί να είναι πρόκληση για μη ειδικούς και συχνά απαιτεί πολλή μάθηση και πρακτική.

συνήθως είναι δύσκολο να επιτευχθούν ιδανικά αποτελέσματα με απευθείας χρήση μεγάλων μοντέλων γλώσσας για έργα αυτόματης προτροπής. τα ακατάλληλα μηνύματα ενδέχεται να αποσπάσουν την προσοχή του μοντέλου και να μειώσουν την απόδοση. ως εκ τούτου, είναι ιδιαίτερα σημαντικό να αναπτυχθεί ένα αυτόματο σύστημα άμεσης μηχανικής που μπορεί να βοηθήσει τους χρήστες και να είναι εύκολο στη χρήση.

pas: πρωτοποριακό auto-alert engineering system

για την αντιμετώπιση αυτής της πρόκλησης, το κοινό εργαστήριο πανεπιστημίου του πεκίνου-baichuan πρότεινε το αυτόματο σύστημα άμεσης μηχανικής pas. η καινοτομία του pas είναι:

1. σχεδιάστε ένα σύνολο δεδομένων αυτόματης προτροπής υψηλής ποιότητας

2. εκτελέστε μάθηση λίγων δειγμάτων και έλεγχο δεδομένων στο μοντέλο gpt

3. δημιουργήστε αυτόματα ένα βελτιωμένο και αποτελεσματικό σύνολο δεδομένων

4. εφαρμογή αποτελεσματικής αυτόματης άμεσης μηχανικής μέσω μικρορύθμισης

το pas μπορεί να συμπληρώσει συνοπτικά και αποτελεσματικά τη συνεισφορά του χρήστη, πραγματοποιώντας ένα γρήγορο, απλό και αυτόματο έργο προτροπής που υποστηρίζει την προβολή ροής.

σε πολλαπλές δοκιμές αναφοράς, το pas ξεπερνά κατά πολύ τα υπάρχοντα μοντέλα sota και απαιτεί λιγότερα δεδομένα. τα αποτελέσματα της χειροκίνητης αξιολόγησης δείχνουν επίσης ότι το pas έχει εξαιρετική απόδοση, αναδεικνύοντας τις τεράστιες δυνατότητές του σε πρακτικές εφαρμογές.

αυτό το πρωτοποριακό αποτέλεσμα όχι μόνο προάγει την ανάπτυξη άμεσης μηχανικής λέξεων, αλλά ανοίγει επίσης το δρόμο για την εφαρμογή μεγάλων γλωσσικών μοντέλων σε ένα ευρύτερο φάσμα πεδίων.

διεύθυνση χαρτιού: https://arxiv.org/abs/2407.06027
pku-baichuan-mlsystemlab：

https://github.com/pku-baichuan-mlsystemlab

https://huggingface.co/pku-baichuan-mlsystemlab

μέθοδος

το training pas χωρίζεται κυρίως σε τρία στάδια:

βήμα 1: δημιουργήστε ένα σύνολο δεδομένων προβλημάτων υψηλής ποιότητας

η πρώτη εργασία στην εκπαίδευση pas είναι η δημιουργία ενός συνόλου δεδομένων προβλημάτων υψηλής ποιότητας. όπως φαίνεται στο σχήμα (α), οι ερευνητές εξέτασαν ερωτήσεις υψηλής ποιότητας με βάση τα σύνολα δεδομένων lmsys-1m και wildchat μέσω των ακόλουθων τριών πτυχών:

1. διαγραφή δεδομένων: χρησιμοποιήστε τεχνολογία ενσωμάτωσης σε συνδυασμό με αλγόριθμους ομαδοποίησης για την αποτελεσματική κατάργηση των διπλότυπων δεδομένων.

2. έλεγχος ποιότητας: χρησιμοποιήστε το μεγάλο μοντέλο baichuan για να αξιολογήσετε και να ελέγξετε την ποιότητα των δεδομένων.

3. εγγύηση διαφορετικότητας: επιλέχθηκαν τελικά 9.000 δεδομένα ερωτήσεων υψηλής ποιότητας που καλύπτουν περισσότερες από 10 κατηγορίες.

βήμα 2: συμπληρώστε τα άμεσα δεδομένα μηχανικής

σε αυτό το στάδιο, οι ερευνητές χρησιμοποίησαν διεξοδικά τα 100 δεδομένα υψηλής ποιότητας που συσσωρεύτηκαν εσωτερικά και τα δεδομένα του προβλήματος που εξετάστηκαν στο πρώτο βήμα, και χρησιμοποίησαν τη μέθοδο εκμάθησης λίγων λήψεων για να δημιουργήσουν αυτόματα δεδομένα άμεσης μηχανικής με τη βοήθεια του μοντέλου gpt:

1. αρχική δημιουργία δεδομένων: χρησιμοποιήστε την εκμάθηση μερικών λήψεων για να καθοδηγήσετε το gpt για τη δημιουργία προκαταρκτικών δεδομένων μηχανικής.

2. ποιοτικός έλεγχος: σχεδιάστε το βήμα κριτική και χρησιμοποιήστε ξανά την εκμάθηση με λίγες λήψεις για να επιτρέψετε στο gpt να αξιολογήσει την ποιότητα των δεδομένων που δημιουργούνται.

3. επαναληπτική βελτιστοποίηση: φιλτράρει αυτόματα δεδομένα χαμηλής ποιότητας και αναπαράγει τα δεδομένα για να διασφαλίσει την ποιότητα των δεδομένων μέσω πολλαπλών γύρων επαναλήψεων.

4. τελικό αποτέλεσμα: λήφθηκαν τελικά 9.000 τεμάχια αυτόματης άμεσης μηχανικής δεδομένων υψηλής ποιότητας.

διανομή δεδομένων

η κατανομή των 9000 τεμαχίων δεδομένων που δημιουργήθηκαν φαίνεται στο παραπάνω σχήμα, διασφαλίζοντας την ποικιλομορφία και την αντιπροσωπευτικότητα των δεδομένων.

βήμα 3: βελτιστοποιήστε το μοντέλο αυτόματης προτροπής

το τελευταίο βήμα θα χρησιμοποιήσει το σύνολο δεδομένων που λήφθηκε στα δύο πρώτα στάδια για να τελειοποιήσει το μοντέλο μεγάλης γλώσσας:

1. επιλέξτε ένα βασικό μοντέλο: όπως το qwen2-7b και άλλα μοντέλα.

2. κατευθυνόμενη μικρορύθμιση: χρησιμοποιήστε σύνολα δεδομένων υψηλής ποιότητας για λεπτομέρεια.

3. εξειδικευμένη εκπαίδευση: τέλος, αποκτάται ένα μεγάλο γλωσσικό μοντέλο ειδικά για έργα αυτόματης προτροπής.

πειράματα και αποτελέσματα

χειροκίνητη αναθεώρηση

σύμφωνα με την αξιολόγηση των ανθρώπινων αξιολογητών, το pas εμφανίζει υψηλότερο ποσοστό νίκης σε διάφορους τομείς σε σύγκριση με το προηγούμενο μοντέλο sota (state-of-the-art). το μέσο ποσοστό νίκης σε πολλά πεδία υπερβαίνει το 50%, και το άθροισμα του ποσοστού νίκης και του ποσοστού ισοπαλίας είναι τόσο υψηλό όσο πάνω από 80%.

σημείο αξιολόγησης μηχανών

για να αξιολογήσουν συνολικά την απόδοση του pas, οι ερευνητές επέλεξαν τρία σημεία αναφοράς: arena-hard, alpaca-eval 2.0 και alpaca-eval 2.0 (lc).

στη συνέχεια, οι ερευνητές εφάρμοσαν το pas σε έξι κορυφαία μοντέλα τεχνητής νοημοσύνης, συμπεριλαμβανομένων:

gpt-4 (τρεις εκδόσεις)
gpt-3.5
qwen2-72-instruct
llama3-70b-instruct

τα αποτελέσματα της αξιολόγησης δείχνουν:

το pas επιτυγχάνει σημαντικές βελτιώσεις τόσο σε σχέση με την περίπτωση χωρίς προτροπή όσο και με το προηγούμενο μοντέλο μηχανικής αυτόματης προτροπής sota.
σε σύγκριση με τα προηγούμενα μοντέλα bpo, το pas παρουσιάζει μεγαλύτερη προσαρμοστικότητα, είναι συμβατό με μια ποικιλία πολύ μεγάλων μοντέλων και επιτυγχάνει βελτιώσεις απόδοσης σε κάθε μοντέλο.

ανάλυση υπολογιστικής απόδοσης

το pas όχι μόνο έχει καλή απόδοση από πλευράς απόδοσης, αλλά είναι επίσης πολύ υπολογιστικά αποδοτικό: όσον αφορά την απόδοση δεδομένων, απαιτεί μόνο 9000 τεμάχια λεπτομερώς συντονισμένων δεδομένων για να επιδείξει ανώτερη απόδοση. όσον αφορά την απόδοση της παραγωγής, μπορεί να περιορίσει το μήκος των συμπληρωματικών αυτόματων μηνυμάτων, συνήθως όχι περισσότερες από 30 λέξεις.

όσον αφορά την εμπειρία χρήστη, το pas φέρνει επίσης κέρδη σε μεγάλα μοντέλα, και συγκεκριμένα:

σε αντίθεση με προηγούμενα μοντέλα όπως το bpo, το pas δεν χρειάζεται να τροποποιήσει την αρχική ερώτηση του χρήστη, παρά μόνο συμπληρωματικά αυτόματα μηνύματα.
παρέχετε εξαιρετική εμπειρία χρήστη με ελεγχόμενο χρόνο απόκρισης.
υποστηρίζει προβολή ροής τύπου gpt για περαιτέρω βελτίωση της διαδραστικής εμπειρίας.

παράδειγμα: το pas βοηθά τα μεγάλα μοντέλα να αποφεύγουν τις λογικές παγίδες

"αν υπάρχουν 10 πουλιά στο δέντρο και ένα από αυτά σκοτωθεί με πυροβολισμούς, πόσα πουλιά υπάρχουν στο έδαφος;"

αυτή η φαινομενικά απλή ερώτηση κρύβει στην πραγματικότητα μια έξυπνη λογική παγίδα όταν τη δείτε, μπορεί να σας πάρει μερικά δευτερόλεπτα για να συνειδητοποιήσετε ότι έχουν απομείνει 9 πουλιά στο δέντρο και μόνο 1 στο έδαφος.

όπως φαίνεται στο σχήμα, χωρίς τη βοήθεια του pas, το gpt δίνει λάθος απαντήσεις. το σύστημα pas βελτιώνει σημαντικά την απόδοση του μοντέλου συμπληρώνοντας τις προτρεπτικές λέξεις:

υπό την καθοδήγηση του pas, ο νέος γύρος απαντήσεων του μοντέλου έδειξε σημαντικές βελτιώσεις, όχι μόνο απέφυγε τις λογικές παγίδες στις ερωτήσεις, έδειξε μια σαφή, πολλαπλών βημάτων λογική διαδικασία, αλλά έδωσε επίσης τη σωστή απάντηση όλη τη συλλογιστική διαδικασία.

οι ενδιαφερόμενοι αναγνώστες μπορούν να διαβάσουν το πρωτότυπο κείμενο της εργασίας για να μάθουν περισσότερα για το περιεχόμενο της έρευνας.

νέα

ακόμα παλεύετε με ξόρκια ai; το πανεπιστήμιο του πεκίνου-baichuan έχει αναπτύξει ένα σύστημα μηχανικής αυτόματης υπενθύμισης pas

εισαγωγή

τα στοιχεία επικοινωνίας μου