βαρύς! το "large model credibility ability evaluation ranking" δημοσιεύεται για πρώτη φορά σε εθνικό επίπεδο

βαρύς! το «large model credibility capability evaluation ranking» λανσάρεται πανελλαδικά.

2024-09-29

πρόσφατα, το "greater bay area generative artificial intelligence development joint laboratory" κυκλοφόρησε την "large model credibility evaluation ranking" σε εθνικό επίπεδο διάφορες γνωστές εταιρείες όπως η alibaba "qwen2-72b" και η baidu "ernie-4.0". είναι στη λίστα.

το πρώτο εγχώριο σύστημα αξιολόγησης συγκριτικής αξιολόγησης "πλαίσιο διακυβέρνησης ασφάλειας τεχνητής νοημοσύνης" έκδοση 1.0

πρόσφατα, η εθνική τεχνική επιτροπή τυποποίησης για την κυβερνοασφάλεια κυκλοφόρησε επίσημα την έκδοση 1.0 του "πλαισίου διακυβέρνησης για την ασφάλεια της τεχνητής νοημοσύνης" (αναφέρεται ως "πλαίσιο") στο κύριο φόρουμ της εθνικής εβδομάδας δημοσιότητας για την ασφάλεια στον κυβερνοχώρο. αυτό το πλαίσιο δεν είναι μόνο ένα τεχνικό έγγραφο, αλλά και μια νέα πρακτική για τη διακυβέρνηση της τεχνητής νοημοσύνης σε παγκόσμιο επίπεδο. αποσκοπεί στην παροχή καθοδήγησης για την ασφαλή, αξιόπιστη και βιώσιμη ανάπτυξη της τεχνολογίας ai στην κίνα και σε όλο τον κόσμο.

το «κοινό εργαστήριο ανάπτυξης ασφάλειας γενετικής τεχνητής νοημοσύνης της περιοχής του μεγάλου κόλπου» (αναφέρεται ως «κοινό εργαστήριο»), σύμφωνα με το πλαίσιο, «είναι περιεκτικό και συνετό, διασφαλίζοντας ασφάλεια, προσανατολισμένη στον κίνδυνο, ευέλικτη διακυβέρνηση, ενσωμάτωση τεχνολογίας και διαχείρισης, συνεργατική απόκριση, ανοιχτή συνεργασία και κοινή χρήση με βάση την αρχή της «κοινής διακυβέρνησης» και τα προληπτικά μέτρα τόσο στην τεχνολογία όσο και στη διακυβέρνηση, ερευνήσαμε και διαμορφώσαμε το πρώτο σύστημα αξιολόγησης ασφάλειας, αξιοπιστίας και ποσοτικής αξιολόγησης μοντέλων μεγάλης κλίμακας της χώρας που ανταποκρίνεται σε "σκελετός". αυτό το σύστημα αξιολόγησης συνδυάζει τα "ενδιάμεσα μέτρα για τη διαχείριση των υπηρεσιών γενετικής τεχνητής νοημοσύνης" και τις "βασικές απαιτήσεις για την ασφάλεια των υπηρεσιών γενετικής τεχνητής νοημοσύνης", εστιάζοντας στη συγκριτική αξιολόγηση του "πλαισίου", εστιάζοντας σε τρεις κύριες κατευθύνσεις και 13 πτυχές: αξία ευθυγράμμιση, ασφάλεια και δυνατότητα ελέγχου και αξιόπιστες δυνατότητες χωρίστε τις διαστάσεις σε μια ολοκληρωμένη αξιολόγηση του παραγόμενου περιεχομένου και συμπεριφοράς του μοντέλου.

ο πρώτος στη χώρα που κυκλοφόρησε την «κατάταξη αξιολόγησης αξιοπιστίας αξιοπιστίας μεγάλου μοντέλου»

το "joint laboratory" επέλεξε ως αντικείμενα αξιολόγησης 22 από τα τελευταία μεγάλα μοντέλα στο εσωτερικό και στο εξωτερικό, συμπεριλαμβανομένων 17 εγχώριων μοντέλων και 5 ξένων μοντέλων (η huawei και η tencent είναι οι κοινές κατασκευαστικές μονάδες του "joint laboratory" και τα μοντέλα τους δεν συμμετέχουν σύμφωνα με το 13-διάστατο σύστημα αξιολόγησης έχει αξιολογηθεί διεξοδικά και αντικειμενικά, με ένα σύνολο δεδομένων αξιολόγησης περισσότερων από 34.000 τεμαχίων δεδομένων, που υποστηρίζουν τόσο την κινεζική όσο και την αγγλική γλώσσα, και τελικά διαμορφώθηκε το "large model credibility capability evaluation). κατάταξη».

λίστα αξιόπιστης αξιολόγησης εγχώριων μεγάλων μοντέλων

αξιόπιστη λίστα αξιολόγησης ξένων μεγάλων μοντέλων

τα αποτελέσματα της αξιολόγησης δείχνουν ότι τα μεγάλα εγχώρια μοντέλα δείχνουν ισχυρή ανταγωνιστικότητα στην αξιολόγηση της αξιοπιστίας. συνολικά, τα εγχώρια μεγάλα μοντέλα αποδίδουν εξαιρετικά όσον αφορά την αξιοπιστία, ιδίως όσον αφορά την ευθυγράμμιση αξίας και τον έλεγχο ασφάλειας, αντανακλώντας τη σταθερή βελτίωση της εγχώριας τεχνολογίας και την υψηλή προσαρμοστικότητά τους στις πολιτικές και τους κανονισμούς. για παράδειγμα, μεταξύ των πέντε διαστάσεων της ευθυγράμμισης τιμών, 16 από τα 17 μοντέλα έφτασαν τουλάχιστον το επίπεδο 4α (94,1%), αλλά μόνο 4 μοντέλα έφτασαν στο επίπεδο 5α (23,5%), υποδεικνύοντας ότι υπάρχει ακόμη χώρος για περαιτέρω βελτιστοποίηση . μεταξύ των τεσσάρων υποκατηγοριών της διάστασης ασφάλειας και ελέγχου, 3 μοντέλα έφτασαν τα 3α και τα υπόλοιπα 14 έφτασαν τα 4α, αντιπροσωπεύοντας το 82,4%.

ωστόσο, τα αποτελέσματα της αξιολόγησης αποκάλυψαν επίσης κάποιες ελλείψεις, ειδικά στις τέσσερις διαστάσεις της αξιοπιστίας των δυνατοτήτων οι αξιολογήσεις μοντέλων κυμαίνονταν από 1α έως 4α, με μόνο το 29,4% των μοντέλων να φτάνει τα 4α. αυτό προκαλείται κυρίως από διαφορές στις δυνατότητες του βασικού μοντέλου, υποδεικνύοντας ότι υπάρχει ακόμα περιθώριο βελτίωσης στις δυνατότητες, τη συνέπεια και τη σταθερότητα του βασικού μοντέλου. επιπλέον, υπάρχει ακόμη ένα σημαντικό χάσμα μεταξύ του μεγάλου μοντέλου ανοιχτού κώδικα llama-3.1 και του κορυφαίου μεγάλου μοντέλου κλειστού κώδικα όσον αφορά τις αξιόπιστες δυνατότητες, όπως η ευθυγράμμιση τιμών, η ασφάλεια και η δυνατότητα ελέγχου, και χρειάζεται περαιτέρω βελτιστοποίηση.

αποτελέσματα αξιολόγησης στοίχισης τιμών

ασφαλή και ελεγχόμενα αποτελέσματα αξιολόγησης

αξιόπιστα αποτελέσματα αξιολόγησης ικανότητας

εισαγωγή στο «κοινό εργαστήριο ανάπτυξης ασφάλειας γεννητικής τεχνητής νοημοσύνης στην περιοχή του μεγάλου κόλπου»

το "κοινό εργαστήριο για την ανάπτυξη της ασφάλειας της γενετικής τεχνητής νοημοσύνης στην ευρύτερη περιοχή του κόλπου" εγκαινιάζεται από κοινού από το γραφείο υποθέσεων κυβερνοχώρου της επαρχιακής επιτροπής του κομμουνιστικού κόμματος της κίνας και το παράρτημα guangdong του εθνικού κέντρου έκτακτης ανάγκης διαδικτύου. tencent, πανεπιστήμιο sun yat-sen, η διοίκηση κυβερνοχώρου της δημοτικής επιτροπής του guangzhou, shenzhen το γραφείο πληροφοριών διαδικτύου της δημοτικής επιτροπής κόμματος, το γραφείο πληροφοριών διαδικτύου της δημοτικής επιτροπής κομμάτων dongguan και η υπηρεσία ανάπτυξης βρόχου shenzhen από κοινού συμμετείχαν στην κατασκευή. το «κοινό εργαστήριο» έχει δεσμευτεί για την αξιολόγηση και την κρίση των πιθανών κινδύνων της τεχνητής νοημοσύνης, τη μελλοντική πρόληψη και την έρευνα καθοδήγησης περιορισμού, τη διερεύνηση παραδειγμάτων διακυβέρνησης για την αξιόπιστη, ελεγχόμενη και ασφαλή ανάπτυξη της τεχνητής νοημοσύνης, υπηρετώντας ενεργά την καινοτόμο ανάπτυξη της δημιουργία τεχνητής νοημοσύνης και υποστηρίζοντας σθεναρά την εποχή της τεχνητής νοημοσύνης η κατασκευή ενός ολοκληρωμένου συστήματος διαχείρισης δικτύων θα προωθήσει από κοινού την τεχνητή νοημοσύνη να είναι «προσανατολισμένη στον άνθρωπο και στον καλό προσανατολισμό» και θα επιδιώξει να βοηθήσει την ψηφιακή οικονομία να αναπτυχθεί με υψηλότερη ποιότητα. υψηλό επίπεδο ασφάλειας.

nanfang.com, ρεπόρτερ μελέτης γκουανγκντόνγκ χε μινχούι

αναφορά/σχόλια

νέα

βαρύς! το «large model credibility capability evaluation ranking» λανσάρεται πανελλαδικά.

εισαγωγή

τα στοιχεία επικοινωνίας μου