Ανοιχτός κώδικας = το πιο ισχυρό μοντέλο! Κυκλοφόρησε το Llama 3.1, Zuckerberg: watershed moment

2024-07-24

Το Baijiao προέρχεται από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

μόλις,LIama 3.1Κυκλοφόρησε επίσημα, ανεβαίνοντας στον θρόνο των μεγάλων μοντέλων!

Σε περισσότερα από 150 σετ δοκιμών αναφοράς, η απόδοση της έκδοσης 405B ισούται ή και ξεπερνά τα υπάρχοντα μοντέλα SOTA GPT-4o και Claude 3.5 Sonnet.

Με άλλα λόγια, αυτή τη φορά,Το ισχυρότερο μοντέλο ανοιχτού κώδικα είναι το ισχυρότερο μοντέλο。

Πριν από αυτό, το Llama 3.1 είχε εκτεθεί και διαρρεύσει πολλές φορές, και τώρα μπορούμε να πούμε ότι περίμενε πολύ καιρό.

Από σήμερα, το μοντέλο μπορεί να ληφθεί και να χρησιμοποιηθεί στον επίσημο ιστότοπο, ενώ η εφαρμογή Meta AI μπορεί να δοκιμαστεί διαδικτυακά.

Αυτό που εκτιμάται ακόμη περισσότερο από την ερευνητική κοινότητα είναι η έκδοση σχεδόν 100 σελίδων λεπτομερών εγγράφων, που καλύπτουν τα πάντα στη διαδικασία δημιουργίας του Llama 3.1: δεδομένα προεκπαίδευσης, φιλτράρισμα, ανόπτηση, συνθετικά δεδομένα, νόμοι κλιμάκωσης, υποδομή, παραλληλισμός, εκπαίδευση συνταγές, προσαρμογή μετά την προπόνηση, χρήση εργαλείων, συγκριτική αξιολόγηση, στρατηγικές συμπερασμάτων, ποσοτικοποίηση, όραμα, φωνή, βίντεο...

Ο επικεφαλής επιστήμονας του HuggingFace επαίνεσε: Εάν ξεκινάτε να μελετάτε μεγάλα μοντέλα από την αρχή, αρχίστε να διαβάζετε αυτό το άρθρο.

Xiao ZhaΖούκερμπεργκΣτην τελευταία του συνέντευξη στο Bloomberg, κορόιδευε συγκεκριμένα το OpenAI.

Η ηγεσία του Altman είναι αξιέπαινη, αλλά είναι κάπως ειρωνικό το γεγονός ότι η εταιρεία με το όνομα OpenAI έχει γίνει ηγέτης στην κατασκευή μοντέλων τεχνητής νοημοσύνης κλειστού τύπου.

Ο Xiao Zha έγραψε επίσης ένα μεγάλο άρθρο ειδικά για αυτό:Η τεχνητή νοημοσύνη ανοιχτού κώδικα είναι ο δρόμος προς τα εμπρός。

Στο παρελθόν, τα μοντέλα ανοιχτού κώδικα υστερούσαν ως επί το πλείστον σε σχέση με τα μοντέλα κλειστού κώδικα όσον αφορά την απόδοση, τη λειτουργικότητα κ.λπ., αλλά τώρα:

Ακριβώς όπως το Linux ανοιχτού κώδικα, έχει ξεχωρίσει μεταξύ των συστημάτων κλειστού κώδικα και έχει κερδίσει δημοτικότητα, γίνεται σταδιακά πιο προηγμένο και πιο ασφαλές και έχοντας ένα ευρύτερο οικοσύστημα από τα συστήματα κλειστού κώδικα.
Πιστεύω ότι το Llama 3.1 θα είναι ένα σημείο καμπής στον κλάδο.

Μέχρι σήμερα, οι συνολικές λήψεις όλων των εκδόσεων Llama έχουν ξεπεράσει τις 300 εκατομμύρια φορές και η Meta προβάλλει επίσης τολμηρούς ισχυρισμούς:

Αυτό είναι μόνο η αρχή.

Οι μεγάλοι προμηθευτές cloud έχουν επίσης ξεκινήσει την υποστήριξη για το Llama 3.1 το συντομότερο δυνατό και η τιμή είναι της θείας Jiang:

Το LIama 3.1 κυκλοφόρησε επίσημα

Ας δούμε πρώτα τις δυνατότητες του μοντέλου.

Το Llama 3.1 επεκτείνει το μήκος περιβάλλοντος στα 128K και προσθέτει υποστήριξη για οκτώ γλώσσες.

Μεταξύ αυτών, η έκδοση Super Large Cup 405B έχει ισοφαρίσει και ξεπεράσει τα υπάρχοντα κορυφαία μοντέλα όσον αφορά την κοινή λογική, την ευελιξία, τα μαθηματικά, τη χρήση εργαλείων και τις δυνατότητες μετάφρασης πολλών γλωσσών.

Επιπλέον, έχουν κυκλοφορήσει και αναβαθμισμένες εκδόσεις των μοντέλων 8B και 70B και οι δυνατότητές τους είναι βασικά ίδιες με εκείνες των κορυφαίων μοντέλων με τις ίδιες παραμέτρους.

Ας δούμε ξανάΜοντέλο αρχιτεκτονικής。

Σύμφωνα με την επίσημη εισαγωγή, η εκπαίδευση του μοντέλου Llama 3.1 405B σε περισσότερα από 15 τρισεκατομμύρια μάρκες είναι μια μεγάλη πρόκληση.

Για το σκοπό αυτό, βελτιστοποίησαν σημαντικά ολόκληρη τη στοίβα εκπαίδευσης και επέκτεισαν την κλίμακα υπολογιστικής ισχύος του μοντέλου σε περισσότερες από 16.000 GPU H100 για πρώτη φορά.

Συγκεκριμένα, εξακολουθούμε να χρησιμοποιούμε την τυπική αρχιτεκτονική Transformer μόνο για αποκωδικοποιητή και υιοθετούμε μια επαναληπτική διαδικασία μετά την εκπαίδευση, με SFT (επιβλεπόμενη βελτιστοποίηση προτιμήσεων) σε κάθε γύρο εκτέλεση.

Σε σύγκριση με προηγούμενες εκδόσεις του Llama, έχουν βελτιώσει την ποσότητα και την ποιότητα των δεδομένων που χρησιμοποιούνται για την προ-προπόνηση και τη μετα-προπόνηση.

Προκειμένου να υποστηρίξει συμπέρασμα μαζικής παραγωγής μοντέλων μεγέθους 405Β, η Meta κβαντοποίησε το μοντέλο από τιμές 16-bit (BF16) σε 8-bit (FP8), μειώνοντας αποτελεσματικά τις απαιτούμενες υπολογιστικές απαιτήσεις και επιτρέποντας στο μοντέλο να εκτελείται σε έναν μόνο κόμβο διακομιστή .

υπάρχειΒελτιστοποίηση οδηγιώνΑπό την άλλη πλευρά, το Meta βελτιώνει επίσης την ικανότητα του μοντέλου να ανταποκρίνεται στις οδηγίες χρήστη και ενισχύει την ικανότητά του να ακολουθεί λεπτομερείς οδηγίες διασφαλίζοντας παράλληλα την ασφάλεια.

Στο στάδιο μετά την εκπαίδευση, το Meta εκτελεί πολλαπλούς γύρους ευθυγράμμισης με βάση το προεκπαιδευμένο μοντέλο.

Κάθε γύρος περιλαμβάνει εποπτευόμενη λεπτομέρεια (SFT), δειγματοληψία απόρριψης (RS) και βελτιστοποίηση άμεσης προτίμησης (DPO).

Δημιούργησαν τα περισσότερα από τα παραδείγματα SFT χρησιμοποιώντας συνθετικά δεδομένα και επαναλήφθηκαν αρκετές φορές.

Επιπλέον, χρησιμοποιείται μια ποικιλία τεχνικών επεξεργασίας δεδομένων για το φιλτράρισμα αυτών των συνθετικών δεδομένων στην υψηλότερη ποιότητα.

Συνολικά 15T tokens καθαρίζονται και φιλτράρονται χρησιμοποιώντας το μοντέλο Llama 2, ενώ οι αγωγοί επεξεργασίας δεδομένων που σχετίζονται με τον κώδικα και τα μαθηματικά βασίζονται κυρίως στις μεθόδους του Deepseek.

Εκτός από την πιο βασική απόκριση σύμφωνα με τις άμεσες λέξεις, οι αξιωματούχοι της Meta είπαν ότι κάθε συνηθισμένος προγραμματιστής μπορεί να τη χρησιμοποιήσει για να κάνει προηγμένα πράγματα, όπως:

Συμπεράσματα σε πραγματικό χρόνο και παρτίδες
Επίβλεψη λεπτομέρειας
Αξιολογήστε μοντέλα για συγκεκριμένες εφαρμογές
Συνεχής προπόνηση
Ανάκτηση επαυξημένης γενιάς (RAG)
κλήση λειτουργίας
Παραγωγή συνθετικών δεδομένων

Και πίσω από αυτό βρίσκεται η υποστήριξη των ισχυρών οικολογικών εταίρων της.

Ο Xiao Zha γράφει ένα μεγάλο άρθρο: Η τεχνητή νοημοσύνη ανοιχτού κώδικα είναι ο δρόμος προς τα εμπρός

(Το παρακάτω μεταφράζεται από το Big Model και γίνεται εξαγωγή του κύριου περιεχομένου. Εάν υπάρχουν παραλείψεις ή λάθη, διορθώστε τα!)

Στις πρώτες μέρες των υπολογιστών υψηλής απόδοσης, οι μεγάλες εταιρείες τεχνολογίας εκείνη την εποχή επένδυσαν πολλά στην ανάπτυξη των δικών τους εκδόσεων κλειστού κώδικα του Unix. Εκείνη την εποχή, ήταν δύσκολο να φανταστεί κανείς ότι τέτοιο προηγμένο λογισμικό θα μπορούσε να παραχθεί με οποιονδήποτε άλλο τρόπο εκτός από την κλειστή πηγή. Ωστόσο, το λειτουργικό σύστημα ανοιχτού κώδικα Linux κέρδισε τελικά ευρεία δημοτικότητα - αρχικά επειδή επέτρεψε στους προγραμματιστές να τροποποιήσουν τον κώδικα ελεύθερα και φθηνότερα με την πάροδο του χρόνου, το Linux όχι μόνο έγινε πιο προηγμένο και ασφαλές, αλλά και δημιούργησε ένα ευρύτερο οικοσύστημα από οποιοδήποτε Unix κλειστού κώδικα. σύστημα, υποστηρίζοντας περισσότερες δυνατότητες. Σήμερα, το Linux είναι το βιομηχανικό πρότυπο θεμέλιο για το cloud computing και τα περισσότερα λειτουργικά συστήματα φορητών συσκευών, και όλοι απολαμβάνουμε καλύτερα προϊόντα λόγω αυτού.

Πιστεύω ότι η τεχνητή νοημοσύνη θα αναπτυχθεί με παρόμοιο τρόπο . Σήμερα, αρκετές εταιρείες τεχνολογίας αναπτύσσουν κορυφαία μοντέλα κλειστού κώδικα. Αλλά ο ανοιχτός κώδικας κλείνει γρήγορα το χάσμα. Πέρυσι, το Llama 2 ήταν συγκρίσιμο μόνο με μοντέλα μιας γενιάς πίσω. Φέτος, το Llama 3 ανταγωνίζεται τα πιο προηγμένα μοντέλα και ηγείται σε ορισμένους τομείς. Από το επόμενο έτος, αναμένουμε τα μελλοντικά μοντέλα Llama να είναι τα πιο προηγμένα στον κλάδο. Αλλά ακόμη και πριν από αυτό, η Llama ήταν ήδη πρωτοπόρος στο άνοιγμα, τη δυνατότητα τροποποίησης και την αποδοτικότητα κόστους.

Σήμερα προχωράμε προς«Η τεχνητή νοημοσύνη ανοιχτού κώδικα γίνεται το πρότυπο της βιομηχανίας» κατεύθυνση. Κυκλοφόρησε το Llama 3.1 405B, το πρώτο μοντέλο ανοιχτού κώδικα τεχνητής νοημοσύνης αιχμής, καθώς και τα βελτιωμένα μοντέλα Llama 3.1 70B και 8B. Εκτός από το ότι έχει σημαντικά καλύτερη αναλογία κόστους/απόδοσης σε σύγκριση με τα μοντέλα κλειστού κώδικα, το ανοιχτό μοντέλο του 405B θα το καταστήσει την καλύτερη επιλογή για μικρορύθμιση και απόσταξη μικρότερων μοντέλων.

Εκτός από την κυκλοφορία αυτών των μοντέλων, συνεργαζόμαστε με μια σειρά εταιρειών για την ανάπτυξη του ευρύτερου οικοσυστήματος. Η Amazon, η Databricks και η Nvidia λανσάρουν μια σειρά υπηρεσιών για να επιτρέψουν στους προγραμματιστές να τελειοποιήσουν και να αποστάξουν τα δικά τους μοντέλα. Καινοτόμοι όπως η Groq έχουν δημιουργήσει υπηρεσίες συμπερασμάτων χαμηλής καθυστέρησης και χαμηλού κόστους για όλα τα νέα μοντέλα. Αυτά τα μοντέλα θα είναι διαθέσιμα σε όλες τις μεγάλες πλατφόρμες cloud, συμπεριλαμβανομένων των AWS, Azure, Google, Oracle και άλλων. Εταιρείες όπως η Scale.AI, η Dell, η Deloitte και άλλες είναι έτοιμες να βοηθήσουν τις επιχειρήσεις να υιοθετήσουν το Llama και να εκπαιδεύσουν προσαρμοσμένα μοντέλα με τα δικά τους δεδομένα. Καθώς η κοινότητα μεγαλώνει και περισσότερες εταιρείες αναπτύσσουν νέες υπηρεσίες, μαζί μπορούμε να κάνουμε τη Llama το πρότυπο του κλάδου, φέρνοντας τα οφέλη της τεχνητής νοημοσύνης σε όλους.

Το Meta είναι αφιερωμένο στην τεχνητή νοημοσύνη ανοιχτού κώδικα. Θα περιγράψω γιατί πιστεύω ότι το open source είναι η καλύτερη στοίβα ανάπτυξης, γιατί το open source Llama είναι καλό για το Meta και γιατί το open source AI είναι καλό για τον κόσμο και επομένως μια μακροπρόθεσμη βιώσιμη πλατφόρμα.

Γιατί το AI ανοιχτού κώδικα είναι καλό για προγραμματιστές

Όταν μιλάω με προγραμματιστές, CEOs και αξιωματούχους σε όλο τον κόσμο, ακούω συνήθως μερικά θέματα:

Πρέπει να εκπαιδεύσουμε, να τελειοποιήσουμε και να αποστάξουμε τα δικά μας μοντέλα . . Κάθε οργανισμός έχει τις δικές του μοναδικές ανάγκες και είναι ο καταλληλότερος για τη χρήση μοντέλων διαφορετικών μεγεθών που μπορούν να εκπαιδευτούν ή να βελτιωθούν με βάση τα συγκεκριμένα δεδομένα τους. Για εργασίες επί της συσκευής και εργασίες ταξινόμησης, μικρά μοντέλα αρκούν για πιο σύνθετες εργασίες, χρειάζονται μεγάλα μοντέλα. Τώρα μπορείτε να επωφεληθείτε από τα τελευταίας τεχνολογίας μοντέλα Llama, να συνεχίσετε να τα εκπαιδεύετε με τα δικά σας δεδομένα και, στη συνέχεια, να τα αποστάξετε σε μέγεθος μοντέλου που ταιριάζει καλύτερα στις ανάγκες σας - χωρίς να επιτρέψετε σε εμάς ή σε οποιονδήποτε άλλο να δει τα δεδομένα σας.
Πρέπει να ελέγχουμε τη μοίρα μας και να μην εγκλωβιζόμαστε σε προμηθευτές κλειστού κώδικα . Πολλοί οργανισμοί δεν θέλουν να βασιστούν σε ένα μοντέλο που δεν μπορούν να το διαχειριστούν και να ελέγξουν οι ίδιοι. Δεν θέλουν ένας πάροχος μοντέλων κλειστού κώδικα να μπορεί να αλλάξει το μοντέλο, να τροποποιήσει τους όρους χρήσης ή ακόμα και να διακόψει εντελώς την υπηρεσία. Επίσης, δεν θέλουν να περιορίζονται στην αποκλειστική χρήση μοντέλων σε μία μόνο πλατφόρμα cloud. Ο ανοιχτός κώδικας επιτρέπει σε ένα ευρύ οικοσύστημα εταιρειών να έχει συμβατές αλυσίδες εργαλείων, επιτρέποντάς σας να μετακινείστε εύκολα μεταξύ τους.
Πρέπει να διατηρούμε τα δεδομένα μας ασφαλή . Πολλοί οργανισμοί χειρίζονται ευαίσθητα δεδομένα που πρέπει να προστατεύονται και δεν μπορούν να σταλούν μέσω των API cloud σε ένα μοντέλο κλειστού κώδικα. Υπάρχουν επίσης οργανισμοί που απλά δεν εμπιστεύονται τους παρόχους μοντέλων κλειστού κώδικα με τα δεδομένα τους. Ο ανοιχτός κώδικας επιλύει αυτά τα προβλήματα επιτρέποντάς σας να εκτελείτε μοντέλα οπουδήποτε. Υπάρχει μια κοινή πεποίθηση ότι το λογισμικό ανοιχτού κώδικα είναι γενικά πιο ασφαλές επειδή η διαδικασία ανάπτυξής του είναι πιο διαφανής.
Χρειαζόμαστε ένα μοντέλο που να λειτουργεί αποτελεσματικά και να είναι προσιτό . Οι προγραμματιστές μπορούν να εκτελέσουν συμπέρασμα Llama 3.1 405B στη δική τους υποδομή, είτε για εργασίες εξαγωγής συμπερασμάτων που αντιμετωπίζουν οι χρήστες είτε εκτός σύνδεσης, με περίπου το μισό κόστος χρήσης μοντέλων κλειστού κώδικα, όπως το GPT-4o.
Θέλουμε να επενδύσουμε σε οικοσυστήματα που θα γίνουν μακροπρόθεσμα πρότυπα . Πολλοί άνθρωποι βλέπουν τον ανοιχτό κώδικα να κινείται πιο γρήγορα από τα μοντέλα κλειστού κώδικα και θέλουν να χτίσουν τα συστήματά τους στην αρχιτεκτονική που θα τους δώσει το μεγαλύτερο μακροπρόθεσμο πλεονέκτημα.

Γιατί το AI ανοιχτού κώδικα είναι καλό για το Meta

Το επιχειρηματικό μοντέλο της Meta είναι να δημιουργεί τις καλύτερες εμπειρίες και υπηρεσίες για τους ανθρώπους. Για να γίνει αυτό, πρέπει να διασφαλίσουμε ότι έχουμε πάντα πρόσβαση στην καλύτερη τεχνολογία και ότι δεν είμαστε εγκλωβισμένοι στα οικοσυστήματα κλειστού κώδικα των ανταγωνιστών μας, περιορίζοντας την ικανότητά μας να καινοτομούμε.

Μία από τις βασικές μου εμπειρίες ήταν ότι οι υπηρεσίες μας περιορίζονταν από τους περιορισμούς της Apple σχετικά με το τι θα μπορούσαμε να δημιουργήσουμε στην πλατφόρμα της. Από τον τρόπο με τον οποίο φορολογούν τους προγραμματιστές, μέχρι τους κανόνες που εφαρμόζουν τυχαία, σε όλες τις καινοτομίες προϊόντων που εμποδίζουν να κυκλοφορήσουν, είναι σαφές ότι εάν μπορούμε να δημιουργήσουμε τις καλύτερες εκδόσεις των προϊόντων μας και οι ανταγωνιστές δεν μπορούν να περιορίσουν την καινοτομία μας, το Meta και πολλά άλλες εταιρείες θα είναι σε θέση να παρέχουν καλύτερες υπηρεσίες στους ανθρώπους. Φιλοσοφικά, αυτός είναι ο κύριος λόγος για τον οποίο πιστεύω ακράδαντα στη δημιουργία ενός ανοιχτού οικοσυστήματος για την επόμενη γενιά υπολογιστών σε AI και AR/VR.

Οι άνθρωποι συχνά με ρωτούν αν ανησυχώ μήπως εγκαταλείψω τα τεχνικά πλεονεκτήματα μέσω της ανοιχτής πηγής Llama, αλλά νομίζω ότι αυτό χάνει την ευρύτερη εικόνα για διάφορους λόγους:

Πρώτον, για να διασφαλίσουμε ότι έχουμε πρόσβαση στην καλύτερη τεχνολογία και ότι δεν είμαστε εγκλωβισμένοι σε ένα οικοσύστημα κλειστού κώδικα μακροπρόθεσμα, η Llama πρέπει να εξελιχθεί σε ένα πλήρες οικοσύστημα εργαλείων, συμπεριλαμβανομένων βελτιώσεων απόδοσης, βελτιστοποίησης πυριτίου και άλλων ενσωματώσεων. Αν ήμασταν η μόνη εταιρεία που χρησιμοποιούσε το Llama, το οικοσύστημα δεν θα αναπτυσσόταν και δεν θα είχαμε καλύτερη απόδοση από τις εκδόσεις κλειστού κώδικα του Unix.

Δεύτερον, αναμένω ότι η ανάπτυξη της τεχνητής νοημοσύνης θα συνεχίσει να είναι πολύ ανταγωνιστική, πράγμα που σημαίνει ότι η ανοιχτή πηγή οποιουδήποτε συγκεκριμένου μοντέλου δεν προσφέρει μεγαλύτερο πλεονέκτημα από το επόμενο καλύτερο μοντέλο εκείνη την εποχή. Η πορεία της Llama για να γίνει πρότυπο βιομηχανίας είναι να συνεχίσει να διατηρεί την ανταγωνιστικότητα, την αποτελεσματικότητα και το άνοιγμα, αναπτύσσοντας από γενιά σε γενιά.

Τρίτον, μια βασική διαφορά μεταξύ της Meta και των παρόχων μοντέλων κλειστού κώδικα είναι ότι η πώληση πρόσβασης σε μοντέλα τεχνητής νοημοσύνης δεν είναι το επιχειρηματικό μας μοντέλο. Αυτό σημαίνει ότι η δημόσια κυκλοφορία του Llama δεν βλάπτει τα έσοδα, τη βιωσιμότητα ή την ικανότητά μας να επενδύουμε στην έρευνα, κάτι που δεν ισχύει για τους παρόχους κλειστού κώδικα.

Τέλος, η Meta έχει μακρά ιστορία έργων ανοιχτού κώδικα και επιτυχία. Εξοικονομήσαμε δισεκατομμύρια δολάρια μέσω του έργου Open Compute, κυκλοφορώντας σχέδια διακομιστών, δικτύων και κέντρων δεδομένων και αφήνοντας την αλυσίδα εφοδιασμού να τυποποιεί τα σχέδιά μας. Επωφελούμαστε από την καινοτομία του οικοσυστήματος μέσω κορυφαίων εργαλείων ανοιχτού κώδικα όπως τα PyTorch, React και άλλα. Αυτή η προσέγγιση λειτούργησε πάντα για εμάς μακροπρόθεσμα.

Γιατί η τεχνητή νοημοσύνη ανοιχτού κώδικα είναι καλή για τον κόσμο

Πιστεύω ότι ο ανοιχτός κώδικας είναι κρίσιμος για την επίτευξη ενός θετικού μέλλοντος AI. Η τεχνητή νοημοσύνη έχει μεγαλύτερες δυνατότητες από οποιαδήποτε άλλη σύγχρονη τεχνολογία για να ενισχύσει την ανθρώπινη παραγωγικότητα, τη δημιουργικότητα και την ποιότητα ζωής και να επιταχύνει την οικονομική ανάπτυξη, ενώ παράλληλα οδηγεί τις προόδους στην ιατρική και την επιστημονική έρευνα. Το ανοιχτό κώδικα θα διασφαλίσει ότι περισσότεροι άνθρωποι σε όλο τον κόσμο έχουν πρόσβαση στα οφέλη και τις ευκαιρίες της τεχνητής νοημοσύνης, η ισχύς δεν συγκεντρώνεται στα χέρια λίγων εταιρειών και ότι η τεχνολογία μπορεί να αναπτυχθεί πιο ομοιόμορφα και με ασφάλεια στην κοινωνία.

Υπάρχει μια συνεχής συζήτηση σχετικά με την ασφάλεια των μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα και η άποψή μου είναι ότι η τεχνητή νοημοσύνη ανοιχτού κώδικα θα είναι ασφαλέστερη από τις εναλλακτικές.

Κατανοώ ότι το πλαίσιο ασφαλείας είναι ότι πρέπει να προστατεύσουμε από δύο είδη βλάβης: ακούσια και σκόπιμη. Η ακούσια βλάβη είναι όταν ένα σύστημα τεχνητής νοημοσύνης μπορεί να προκαλέσει βλάβη, παρόλο που το άτομο που το διαχειριζόταν δεν είχε την πρόθεση να το κάνει. Για παράδειγμα, τα σύγχρονα μοντέλα τεχνητής νοημοσύνης μπορεί να δίνουν ακούσια κακές συμβουλές υγείας. Ή, σε ένα πιο φουτουριστικό σενάριο, κάποιοι ανησυχούν ότι τα μοντέλα θα μπορούσαν να αναπαραχθούν ακούσια ή να υπερβελτιστοποιήσουν τους στόχους σε βάρος των ανθρώπων. Σκόπιμη βλάβη είναι όταν ένας κακός ηθοποιός χρησιμοποιεί ένα μοντέλο AI με σκοπό να προκαλέσει βλάβη.

Αξίζει να σημειωθεί ότι η ακούσια βλάβη καλύπτει τις περισσότερες από τις ανησυχίες που έχουν οι άνθρωποι για την τεχνητή νοημοσύνη - από τον αντίκτυπο που θα έχουν τα συστήματα AI στα δισεκατομμύρια των ανθρώπων που τα χρησιμοποιούν, μέχρι τα περισσότερα από τα σενάρια επιστημονικής φαντασίας που είναι πραγματικά καταστροφικά για την ανθρωπότητα. Από αυτή την άποψη, ο ανοιχτός κώδικας θα πρέπει να είναι ασφαλέστερος επειδή το σύστημα είναι πιο διαφανές και μπορεί να ελεγχθεί ευρέως. Ιστορικά, το λογισμικό ανοιχτού κώδικα ήταν επομένως πιο ασφαλές. Ομοίως, η χρήση του Llama και των συστημάτων ασφαλείας του, όπως το Llama Guard, θα είναι πιθανότατα ασφαλέστερη και πιο αξιόπιστη από ένα μοντέλο κλειστού κώδικα. Ως αποτέλεσμα, οι περισσότερες συζητήσεις σχετικά με την ασφάλεια της τεχνητής νοημοσύνης ανοιχτού κώδικα επικεντρώνονται σε σκόπιμη βλάβη.

Η διαδικασία ασφαλείας μας περιλαμβάνει αυστηρές δοκιμές και κόκκινες ομάδες για την αξιολόγηση της ικανότητας των μοντέλων μας να προκαλούν σημαντική βλάβη, με στόχο τον μετριασμό του κινδύνου πριν από την κυκλοφορία. Δεδομένου ότι το μοντέλο είναι ανοιχτό, ο καθένας μπορεί να το δοκιμάσει μόνος του. Πρέπει να θυμόμαστε ότι αυτά τα μοντέλα εκπαιδεύονται σε πληροφορίες που υπάρχουν ήδη στον ιστό, επομένως, όταν εξετάζουμε το ενδεχόμενο βλάβης, το σημείο εκκίνησης θα πρέπει να είναι αν το μοντέλο μπορεί να συμβάλει σε μεγαλύτερη βλάβη από πληροφορίες που μπορούν να ανακτηθούν γρήγορα από το Google ή άλλα αποτελέσματα αναζήτησης.

Καθώς εξετάζετε τις μελλοντικές ευκαιρίες, να θυμάστε ότι οι περισσότερες από τις σημερινές κορυφαίες εταιρείες τεχνολογίας και επιστημονικής έρευνας βασίζονται σε λογισμικό ανοιχτού κώδικα. Εάν επενδύσουμε μαζί, η επόμενη γενιά εταιρειών και έρευνας θα χρησιμοποιήσει τεχνητή νοημοσύνη ανοιχτού κώδικα.

Το πιο σημαντικό, η τεχνητή νοημοσύνη ανοιχτού κώδικα αντιπροσωπεύει την καλύτερη ευκαιρία στον κόσμο για να αξιοποιηθεί αυτή η τεχνολογία για να μεγιστοποιηθούν οι οικονομικές ευκαιρίες και η ασφάλεια για όλους.

ας χτίσουμε μαζί

Όπως και με τα προηγούμενα μοντέλα Llama, η Meta αναπτύχθηκε και στη συνέχεια κυκλοφόρησε τον εαυτό της χωρίς να δώσει ιδιαίτερη προσοχή στη δημιουργία ενός ευρύτερου οικοσυστήματος. Ακολουθήσαμε μια διαφορετική προσέγγιση με αυτό το λανσάρισμα. Χτίζουμε την ομάδα εσωτερικά για να κάνουμε το Llama διαθέσιμο σε όσο το δυνατόν περισσότερους προγραμματιστές και συνεργάτες, και επίσης χτίζουμε ενεργά συνεργασίες, ώστε περισσότερες εταιρείες στο οικοσύστημα να μπορούν επίσης να παρέχουν μοναδικές δυνατότητες στους πελάτες τους.

πιστεύωΗ κυκλοφορία του Llama 3.1 θα είναι ένα σημείο καμπής για τη βιομηχανία , οι περισσότεροι προγραμματιστές θα αρχίσουν να χρησιμοποιούν κυρίως ανοιχτό κώδικα και αναμένω ότι αυτή η προσέγγιση θα αναπτυχθεί μόνο από εδώ και στο εξής. Ελπίζω να είστε μαζί μας στο ταξίδι μας για να φέρουμε τα οφέλη της τεχνητής νοημοσύνης σε όλους στον κόσμο.

Σύνδεσμος τελευταίας συνέντευξης:
https://x.com/rowancheung/status/1815763595197616155

Σύνδεσμοι αναφοράς:
[1]https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/
[2]https://ai.meta.com/blog/meta-llama-3-1/

Νέα

Ανοιχτός κώδικας = το πιο ισχυρό μοντέλο! Κυκλοφόρησε το Llama 3.1, Zuckerberg: watershed moment

Εισαγωγή

τα στοιχεία επικοινωνίας μου