Το Llama 3.1 κυκλοφόρησε επίσημα: Μοντέλο 405 δισεκατομμυρίων παραμέτρων ανοιχτού κώδικα Xiao Zha: Εκτελέστε τον ανοιχτό κώδικα μέχρι το τέλος

2024-07-24

Κείμενο |. Deng Yongyi και Zhou Xinyu

Συντάκτης Σου Τζιανξούν

Ο θρόνος του GPT-4o δεν είναι ακόμη ζεστός, ο Xiao Zha ηγήθηκε του στρατού ανοιχτού κώδικα και όρμησε εκεί——

Όπως φημολογήθηκε προηγουμένως, ο Meta κυκλοφόρησε επίσημα το Llama 3.1 στις 23 Ιουλίου, ώρα Ειρηνικού στις Ηνωμένες Πολιτείες. Αυτή είναι η πιο ευρέως χρησιμοποιούμενη και κορυφαία σειρά μεγάλων μοντέλων στον τομέα ανοιχτού κώδικα σήμερα.

Συμπτωματικά, μια μέρα πριν από την κυκλοφορία του, το Llama 3.1 «διέρρευσε» στην κοινότητα προγραμματιστών.

Οι επίσημα δημοσιευμένες πληροφορίες του Llama 3.1 είναι επίσης συνεπείς με τις ειδήσεις: υπάρχουν τρία μεγέθη: 8B, 70B και 405B και το μήκος περιβάλλοντος έχει αυξηθεί στα 128K.

Σύμφωνα με τα δεδομένα δοκιμών αναφοράς που παρέχονται από τη Meta, το πιο δημοφιλές 405B (405 δισεκατομμύρια παράμετροι) είναι ήδη συγκρίσιμο σε απόδοση με το GPT-4 και το Claude 3.5.

△Σύγκριση με GPT-4 και Claude 3.5

Μπροστά στα σημερινά κορυφαία μοντέλα του Yishui, το Llama 3.1 δεν φοβάται:

△Σύγκριση με μοντέλο κλειστού κώδικα

△Σύγκριση με μοντέλο ανοιχτού κώδικα

Μπορεί να ειπωθεί ότι η κυκλοφορία του Llama 3.1 έγραψε ένα ορόσημο στην πρόσφατη σκληρή μάχη μεταξύ των διαδρομών ανοιχτού κώδικα και κλειστού κώδικα: τα κορυφαία μοντέλα ανοιχτού κώδικα ένωσαν πραγματικά τις δυνάμεις τους με τα κορυφαία μοντέλα κλειστού κώδικα.

"Μέχρι στιγμής, τα μοντέλα ανοιχτού κώδικα μεγάλης κλίμακας υστερούν ως επί το πλείστον σε σχέση με τα κλειστά μοντέλα όσον αφορά τη λειτουργικότητα και την απόδοση. Τώρα, εγκαινιάζουμε μια νέα εποχή με επικεφαλής τον ανοιχτό κώδικα."

△Μια εικόνα που έχει γίνει δημοφιλής στον κύκλο της τεχνητής νοημοσύνης πρόσφατα, το μοντέλο ανοιχτού κώδικα πλησιάζει το μοντέλο κλειστού κώδικα

Το Meta επισύναψε επίσης ένα έγγραφο 92 σελίδων στην επίσημη κυκλοφορία του, αποκαλύπτοντας λεπτομέρειες εκπαίδευσης:

Το Llama 3.1 εκπαιδεύτηκε σε δεδομένα περισσότερων από 15 τρισεκατομμύρια μάρκες, χρησιμοποιώντας 16.000 μπλοκ H100. Τα δεδομένα προεκπαίδευσης που χρησιμοποιούνται είναι τον Δεκέμβριο του 2023. Προκειμένου να διασφαλιστεί η σταθερότητα της προπόνησης, χρησιμοποιείται μόνο η αρχιτεκτονική του μοντέλου Transformer για προσαρμογή, αντί της επί του παρόντος δημοφιλής αρχιτεκτονικής Mixed Expert Model (MoE).

Αυτό οδηγεί επίσης στο γεγονός ότι το Llama 3.1 μπορεί να διατηρήσει υψηλής ποιότητας έξοδο σύντομων παραθύρων περιβάλλοντος, ακόμη κι αν επεκταθεί σε μήκος περιβάλλοντος 128K Δεν είναι πλέον "ειδικό μεγάλο κείμενο", αλλά "μεγάλο και σύντομο ελεύθερα".

Επί του παρόντος δεν υπάρχει τόσο μεγάλο μοντέλο ανοιχτού κώδικα στον κόσμο που να έχει φτάσει σε τέτοια κλίμακα εκπαίδευσης.

Για περισσότερες λεπτομέρειες, το παρουσιάσαμε επίσης λεπτομερώς στο push πριν από λίγες ώρες.

Το 2024, καθώς η κλίμακα της εκπαίδευσης μοντέλων γίνεται όλο και μεγαλύτερη, οι προγραμματιστές αναρωτιούνται επίσης: Θα συνεχίσουν να χρησιμοποιούν ανοιχτό κώδικα οι μεγάλες εταιρείες που έχουν πληρώσει τεράστιο κόστος εκπαίδευσης;

Εξάλλου, το OpenAI είναι ένα μάθημα που αντλήθηκε από το παρελθόν - τηρούσε το πνεύμα του ανοιχτού κώδικα στις πρώτες μέρες, αλλά από τότε που το GPT3.5 έγινε δημοφιλές και διατέθηκε στο εμπόριο, το OpenAI δεν είναι πλέον ανοιχτού κώδικα και γελοιοποιείται ως Closed AI.

Αλλά τη στιγμή που κυκλοφόρησε το Llama 3.1, ο Zuckerberg τόνισε ξανά:

Εκτελέστε το open source μέχρι το τέλος!

Εκτός από την κυκλοφορία του μοντέλου, ο Xiao Zha δημοσίευσε επίσης ένα στοχαστικό και ιδεαλιστικό μανιφέστο ανοιχτού κώδικα, εξηγώντας γιατί το Meta πρέπει να είναι ανοιχτού κώδικα και γιατί ο ανοιχτός κώδικας είναι επωφελής για τους προγραμματιστές.

Αξίζει να σημειωθεί ότι πιστεύει ότι αν και οι Ηνωμένες Πολιτείες και η Κίνα αντιμετωπίζουν έντονο ανταγωνισμό τεχνητής νοημοσύνης, η επιλογή της διαδρομής ανοιχτού κώδικα εξακολουθεί να έχει περισσότερα πλεονεκτήματα παρά μειονεκτήματα.

Εντάξει, το Llama 3.1 είναι ήδη έτσι, και πρέπει να κάνουμε ξανά το ερώτημα: Πότε θα έρθουν το OpenAI και το GPT-5;

Ακολουθεί η ανοιχτή επιστολή του Zuckerberg, που συντάχθηκε από το "Intelligent Emergence":

"Το Open Source AI Is the Path Forward"

Στις πρώτες ημέρες των υπολογιστών υψηλής απόδοσης, οι μεγάλες εταιρείες τεχνολογίας της εποχής επένδυσαν πολλά στην ανάπτυξη των δικών τους εκδόσεων κλειστού κώδικα του Unix. Εκείνη την εποχή, ήταν δύσκολο να φανταστεί κανείς άλλο τρόπο ανάπτυξης τόσο προηγμένου λογισμικού.

Ωστόσο, το Linux ανοιχτού κώδικα τελικά έπιασε - αρχικά επειδή επέτρεπε στους προγραμματιστές να τροποποιήσουν τον κώδικά του με όποιον τρόπο ήθελαν και ήταν φθηνότερο με την πάροδο του χρόνου, έγινε πιο προηγμένο, πιο ασφαλές και Έχει ένα ευρύτερο οικοσύστημα από οποιοδήποτε Unix κλειστού κώδικα, υποστηρίζοντας περισσότερες δυνατότητες. . Σήμερα, το Linux είναι η βιομηχανική βάση για το cloud computing και το λειτουργικό σύστημα που τρέχει τις περισσότερες κινητές συσκευές—και όλοι επωφελούμαστε από την αριστεία του.

Πιστεύω ότι η τεχνητή νοημοσύνη θα αναπτυχθεί με παρόμοιο τρόπο. Σήμερα, αρκετές εταιρείες τεχνολογίας αναπτύσσουν κορυφαία μοντέλα κλειστού κώδικα. Αλλά ο ανοιχτός κώδικας κλείνει γρήγορα αυτό το κενό. Πέρυσι, το Llama 2 ήταν συγκρίσιμο μόνο με μοντέλα παλαιότερης γενιάς που υστερούσαν σε σχέση με την αιχμή. Φέτος, το Llama 3 ανταγωνίζεται τα πιο προηγμένα μοντέλα και ηγείται σε ορισμένους τομείς. Από το επόμενο έτος, αναμένουμε ότι η μελλοντική Llama θα είναι η πιο προηγμένη στον κλάδο. Αλλά πριν από αυτό, η Llama ήταν ήδη πρωτοπόρος στον ανοιχτό κώδικα, τη δυνατότητα τροποποίησης και την αποδοτικότητα κόστους.

Σήμερα, κάνουμε το επόμενο βήμα για να κάνουμε την τεχνητή νοημοσύνη ανοιχτού κώδικα το πρότυπο του κλάδου. Θα κυκλοφορήσουμε το Llama 3.1 405B, το πρώτο κορυφαίο στη βιομηχανία μοντέλο ανοιχτού κώδικα AI, καθώς και νέα και βελτιωμένα μοντέλα Llama 3.1 70B και 8B. Εκτός από το ότι έχει καλύτερο κόστος/απόδοση σε σχέση με τα μοντέλα κλειστού κώδικα, το γεγονός ότι το μοντέλο 405B είναι ανοιχτού κώδικα θα το καταστήσει την καλύτερη επιλογή για τελειοποίηση και εξαγωγή μικρότερων μοντέλων.

Εκτός από την κυκλοφορία αυτών των μοντέλων, συνεργαζόμαστε επίσης με μια σειρά εταιρειών για την ανάπτυξη του ευρύτερου οικοσυστήματος. Η Amazon, η Databricks και η Nvidia λανσάρουν μια πλήρη σειρά υπηρεσιών για να επιτρέψουν στους προγραμματιστές να βελτιστοποιήσουν και να βελτιώσουν τα δικά τους μοντέλα. Καινοτόμες εταιρείες όπως η Groq (μια εκκίνηση chip AI) έχουν δημιουργήσει υπηρεσίες συμπερασμάτων χαμηλής καθυστέρησης και χαμηλού κόστους για όλα τα νέα μοντέλα.

Αυτά τα μοντέλα θα είναι διαθέσιμα σε όλα τα μεγάλα cloud, συμπεριλαμβανομένων των AWS, Azure, Google, Oracle και άλλων. Η Scale.AI, η Dell, η Deloitte και άλλοι είναι έτοιμοι να βοηθήσουν τις επιχειρήσεις να αναπτύξουν το Llama και να εκπαιδεύσουν προσαρμοσμένα μοντέλα χρησιμοποιώντας τα δικά τους δεδομένα. Καθώς η κοινότητα μεγαλώνει και περισσότερες εταιρείες αναπτύσσουν νέες υπηρεσίες, μαζί μπορούμε να κάνουμε το Llama πρότυπο του κλάδου και να φέρουμε τα οφέλη της τεχνητής νοημοσύνης σε όλους.

Η Meta έχει δεσμευτεί για τεχνητή νοημοσύνη ανοιχτού κώδικα. Θα περιγράψω γιατί πιστεύω ότι ο ανοιχτός κώδικας είναι η καλύτερη στοίβα ανάπτυξης για τους ανθρώπους, γιατί το ανοιχτού κώδικα Llama είναι καλό για το Meta, γιατί η τεχνητή νοημοσύνη ανοιχτού κώδικα είναι καλή για τον κόσμο και γι' αυτό, η κοινότητα ανοιχτού κώδικα είναι εδώ για να μείνει.

Γιατί το AI ανοιχτού κώδικα είναι καλό για προγραμματιστές

Όταν μιλάω με προγραμματιστές, CEOs και κυβερνητικούς αξιωματούχους σε όλο τον κόσμο, ακούω συνήθως μερικά θέματα:

Πρέπει να εκπαιδεύσουμε, να τελειοποιήσουμε και να τελειοποιήσουμε τα δικά μας μοντέλα.

Κάθε οργανισμός έχει διαφορετικές ανάγκες που εξυπηρετούνται καλύτερα από μοντέλα διαφορετικών μεγεθών που εκπαιδεύονται ή βελτιστοποιούνται χρησιμοποιώντας συγκεκριμένα δεδομένα. Οι εργασίες στη συσκευή και οι εργασίες ταξινόμησης απαιτούν μικρότερα μοντέλα, ενώ οι πιο σύνθετες εργασίες απαιτούν μεγαλύτερα μοντέλα.

Τώρα θα μπορείτε να παίρνετε μοντέλα Llama τελευταίας τεχνολογίας, να συνεχίσετε να τα εκπαιδεύετε χρησιμοποιώντας τα δικά σας δεδομένα και, στη συνέχεια, να τα τελειοποιείτε στο μοντέλο σας με το βέλτιστο μέγεθος - χωρίς εμείς ή κανένας άλλος να δει ποτέ τα δεδομένα σας.

Πρέπει να ελέγχουμε τη μοίρα μας και να μην είμαστε συνδεδεμένοι με έναν πωλητή κλειστής πηγής.

Πολλοί οργανισμοί δεν θέλουν να βασίζονται σε ένα μοντέλο που δεν μπορούν να διαχειριστούν και να ελέγξουν. Δεν θέλουν οι πάροχοι μοντέλων κλειστού κώδικα να μπορούν να αλλάξουν τα μοντέλα τους, να αλλάξουν τους όρους χρήσης τους ή ακόμα και να σταματήσουν να τους εξυπηρετούν εντελώς. Επίσης, δεν θέλουν να κλειδωθούν σε ένα μόνο σύννεφο που έχει αποκλειστικά δικαιώματα σε ένα συγκεκριμένο μοντέλο. Ο ανοιχτός κώδικας παρέχει συμβατές αλυσίδες εργαλείων για πολλά εταιρικά οικοσυστήματα και μπορείτε εύκολα να κάνετε εναλλαγή μεταξύ τους.

Πρέπει να προστατεύσουμε τα δεδομένα μας.

Πολλοί οργανισμοί χειρίζονται ευαίσθητα δεδομένα που πρέπει να προστατεύονται και δεν μπορούν να μεταφερθούν μέσω των API cloud σε ένα μοντέλο κλειστού κώδικα. Άλλοι οργανισμοί απλώς δεν εμπιστεύονται τους παρόχους μοντέλων κλειστού κώδικα με τα δεδομένα τους. Ο ανοιχτός κώδικας επιλύει αυτά τα προβλήματα επιτρέποντάς σας να εκτελέσετε το μοντέλο οπουδήποτε θέλετε. Είναι ευρέως αποδεκτό ότι το λογισμικό ανοιχτού κώδικα είναι πιο ασφαλές επειδή αναπτύσσεται με μεγαλύτερη διαφάνεια.

Χρειαζόμαστε ένα αποδοτικό και προσιτό μοντέλο λειτουργίας.

Οι προγραμματιστές μπορούν να εκτελέσουν συμπεράσματα στο Llama 3.1 405B στη δική τους υποδομή με περίπου 50% το κόστος χρήσης μοντέλων κλειστού κώδικα όπως το GPT-4o για εργασίες εξαγωγής συμπερασμάτων που αντιμετωπίζουν οι χρήστες και εκτός σύνδεσης.

Ποντάρουμε σε ένα οικοσύστημα που μπορεί να γίνει το μακροπρόθεσμο πρότυπο.

Πολλοί άνθρωποι βλέπουν τον ανοιχτό κώδικα να κινείται πιο γρήγορα από τα μοντέλα κλειστού κώδικα και θέλουν η αρχιτεκτονική στην οποία είναι κατασκευασμένα τα συστήματά τους να τους παρέχει το μεγαλύτερο μακροπρόθεσμο πλεονέκτημα.

Γιατί το AI ανοιχτού κώδικα είναι καλό για το Meta

Το επιχειρηματικό μοντέλο της Meta είναι να δημιουργεί τις καλύτερες εμπειρίες και υπηρεσίες για τους ανθρώπους. Για να γίνει αυτό, πρέπει να διασφαλίσουμε ότι έχουμε πάντα πρόσβαση στην καλύτερη τεχνολογία, αντί να εγκλωβιζόμαστε στο οικοσύστημα κλειστού κώδικα ενός ανταγωνιστή που περιορίζει ό,τι μπορούμε να δημιουργήσουμε.

Μία από τις εμπειρίες μου ήταν ότι οι υπηρεσίες μας περιορίζονταν από αυτό που μας επέτρεψε η Apple να δημιουργήσουμε στην πλατφόρμα της. Ο τρόπος με τον οποίο φορολογούν τους προγραμματιστές, τους αυθαίρετους κανόνες που εφαρμόζουν και όλη την καινοτομία προϊόντων που εμποδίζουν να κυκλοφορήσει, είναι σαφές ότι αν μπορούμε να δημιουργήσουμε τις καλύτερες εκδόσεις των προϊόντων μας και οι ανταγωνιστές δεν μπορούν να περιορίσουν αυτό που μπορούμε να δημιουργήσουμε, τότε η Meta και Πολλές άλλες εταιρείες θα είναι ελεύθερες να δημιουργήσουν καλύτερες υπηρεσίες για τους ανθρώπους. Σε φιλοσοφικό επίπεδο, αυτός είναι ο κύριος λόγος για τον οποίο πιστεύω τόσο έντονα στη δημιουργία ενός οικοσυστήματος ανοιχτού κώδικα για την επόμενη γενιά υπολογιστών σε AI και AR/VR.

Οι άνθρωποι συχνά με ρωτούν εάν ανησυχώ ότι η ανοιχτή πηγή Llama θα εγκαταλείψει τα τεχνικά πλεονεκτήματα, αλλά νομίζω ότι αυτό αγνοεί ορισμένους σημαντικούς λόγους:

Πρώτον, για να διασφαλίσουμε ότι έχουμε πρόσβαση στην καλύτερη τεχνολογία και ότι δεν θα εγκλωβιστούμε σε ένα οικοσύστημα κλειστού κώδικα για μεγάλα χρονικά διαστήματα, το Llama πρέπει να εξελιχθεί σε ένα πλήρες οικοσύστημα που περιλαμβάνει εργαλεία, βελτιώσεις απόδοσης, βελτιστοποίηση πυριτίου και άλλες ενσωματώσεις. Αν ήμασταν η μόνη εταιρεία που χρησιμοποιούσε το Llama, το οικοσύστημα δεν θα αναπτυσσόταν και δεν θα ήμασταν καλύτεροι από τις παραλλαγές Unix κλειστού κώδικα.

Δεύτερον, αναμένω ότι ο ανταγωνισμός θα ενταθεί καθώς αναπτύσσεται η νοημοσύνη, πράγμα που σημαίνει ότι σε εκείνο το σημείο, σε οποιοδήποτε συγκεκριμένο μοντέλο ανοιχτού κώδικα, οι άνθρωποι δεν θα εγκαταλείψουν το επόμενο μοντέλο που έχει μεγαλύτερο πλεονέκτημα. Ο δρόμος της Llama για να γίνει ένα βιομηχανικό πρότυπο είναι μέσω ενός μοντέλου συνεπούς ανταγωνισμού, αποτελεσματικότητας και ανοιχτού κώδικα από γενιά σε γενιά.

Τρίτον, μια βασική διαφορά μεταξύ της Meta και των παρόχων μοντέλων κλειστού κώδικα είναι ότι η πώληση πρόσβασης σε μοντέλα τεχνητής νοημοσύνης δεν είναι το επιχειρηματικό μας μοντέλο. Αυτό σημαίνει ότι η δημόσια κυκλοφορία του Llama δεν βλάπτει τα έσοδα, τη βιωσιμότητα ή την ικανότητά μας να επενδύουμε στην έρευνα, όπως συμβαίνει με τους προμηθευτές κλειστού κώδικα. (Αυτός είναι ένας λόγος για τον οποίο αρκετοί πάροχοι κλειστού κώδικα ασκούν πιέσεις στις κυβερνήσεις κατά του ανοιχτού κώδικα.)

Τέλος, το Meta έχει μακρά ιστορία και επιτυχία σε έργα ανοιχτού κώδικα. Εξοικονομήσαμε δισεκατομμύρια δολάρια κυκλοφορώντας τα σχέδια των διακομιστών, του δικτύου και των κέντρων δεδομένων μας μέσω του Έργου Υπολογιστικού Ανοικτού Κώδικα και τυποποιώντας την αλυσίδα εφοδιασμού μας στα σχέδιά μας. Επωφελούμαστε από την καινοτομία του οικοσυστήματος, τα κορυφαία εργαλεία ανοιχτού κώδικα όπως τα PyTorch, React και πολλά άλλα. Αυτή η προσέγγιση λειτούργησε πάντα για εμάς όταν κολλήσαμε σε αυτήν μακροπρόθεσμα.

Γιατί η τεχνητή νοημοσύνη ανοιχτού κώδικα είναι καλή για τον κόσμο

Πιστεύω ότι ο ανοιχτός κώδικας είναι απαραίτητος για ένα θετικό μέλλον AI. Η τεχνητή νοημοσύνη έχει μεγαλύτερες δυνατότητες από οποιαδήποτε άλλη σύγχρονη τεχνολογία να αυξήσει την ανθρώπινη παραγωγικότητα, τη δημιουργικότητα και την ποιότητα ζωής και να προωθήσει την ιατρική και επιστημονική έρευνα επιταχύνοντας παράλληλα την οικονομική ανάπτυξη.

Το ανοιχτό κώδικα θα διασφαλίσει ότι περισσότεροι άνθρωποι σε όλο τον κόσμο έχουν πρόσβαση στα οφέλη και τις ευκαιρίες της τεχνητής νοημοσύνης, η ισχύς δεν συγκεντρώνεται στα χέρια λίγων εταιρειών και ότι η τεχνολογία μπορεί να αναπτυχθεί πιο ομοιόμορφα και με ασφάλεια στην κοινωνία.

Υπάρχει μια συνεχής συζήτηση σχετικά με την ασφάλεια των μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα και η άποψή μου είναι ότι η τεχνητή νοημοσύνη ανοιχτού κώδικα θα είναι πιο ασφαλής από τις εναλλακτικές. Νομίζω ότι οι κυβερνήσεις θα καταλήξουν στο συμπέρασμα ότι είναι προς το συμφέρον τους να υποστηρίξουν τον ανοιχτό κώδικα, επειδή θα κάνει τον κόσμο πιο ευημερούν και ασφαλή.

Η κατανόησή μου για την ασφάλεια είναι ότι πρέπει να προστατεύσουμε από δύο είδη βλάβης: ακούσια βλάβη και σκόπιμη βλάβη. Η ακούσια βλάβη είναι όταν ένα σύστημα τεχνητής νοημοσύνης μπορεί να προκαλέσει βλάβη, παρόλο που το άτομο που το εκτελεί δεν είχε καμία πρόθεση να το κάνει.

Για παράδειγμα, τα σύγχρονα μοντέλα τεχνητής νοημοσύνης μπορεί να δίνουν ακούσια κακές συμβουλές υγείας. Ή, σε ένα πιο φουτουριστικό σενάριο, κάποιοι ανησυχούν ότι τα μοντέλα θα μπορούσαν να αναπαραχθούν ακούσια ή να υπερβελτιστοποιήσουν τους στόχους σε βάρος των ανθρώπων. Σκόπιμη βλάβη είναι όταν ένας κακός ηθοποιός χρησιμοποιεί ένα μοντέλο AI με στόχο να προκαλέσει βλάβη.

Αξίζει να σημειωθεί ότι η ακούσια βλάβη καλύπτει τις περισσότερες από τις ανησυχίες των ανθρώπων σχετικά με την τεχνητή νοημοσύνη - από τον αντίκτυπο που θα έχουν τα συστήματα AI στα δισεκατομμύρια ανθρώπων που θα τα χρησιμοποιήσουν μέχρι τα πιο πραγματικά καταστροφικά σενάρια επιστημονικής φαντασίας για την ανθρωπότητα. Από αυτή την άποψη, ο ανοιχτός κώδικας θα πρέπει να είναι πολύ πιο ασφαλής επειδή το σύστημα είναι πιο διαφανές και μπορεί να ελεγχθεί ευρέως.

Ιστορικά, το λογισμικό ανοιχτού κώδικα ήταν πιο ασφαλές για αυτόν τον λόγο. Ομοίως, η χρήση του Llama και των συστημάτων ασφαλείας του, όπως το Llama Guard, μπορεί να είναι πιο ασφαλής από ένα μοντέλο κλειστού κώδικα. Ως αποτέλεσμα, οι περισσότερες συζητήσεις σχετικά με την ασφάλεια τεχνητής νοημοσύνης ανοιχτού κώδικα επικεντρώνονται σε σκόπιμη βλάβη.

Η διαδικασία ασφαλείας μας περιλαμβάνει αυστηρές δοκιμές και κόκκινες ομάδες για να αξιολογήσουν εάν τα μοντέλα μας είναι ικανά να προκαλέσουν σημαντική βλάβη, με στόχο τον μετριασμό του κινδύνου πριν από την κυκλοφορία. Δεδομένου ότι το μοντέλο είναι ανοιχτού κώδικα, ο καθένας μπορεί να το δοκιμάσει μόνος του.

Πρέπει να θυμόμαστε ότι αυτά τα μοντέλα εκπαιδεύονται σε πληροφορίες που είναι ήδη διαθέσιμες στο Διαδίκτυο, επομένως, όταν εξετάζουμε το ενδεχόμενο βλάβης, το σημείο εκκίνησης θα πρέπει να είναι εάν ένα μοντέλο είναι ταχύτερο από τις πληροφορίες που μπορούν να ανακτηθούν από το Google ή άλλα αποτελέσματα αναζήτησης Είναι πιο πιθανό να προκαλέσει βλάβη.

Όταν συλλογίζεστε για σκόπιμη βλάβη, είναι χρήσιμο να γίνεται διάκριση μεταξύ του τι μπορεί να κάνει ένα άτομο ή ένας παράγοντας μικρής κλίμακας και τι μπορεί να κάνει ένας παράγοντας μεγάλης κλίμακας, όπως ένα έθνος-κράτος με τεράστιους πόρους.

Κάποια στιγμή στο μέλλον, μεμονωμένοι κακοί ηθοποιοί μπορεί να εκμεταλλευτούν τη νοημοσύνη των μοντέλων AI για να δημιουργήσουν εντελώς νέους τύπους βλάβης από πληροφορίες που είναι διαθέσιμες στο διαδίκτυο. Σε αυτό το σημείο, η ισορροπία δυνάμεων θα είναι κρίσιμη για την ασφάλεια της τεχνητής νοημοσύνης.

Νομίζω ότι θα ήταν καλύτερο να ζούμε σε έναν κόσμο όπου η τεχνητή νοημοσύνη είναι ευρέως αναπτυγμένη, έτσι ώστε οι μεγάλοι παίκτες να μπορούν να αντισταθμίσουν τη δύναμη των μικρότερων κακών. Αυτός είναι ο τρόπος με τον οποίο διαχειριζόμαστε την ασφάλεια στα κοινωνικά δίκτυα—τα πιο ισχυρά συστήματα τεχνητής νοημοσύνης μας εντοπίζουν και αποκλείουν απειλές από λιγότερο εξελιγμένους εισβολείς που χρησιμοποιούν συχνά μικρότερα συστήματα τεχνητής νοημοσύνης.

Γενικότερα, μεγάλα ιδρύματα που αναπτύσσουν τεχνητή νοημοσύνη σε κλίμακα θα συμβάλουν στην ασφάλεια και τη σταθερότητα της κοινωνίας στο σύνολό της. Εφόσον όλοι έχουν πρόσβαση σε παρόμοια μοντέλα -κάτι που διευκολύνει το ανοιχτό κώδικα-, τότε οι κυβερνήσεις και οι οργανισμοί με περισσότερους υπολογιστικούς πόρους θα μπορούν να ελέγχουν τους κακούς παράγοντες με λιγότερους υπολογισμούς.

Το επόμενο ερώτημα είναι πώς οι Ηνωμένες Πολιτείες και οι δημοκρατίες πρέπει να ανταποκριθούν στις απειλές από χώρες με τεράστιους πόρους όπως η Κίνα. Το πλεονέκτημα των Ηνωμένων Πολιτειών έγκειται στην αποκέντρωση και στην καινοτομία ανοιχτού κώδικα.

Μερικοί άνθρωποι πιστεύουν ότι πρέπει να μπλοκάρουμε τα μοντέλα μας για να εμποδίσουμε την Κίνα να τα αποκτήσει, αλλά η άποψή μου είναι ότι αυτό δεν θα λειτουργήσει και θα φέρει μόνο σε μειονεκτική θέση τις Ηνωμένες Πολιτείες και τους συμμάχους τους. Οι αντίπαλοί μας είναι πολύ καλοί στην κατασκοπεία Η κλοπή μοντέλων σε ένα USB stick είναι σχετικά εύκολη και ο τρόπος με τον οποίο λειτουργούν οι περισσότερες εταιρείες τεχνολογίας δεν το καθιστά πολύ πιο δύσκολο.

Ένας κόσμος μόνο μοντέλων κλειστού κώδικα φαίνεται πολύ πιθανό να έχει ως αποτέλεσμα μια χούφτα μεγάλων εταιρειών καθώς και οι γεωπολιτικοί μας αντίπαλοι να έχουν πρόσβαση σε κορυφαία μοντέλα, ενώ οι νεοφυείς επιχειρήσεις, τα πανεπιστήμια και οι μικρές επιχειρήσεις θα χάσουν τη δυνατότητα.

Επιπλέον, ο περιορισμός της καινοτομίας των ΗΠΑ στην ανάπτυξη κλειστού κώδικα αυξάνει την πιθανότητα απλώς να μην ηγούμαστε. Αντίθετα, πιστεύω ότι η καλύτερη στρατηγική μας είναι να οικοδομήσουμε ένα ισχυρό οικοσύστημα ανοιχτού κώδικα και οι κορυφαίες εταιρείες μας να συνεργάζονται στενά με τις κυβερνήσεις και τους συμμάχους μας για να διασφαλίσουν ότι μπορούν να επωφεληθούν καλύτερα από τις τελευταίες εξελίξεις και να είναι βιώσιμες μακροπρόθεσμα.

Καθώς εξετάζετε τις μελλοντικές ευκαιρίες, να θυμάστε ότι οι περισσότερες από τις σημερινές κορυφαίες εταιρείες τεχνολογίας και επιστημονικής έρευνας βασίζονται σε λογισμικό ανοιχτού κώδικα. Εάν επενδύσουμε μαζί, η επόμενη γενιά εταιρειών και έρευνας θα χρησιμοποιήσει τεχνητή νοημοσύνη ανοιχτού κώδικα. Αυτό περιλαμβάνει νεοσύστατες startups, καθώς και άτομα σε πανεπιστήμια και χώρες που μπορεί να μην έχουν τους πόρους για να αναπτύξουν τη δική τους τελευταίας τεχνολογίας AI από την αρχή.

Το πιο σημαντικό, η τεχνητή νοημοσύνη ανοιχτού κώδικα αντιπροσωπεύει την καλύτερη ευκαιρία στον κόσμο να αξιοποιήσει αυτή την τεχνολογία για να δημιουργήσει τη μεγαλύτερη οικονομική ευκαιρία και ασφάλεια για όλους.

ας χτίσουμε μαζί

Για τα προηγούμενα μοντέλα Llama, η Meta τα ανέπτυξε για τον εαυτό της και στη συνέχεια τα κυκλοφόρησε χωρίς να εστιάσει πολύ στην οικοδόμηση του ευρύτερου οικοσυστήματος.

Ακολουθούμε μια διαφορετική προσέγγιση με αυτήν την κυκλοφορία. Δημιουργούμε ομάδες εσωτερικά για να κάνουμε το Llama διαθέσιμο σε όσο το δυνατόν περισσότερους προγραμματιστές και συνεργάτες, και επίσης χτίζουμε ενεργά συνεργασίες, ώστε περισσότερες εταιρείες στο οικοσύστημα να μπορούν επίσης να προσφέρουν μοναδικές δυνατότητες στους πελάτες τους.

Πιστεύω ότι η κυκλοφορία του Llama 3.1 θα είναι ένα σημείο καμπής στον κλάδο, με τους περισσότερους προγραμματιστές να αρχίζουν να χρησιμοποιούν κυρίως ανοιχτό κώδικα και ελπίζω ότι αυτή η προσέγγιση θα αναπτυχθεί μόνο από εδώ. Ελπίζω να είστε μαζί μας στο ταξίδι μας για να φέρουμε τα οφέλη της τεχνητής νοημοσύνης σε όλους στον κόσμο.

Ο σύνδεσμος για να αποκτήσετε το Llama 3.1 είναι: https://llama.meta.com/

MZ (Μαρκ Ζούκερμπεργκ)

Καλώς ήρθατε να επικοινωνήσετε

Νέα

Το Llama 3.1 κυκλοφόρησε επίσημα: Μοντέλο 405 δισεκατομμυρίων παραμέτρων ανοιχτού κώδικα Xiao Zha: Εκτελέστε τον ανοιχτό κώδικα μέχρι το τέλος

Εισαγωγή

τα στοιχεία επικοινωνίας μου