Νέα

Το Llama 3.1, το "European OpenAI" κυκλοφορεί το νέο μοντέλο ανοιχτού κώδικα Large 2 |

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Συγγραφέας |. Wang Yixin

Editor|Anita Tang

Λιγότερο από μία ημέρα αφότου η Meta κυκλοφόρησε το πιο πρόσφατο μεγάλο μοντέλο ανοιχτού κώδικα Llama 3.1, η γαλλική startup τεχνητής νοημοσύνης Mistral ήρθε να το ξεκινήσει - στις 24 Ιουλίου, η Mistral κυκλοφόρησε το νέο της κορυφαίο μοντέλο Large 2.

Η Mistral AI είναι μια νεοσύστατη γαλλική εταιρεία τεχνητής νοημοσύνης που μόλις ιδρύθηκε εδώ και ένα χρόνο. Είναι επίσης ο πιο καλά χρηματοδοτούμενος και ανταγωνιστικός παίκτης τεχνητής νοημοσύνης στην Ευρώπη μέχρι στιγμής ως Lianchuang Mensch Οι συγγραφείς μεγάλων μοντέλων εγγράφων όπως το Chinchilla έχουν προτείνει βασικές τεχνολογίες, συμπεριλαμβανομένων των Νόμων Κλιμάκωσης.

Μόλις 4 εβδομάδες μετά την ίδρυσή της, τον Ιούνιο του 2023, η Mistral AI έλαβε 105 εκατομμύρια ευρώ σε χρηματοδότηση με μια ομάδα 6 ατόμων. Η εταιρεία εστιάζει στην έρευνα και την ανάπτυξη μεγάλων μοντέλων ανοιχτού κώδικα και έχει επαινεθεί από τον Γάλλο Πρόεδρο Μακρόν ως «ένα μοντέλο για μια νέα γενιά ευρωπαϊκών νεοφυών επιχειρήσεων που θα ανταγωνιστούν τους αμερικανικούς τεχνολογικούς κολοσσούς».

Τον Δεκέμβριο του 2023, η Mistral κυκλοφόρησε ένα μεγάλο μοντέλο ανοιχτού κώδικα που ονομάζεται Mistral 8x7B, το οποίο έχει 56 δισεκατομμύρια παραμέτρους, η απόδοση και η απόδοσή του είναι συγκρίσιμες με το LLaMA-65B και έγινε αμέσως επιτυχία στη βιομηχανία μεγάλων μοντέλων. Επιπλέον, η εταιρεία συγκρίθηκε επίσης με το ChatGPT και κυκλοφόρησε έναν βοηθό συνομιλίας πολλών γλωσσών που ονομάζεται Le Chat (ο επίσημος ιστότοπος δείχνει ότι βρίσκεται ακόμα σε φάση δοκιμών και απαιτεί εγγραφή και αίτηση για τεστ) για να παρουσιάσει τις πιο πρόσφατες τεχνικές δυνατότητες της εταιρείας.

Ο Mistral είπε ότι το Large 2 ξεπέρασε το Llama 3.1 405B στη δημιουργία κώδικα, στα μαθηματικά και στις δυνατότητες συλλογιστικής χρησιμοποιώντας λιγότερο από το ένα τρίτο των παραμέτρων του Llama 3.1 405B, ή 123 δισεκατομμύρια παραμέτρους, και ξεπέρασε τα άλλα κορυφαία μοντέλα τεχνητής νοημοσύνης στη δημιουργία αποκρίσεων πάρα πολλές μακροσκελείς περιγραφές. Αυτό σημαίνει ότι το Large 2 έχει περισσότερα πλεονεκτήματα όσον αφορά το κόστος και οι προγραμματιστές μπορούν να το τρέξουν τοπικά πιο γρήγορα.

Όπως το Llama 3.1 του Meta, το Large 2 δεν έχει πολλαπλές δυνατότητες, αλλά όσον αφορά την ακρίβεια και την αξιοπιστία των απαντήσεων διαλόγου, μπορεί να συγκριθεί με το "λίγο είναι μεγαλύτερο" του Llama. Ο Mistral είπε ότι το πρόβλημα παραισθήσεων του μοντέλου ήταν ένα από τα σημεία εστίασης κατά τη διάρκεια της εκπαιδευτικής διαδικασίας του Large 2. Επιπλέον, το Large 2 βελτιώνει επίσης τις εργασίες παρακολούθησης εντολών και συνομιλιών, χειρίζεται ακριβείς οδηγίες και μακροχρόνιες συνομιλίες πολλαπλών στροφών.

Το Large 2 έχει μήκος περιβάλλοντος 128 χιλιάδων και μπορεί να λάβει περίπου τόσους χαρακτήρες όσο ένα βιβλίο 300 σελίδων σε μία συνομιλία. Επιπλέον, το Large 2 υποστηρίζει πολλές γλώσσες και μπορεί να χειριστεί Αγγλικά, Γαλλικά, Γερμανικά, Ισπανικά, Ιταλικά, Πορτογαλικά, Αραβικά, Χίντι, Ρωσικά, Κινέζικα, Ιαπωνικά και Κορεάτικα, καθώς και 80 γλώσσες κώδικα.


Πηγή: Επίσημος ιστότοπος Mistral

Πρέπει να σημειωθεί ότι το μοντέλο της Mistral δεν είναι μοντέλο ανοιχτού κώδικα με την παραδοσιακή έννοια και η εμπορική χρήση απαιτεί πληρωμή.

Επί του παρόντος, το Large 2 έχει εισέλθει στις πλατφόρμες των Google, Amazon, Azure και IBM για χρήση από τους χρήστες. Οι χρήστες μπορούν επίσης να το βιώσουν μέσω του "mistral-large-2407" στο Mistral's La Plateforme (μια ολοκληρωμένη πλατφόρμα που απλοποιεί την ανάπτυξη εφαρμογών τεχνητής νοημοσύνης και παρέχει προεκπαιδευμένα μοντέλα, εργαλεία επεξεργασίας δεδομένων και διεπαφές API) ή να το δοκιμάσουν δωρεάν στο Le Chat.

Η Mistral ολοκλήρωσε τη χρηματοδότηση της Σειράς Β τον Ιούνιο του τρέχοντος έτους, συγκεντρώνοντας συνολικά 640 εκατομμύρια δολάρια και αποτίμηση 6 δισεκατομμυρίων δολαρίων. Σε αυτόν τον γύρο χρηματοδότησης ηγήθηκε η General Catalyst και στους επενδυτές περιλαμβάνονται επίσης οι Lightspeed Venture Partners, Andreessen Horowitz, Nvidia, Samsung Ventures και IBM.

Η Mistral AI έχει σήμερα περίπου 60 υπαλλήλους, 45 από τους οποίους είναι στη Γαλλία, 10 στις Ηνωμένες Πολιτείες και πέντε στο Ηνωμένο Βασίλειο. Περίπου τα τρία τέταρτα των εργαζομένων της εργάζονται στην ανάπτυξη προϊόντων και στην έρευνα, σύμφωνα με τους Financial Times.