Ο Μασκ ξαφνικά κυκλοφόρησε ένα νέο μεγάλο μοντέλο, θυσιάζοντας πόρους της Tesla για να αμφισβητήσει το OpenAI και μια δοκιμή από πρώτο χέρι είναι εδώ

Ο Μασκ κυκλοφόρησε ξαφνικά ένα νέο μεγάλο μοντέλο, θυσιάζοντας πόρους της Tesla για να αμφισβητήσει το OpenAI και μια δοκιμή από πρώτο χέρι είναι εδώ

2024-08-14

Ο Mengchen προέρχεται από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

Το μεγάλο μοντέλο xAI του Musk κυκλοφορεί στη δεύτερη γενιά του!

Γκροκ-2Η έκδοση beta κυκλοφόρησε, το Xiaobei Grok-2 mini είναι ήδη διαθέσιμο online στην πλατφόρμα.

Ο Μασκ αποκάλυψε επίσης το μυστικό που μαστίζει τον μεγάλο κύκλο μοντέλων για περισσότερο από ένα μήνα με τη μορφή του Riddler:

Αποδεικνύεται ότι το μυστηριώδες ανώνυμο μοντέλο στην αρένα μεγάλου μοντέλου Lmsyssus-στήλη-r, του οποίου η πραγματική μορφή είναι Grok-2.

Το sus-column-r έχει συγκεντρώσει περισσότερες από 10.000 ανθρώπινες ψήφους στο leaderboard και έχειΙσοπαλία στην τρίτη θέση με την έκδοση API του GPT-4o。

Στις εσωτερικές δοκιμές του xAI, το Grok-2 ανταγωνίστηκε άλλα μοντέλα αιχμής σε τομείς όπως γενικές γνώσεις (MMLU, MMLU-Pro), ερωτήσεις μαθηματικών διαγωνισμών (MATH) και επιστημονικές γνώσεις μεταπτυχιακού επιπέδου (GPQA).

Επιπλέον, το Grok-2 είναι καλύτερο σε εργασίες που βασίζονται στην όραση και φτάνει στο SOTA στον οπτικό μαθηματικό συλλογισμό (MathVista).

Ωστόσο, η διάταξη αυτής της εικόνας είναι λίγο δύσκολη: το GPT-4o και το Claude-3.5-Sonnet, που έχουν τις υψηλότερες βαθμολογίες, βρίσκονται πιο μακριά από εσάς.

Και μόνο η εξέταση των βαθμολογιών είναι ακόμα αφηρημένη, ας μπούμε στην πραγματική δοκιμή από πρώτο χέρι.

Δοκιμή από πρώτο χέρι του Grok-2

Εάν είστε χρήστης επί πληρωμή της πλατφόρμας /Twitter, μπορείτε να μπείτε απευθείας στο κανάλι Grok για να το δοκιμάσετε. Εάν δεν ξοδεύετε χρήματα, μπορείτε επίσης να μεταβείτε στο μεγάλο μοντέλο Lmsys και να επιλέξετε το sus-column-r για να το δοκιμάσετε.

καιΟι χρήστες που πληρώνουν μπορούν να παίξουν μόνο την έκδοση Xiaobei mini., οι δωρεάν χρήστες μπορούν να παίξουν μεγάλο κύπελλο, το οποίο είναι επίσης πολύ γενναιόδωρο.。

Δεδομένου ότι το Grok-2 έχει πρόσβαση σε δεδομένα σε πραγματικό χρόνοΜπορείτε να του ζητήσετε απευθείας να συνοψίσει τα νέα της ημέρας, εάν ενεργοποιήσετε τη λειτουργία διασκέδασης, μπορείτε επίσης να δώσετε σχόλια.

Επί πληρωμή έκδοση επίσηςΠρόσβαση στο πιο πρόσφατο μοντέλο γραφήματος AI ανοιχτού κώδικα Flux.1, θα μεταφράσει κινεζικές προτροπικές λέξεις στα αγγλικά για κατανόηση.

Κάντε κλικ στο παράδειγμα ερώτησης "Amway a Fantasy Game" στην αρχική σελίδα και μπορείτε να δείτε ότι πρώτα προτείνει το "Baldur's Gate 3" και συζητά διάφορες πτυχές, όπως η πλοκή, η προσαρμογή χαρακτήρων, η μηχανική του παιχνιδιού, η διαμόρφωση του κόσμου, τα στοιχεία του χιούμορ και η κοινότητα παικτών. Το review γίνεται από διαφορετική οπτική γωνία και αποτυπώνει πολύ καλά τα highlights του παιχνιδιού.

Αυτή τη στιγμή, μπορείτε να αλλάξετε απευθείας στα Κινεζικά και να συνεχίσετε να κάνετε ερωτήσεις.

Ο Grok-2 γνωρίζει επίσης για το "Black Myth: Wukong", ένα παιχνίδι που δεν έχει κυκλοφορήσει ακόμη. Δήλωσε με ακρίβεια ότι η ημερομηνία κυκλοφορίας είναι η 20η Αυγούστου, η μηχανή Unreal 5 που χρησιμοποιήθηκε, και συνόψισε τις συζητήσεις μεταξύ των χρηστών του Διαδικτύου.

Περιλαμβάνει επίσης αναρτήσεις χρηστών στο τέλος, στις οποίες μπορείτε να κάνετε κλικ για να συμμετάσχετε στη συζήτηση. Η λειτουργική ενοποίηση με ολόκληρη την πλατφόρμα είναι ήδη σε ισχύ.

Ωστόσο, δεδομένου ότι υπάρχει μόνο μια μίνι έκδοση του μοντέλου, θα μεταφερθούμε στη μεγάλη αρένα του μοντέλου για το επόμενο τεστ αντοχής και μπορούμε επίσης να έχουμε ένα PK με GPT-4o.

Πρόσφατα δημοφιλείς ερωτήσεις για τεστ IQ"Ποιο είναι μεγαλύτερο, 9,9 ή 9,11;"Στη δοκιμή, το Grok-2 (sus-column-r) ξεπερνά την τελευταία έκδοση του ChatGPT.

Αλλά ένα άλλο δημοφιλές τεστ"Πόσα r υπάρχουν σε φράουλα"Σχετικά με το θέμα, και τα δύο απέτυχαν ακόμα. (Δοκιμάστε μερικές φορές και υπάρχει μια μικρή πιθανότητα να γίνουν σωστά και τα δύο).

Πιο σοβαρές ερωτήσεις παγίδας"Ποιο από τα παρακάτω κεριά θα σβήσει πρώτο;", το Grok-2 είναι ελαφρώς πιο προηγμένο από το ChatGPT.

Το σημείο δοκιμής είναι ότι το υπόλοιπο μέρος του κεριού που σβήνει πρώτο είναι μακρύτερο (η σωστή απάντηση 3 το ChatGPT το ερμηνεύει λανθασμένα ως το πιο σύντομο). δεν είναι σωστό.

Και οι δύο φαίνεται να έχουν ξεπεράσει κατά κάποιο τρόπο το πρόβλημα της αδυναμίας του κλασικού μεγάλου μοντέλου «κατάρα της αντιστροφής». Όχι μόνο μπορεί να απαντήσει άμεσα «Ποιά είναι η μητέρα του Τομ Κρουζ;», αλλά μπορεί επίσης να απαντήσει στην αντίστροφη ερώτηση «Ο γιος της Μαίρη Λι Φάιφερ είναι ο Τομ Κρουζ», τα δεδομένα της οποίας εμφανίζονται λιγότερο συχνά.

(Φυσικά, δεν μπορεί να αποκλειστεί ότι αφού γίνει κλασικό πρόβλημα, θα είναι διαθέσιμα περισσότερα σχετικά δεδομένα.)

Το μεγάλο μοντέλο του Μασκ αναβαθμίστηκε σε βάρος της Tesla

Η δοκιμή έφτασε στο τέλος της και μπορεί να φανεί ότι το Grok-2 έχει σημειώσει μεγάλη πρόοδο σε σύγκριση με την προηγούμενη γενιά Grok-1.5.

Πίσω από τις σκηνές, ο Μασκ ξόδεψε πολλούς πόρους και ανθρώπινο δυναμικό.

Για παράδειγμα, ένας νέος ερευνητής που εντάχθηκε στο xAI είπε ότι μπορεί να χρησιμοποιηθείΣυστάδα καρτών 100.000Η έρευνα είναι πολύ πιο ευχάριστη από το να έχεις φτωχούς πόρους στο σχολείο.

Αλλά μια ομάδα ανθρώπων δεν είναι ικανοποιημένη: οι μέτοχοι της Tesla.

Σύμφωνα με την Wall Street Journal,Ο Μασκ συνεχίζει να μεταφέρει ταλέντο, δεδομένα και πόρους GPU από την Tesla στο xAI。

Μέχρι στιγμής, η xAI έχει προσλάβει τουλάχιστον 11 υπαλλήλους που έχουν εργαστεί στην Tesla, έξι από τους οποίους έχουν εργαστεί απευθείας στην ομάδα Autopilot.

Ο Μασκ ζήτησε επίσης από τη Nvidia να δώσει προτεραιότητα στην παροχή xAI για παραγγελίες GPU που είχαν αρχικά αποκλειστεί για την Tesla.

Ο Μασκ έχει επίσης μιλήσει δημόσια για τις τεράστιες ποσότητες οπτικών δεδομένων που συλλέγει η Tesla, τα οποία, όπως λέει, μπορούν να χρησιμεύσουν ως πηγή για την εκπαίδευση μοντέλων xAI.

Τουλάχιστον τρεις μέτοχοι της Tesla μήνυσαν τον Musk για αυτό το θέμα, ισχυριζόμενοι ότι η μεταφορά πόρων στην xAI έβλαπτε τα συμφέροντα των επενδυτών της Tesla.

Η υπόθεση αυτή τη στιγμή εκκρεμεί σε δικαστήριο του Ντέλαγουερ.

νέα

Ο Μασκ κυκλοφόρησε ξαφνικά ένα νέο μεγάλο μοντέλο, θυσιάζοντας πόρους της Tesla για να αμφισβητήσει το OpenAI και μια δοκιμή από πρώτο χέρι είναι εδώ

Εισαγωγή

Τα στοιχεία επικοινωνίας μου