νέα

Ανεξάρτητα από το πού δεν ξέρετε πώς να σαρώσετε! Παίξτε online το πιο ισχυρό μαθηματικό μοντέλο στον κόσμο, που υποστηρίζεται από τα πολυτροπικά μοντέλα της Alibaba

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Το σπίτι προέρχεται από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

Τώρα, όλοι μπορούν να παίξουν με το πιο ισχυρό μαθηματικό μοντέλο μεγάλης κλίμακας!

Όταν ξύπνησα, η Alibaba Qianwen Big Model Team κυκλοφόρησε το demo του Qwen2-Math.Το Hug Face μπορεί να παιχτεί online

Παραδόξως, αν θεωρείτε ότι είναι ενοχλητικό να εισάγετε μαθηματικούς τύπους,Μπορείτε να τραβήξετε ένα στιγμιότυπο οθόνης ή να σαρώσετε την ερώτηση που θέλετε να κάνετε και να το ανεβάσετε για να λύσετε το πρόβλημα.

Είναι αρκετά βολικό.



Η δοκιμαστική διεπαφή δηλώνει ξεκάθαρα: "Η λειτουργία OCR αυτής της δοκιμαστικής διεπαφής υποστηρίζεται από τη μεγάλη ομάδα μοντέλων Qwen2-VL της Alibaba Qianwen· η ικανότητα μαθηματικής συλλογιστικής υποστηρίζεται από το Qwen2-Math."

Ο ανώτερος ειδικός αλγορίθμων της Alibaba Lin Junyang εξήγησε επίσης περαιτέρω στην περιοχή σχολίων του Twitter:

Προς το παρόν, τα Qwen2-VL και Qwen2-Math εξακολουθούν να είναι υπεύθυνα για τα δικά τους μέρη.
Αλλά στο εγγύς μέλλον, θα συνδυάσουμε πολλαπλές δυνατότητες και ικανότητες μαθηματικού συλλογισμού σε ένα μοντέλοΕρχομαι.



Πολλοί χρήστες του Διαδικτύου είναι πολύ ενθουσιασμένοι με αυτό το διαδραστικό μοντέλο:

Προσοχή! Χρησιμοποιήστε εικόνες για να ανεβάσετε και περιμένετε να λύσει το πρόβλημα το μεγάλο μοντέλο, αγαπήστε το!



Λοιπόν, πώς είναι το αποτέλεσμα της έναρξης με το Qwen2-Math, το πιο ισχυρό μαθηματικό μοντέλο;

Ποιο είναι το αποτέλεσμα; Απλά παίξτε το τώρα

Ήρθε η ώρα για το Qwen2-Math να περάσει πέντε επίπεδα και να νικήσει έξι στρατηγούς!

Ας ξεκινήσουμε με μερικές σχετικά απλές ερωτήσεις υπολογισμού για να ξεκινήσετε.

Επιτρέψτε μου να εξηγήσω εκ των προτέρων ότι κατά τη διάρκεια της εμπειρίας των δύο ατόμων, το Qwen2-Math δεν εμφάνισε τον υπολογισμό ταυτόχρονα, αλλά εμφάνισε απευθείας τη διαδικασία και τα αποτελέσματα μετά την ολοκλήρωση του υπολογισμού.

(Και θα έπρεπε όλο και περισσότεροι άνθρωποι να αρχίζουν να παίζουν και ο χρόνος δημιουργίας αποτελεσμάτων σταδιακά επιμηκύνεται)

Ερώτηση 1:Στο «Υπολογισμός AxA+A=240», η τιμή του A.

Το Qwen2-Math δίνει τη σωστή απάντηση, A=14 ή A=-16.



Δεύτερη ερώτηση:Με δεδομένη την τιμή του a, υπολογίστε το αποτέλεσμα της εξίσωσης.

Ο Qwen2-Math υπολόγισε ότι η απάντηση είναι 0, η οποία είναι επίσης σωστή.



Ερώτηση 3:(Α+3) (Α+4) (Α+5) = 120, βρείτε την τιμή του Α.

Λοταρία! Η απάντηση είναι 1.



Εντάξει, η προθέρμανση τελείωσε, ας δώσουμε κάποια δυσκολία στο Qwen2-Math.

Στη συνέχεια, ας ρίξουμε μια ματιά σε κάτι που είναι ήδη πρότυπο για (μαθηματικές) εκτιμήσεις μεγάλων μοντέλων:

Ποιο είναι μεγαλύτερο, 9,9 ή 9,11;



Το Qwen2-Math απαντά με σιγουριά:

Το 9,9 είναι μεγαλύτερο από το 9,11!



Τότε κάντε το πιο δύσκολο!

Ρίξτε μια ερώτηση που μόνο το GPT-4o έχει απαντήσει σωστά μέχρι στιγμής:

Αφού ένας εξωγήινος έρθει στη Γη, μπορεί να επιλέξει να ολοκληρώσει ένα από τα ακόλουθα τέσσερα πράγματα:
1. Αυτοκαταστροφή.
2. Χωριστείτε σε δύο εξωγήινους.
3. Χωριστείτε σε τρεις εξωγήινους.
4. Μην κάνετε τίποτα.
Κάθε μέρα στη συνέχεια, κάθε εξωγήινος θα κάνει μια επιλογή, ανεξάρτητα ο ένας από τον άλλο.
Βρείτε την πιθανότητα ότι τελικά δεν θα υπάρχουν εξωγήινοι στη Γη.

Για αυτήν την ερώτηση, το Qwen2-Math χρειάστηκε περίπου 30 δευτερόλεπτα για να δώσει την απάντηση: 1.

Δυστυχώς, η απάντηση είναι λάθος Η σωστή απάντηση είναι √2 μείον 1.



Περιηγηθήκαμε στις περιοχές σχολίων των μεγάλων πλατφορμών και διαπιστώσαμε ότι εκτός από τα σφάλματα υπολογισμού, υπάρχει μια άλλη πιθανότητα που μπορεί να οδηγήσει σε λανθασμένες απαντήσεις——

Αυτό είναι το Qwen2-VLΚατά τον προσδιορισμό του θέματος, κάτι πήγε στραβά.

Το λάθος βρίσκεται στο πρώτο βήμα Σε αυτή την περίπτωση, η απάντηση που λαμβάνεται από το μεγάλο μοντέλο σίγουρα δεν θα είναι η σωστή απάντηση.



Την ίδια στιγμή, ο Lin Junyang είπε επίσης στην περιοχή σχολίων των διαδικτυακών χρηστών:

Το δικό μας Qwen2-MathΔεν μπορώ να κάνω προβλήματα γεωμετρίας ακόμα



Μπορείτε επίσης να κάνετε ερωτήσεις στα κινέζικα

Ο πρωταγωνιστής αυτή τη φορά, το Qwen2-Math, αναπτύχθηκε με βάση το μοντέλο ανοιχτού κώδικα μεγάλης γλώσσας Tongyi Qianwen Qwen2 και κυκλοφόρησε από τη μεγάλη ομάδα μοντέλων της Alibaba Qianwen πριν από δέκα ημέρες.

Είναι ειδικά σχεδιασμένο για την επίλυση μαθηματικών προβλημάτων και μπορεί να λύσει ερωτήσεις τεστ σε επίπεδο ανταγωνισμού.

Το Qwen2-Math έχει συνολικά τρεις εκδόσεις παραμέτρων:

72Β, 7Β και 1.5Β.



Με βάση το Qwen2-Math-72B, η ομάδα Qianwen βελτίωσε επίσης την έκδοση Instruct.

Αυτό είναι επίσης το κορυφαίο μοντέλο του Qwen2-Math Είναι ένα μοντέλο ανταμοιβής ειδικά για τα μαθηματικά που συνδυάζει το σήμα ανταμοιβής με το σήμα αληθινής ή ψευδούς κρίσης ως ετικέτα εκμάθησης και στη συνέχεια κατασκευάζει δεδομένα εποπτευόμενης λεπτομέρειας (SFT) μέσω δειγματοληψίας απόρριψης. και τέλος χρησιμοποιεί το GRPO με βάση το μοντέλο βελτιστοποίησης της μεθόδου.

Το Qwen2-Math-72B-Instruct χειρίζεται μια ποικιλία μαθηματικών προβλημάτων όπως η άλγεβρα, η γεωμετρία, η μέτρηση και οι πιθανότητες και η θεωρία αριθμών με ακρίβεια 84%.

Και μόλις κυκλοφόρησε, «ενθρονίστηκε» σε μεγάλα μαθηματικά μοντέλα, σημειώνοντας 7 βαθμούς περισσότερους από το GPT-4o στο σύνολο δεδομένων MATH, που είναι 9,6% υψηλότερο σε αναλογία.

Ξεπερνώντας άμεσα το ανοιχτού κώδικα Llama 3.1-405B και κλειστού κώδικα GPT-4o, Claude 3.5, κ.λπ.



Από τη στιγμή που δημοσιεύτηκε, το Qwen2-Math-72B-Instruct έχει ληφθεί περισσότερες από 13,2 χιλιάδες φορές.

Και υπάρχει μια τελευταία ανακάλυψη:

Αν και η ομάδα ισχυρίζεται ότι το Qwen2-Math στοχεύει επί του παρόντος κυρίως σε αγγλικές σκηνές,Εάν κάνετε μια κινεζική ερώτηση, το Qwen2-Math μπορεί ακόμα να την απαντήσει.

Απλώς σου απαντώ στα αγγλικά.

Εννοείται ότι το Qwen2-MathΑργότερα θα κυκλοφορήσει μια κινεζική και αγγλική δίγλωσση έκδοση

Σύνδεσμοι αναφοράς:
[1]https://huggingface.co/space/Qwen/Qwen2-Math-Demo
[2]https://x.com/Alibaba_Qwen/status/1825559009497317406
[3]https://x.com/JustinLin610/status/1825559557411860649