Peu importe où vous ne savez pas scanner ! Le modèle mathématique le plus puissant au monde peut être joué en ligne, soutenu par le modèle multimodal d'Alibaba

Peu importe où vous ne savez pas scanner ! Jouez en ligne au modèle mathématique le plus puissant au monde, pris en charge par les modèles multimodaux d'Alibaba

2024-08-20

La maison est originaire du temple Aofei
Qubits | Compte public QbitAI

Désormais, tout le monde peut jouer avec le modèle mathématique à grande échelle le plus puissant !

Quand je me suis réveillé, l'équipe Alibaba Qianwen Big Model a publié la démo de Qwen2-Math.Hug Face peut être joué en ligne。

Étonnamment, si vous avez du mal à saisir des formules mathématiques,Vous pouvez prendre une capture d'écran ou scanner la question que vous souhaitez poser et la télécharger pour résoudre le problème.

C'est assez pratique.

L'interface d'essai indique clairement : « La fonction OCR de cette interface d'essai est prise en charge par l'équipe de grands modèles d'Alibaba Qianwen, Qwen2-VL ; la capacité de raisonnement mathématique est prise en charge par Qwen2-Math. »

Lin Junyang, expert senior en algorithmes d'Alibaba, a également expliqué plus en détail dans la zone de commentaires de Twitter :

À l'heure actuelle, Qwen2-VL et Qwen2-Math sont toujours responsables de leurs propres pièces.
Mais dans un avenir proche, nous combinerons les capacités multimodales et les capacités de raisonnement mathématique en un seul modèle.Allez.

De nombreux internautes sont très enthousiasmés par ce modèle interactif :

Attention, bien ! Utilisez des images pour télécharger et attendez que le grand modèle résolve le problème, j'adore !

Alors, quel est l’effet de démarrer avec Qwen2-Math, le modèle mathématique le plus puissant ?

Quel est l'effet ? Jouez-y maintenant

Il est temps pour Qwen2-Math de passer cinq niveaux et de vaincre six généraux !

Commençons par quelques questions de calcul relativement simples pour vous aider à démarrer.

Permettez-moi de vous expliquer à l'avance que lors de l'expérience des deux personnes, Qwen2-Math n'affichait pas le calcul en même temps, mais affichait directement le processus et les résultats une fois le calcul terminé.

(Et il faudrait que de plus en plus de gens commencent à jouer et que le temps de génération des résultats s'allonge progressivement)

Question 1 :Dans "Calculer AxA+A=240", la valeur de A.

Qwen2-Math donne la bonne réponse, A=14 ou A=-16.

Deuxième question :Étant donné la valeur de a, calculez le résultat de l’équation.

Qwen2-Math a calculé que la réponse est 0, ce qui est également correct.

Question 3 :(A+3) (A+4) (A+5) = 120, trouvez la valeur de A.

Bingo ! La réponse est 1.

OK, l’échauffement est terminé, donnons quelques difficultés à Qwen2-Math.

Jetons ensuite un coup d’œil à quelque chose qui est déjà standard pour les évaluations (mathématiques) de grands modèles :

Lequel est le plus grand, 9,9 ou 9,11 ?

Qwen2-Math répond avec assurance :

9.9 est plus grand que 9.11 !

Alors rendez les choses plus difficiles !

Posez-lui une question à laquelle seul GPT-4o a répondu correctement jusqu'à présent :

Après qu’un extraterrestre arrive sur Terre, il peut choisir d’accomplir l’une des quatre choses suivantes :
1. Autodestruction ;
2. Divisé en deux extraterrestres ;
3. Divisé en trois extraterrestres ;
4. Ne faites rien.
Chaque jour par la suite, chaque extraterrestre fera un choix, indépendamment les uns des autres.
Trouvez la probabilité qu’il n’y ait finalement aucun extraterrestre sur Terre.

Pour cette question, Qwen2-Math a mis environ 30 secondes pour donner la réponse : 1.

Malheureusement, la réponse est fausse. La bonne réponse est √2 moins 1.

Nous avons parcouru les zones de commentaires des principales plateformes et constaté qu'en plus des erreurs de calcul, il existe une autre possibilité pouvant conduire à des réponses incorrectes——

C'est Qwen2-VLLors de l'identification du sujet, quelque chose s'est mal passé.

L’erreur est dans la première étape. Dans ce cas, la réponse obtenue par le grand modèle ne sera certainement pas la bonne réponse.

Dans le même temps, Lin Junyang a également déclaré dans la zone de commentaires des internautes :

Notre Qwen2-MathJe ne peux pas encore résoudre les problèmes de géométrie。

Vous pouvez également poser des questions en chinois

Le protagoniste cette fois, Qwen2-Math, est développé sur la base du grand modèle de langage open source Tongyi Qianwen Qwen2 et a été publié par l'équipe de grands modèles d'Alibaba Qianwen il y a dix jours.

Il est spécialement conçu pour résoudre des problèmes mathématiques et peut résoudre des questions de tests de niveau compétition.

Qwen2-Math a un total de trois versions de paramètres :

72B, 7B et 1.5B.

Sur la base de Qwen2-Math-72B, l'équipe Qianwen a également affiné la version Instruct.

Il s'agit également du modèle phare de Qwen2-Math. Il s'agit d'un modèle de récompense spécifique aux mathématiques qui combine le signal de récompense avec le signal de jugement vrai ou faux comme étiquette d'apprentissage, puis construit des données de réglage fin supervisé (SFT) par échantillonnage de rejet. et utilise enfin GRPO basé sur le modèle d'optimisation de la méthode SFT.

Qwen2-Math-72B-Instruct gère une variété de problèmes mathématiques tels que l'algèbre, la géométrie, le comptage et les probabilités, ainsi que la théorie des nombres avec une précision de 84 %.

Et dès sa sortie, il a « trôné » dans les grands modèles mathématiques, marquant 7 points de plus que GPT-4o sur l'ensemble de données MATH, qui est 9,6 % plus élevé en proportion.

Surpassant directement l'open source Llama 3.1-405B et la source fermée GPT-4o, Claude 3.5, etc.

Au moment de mettre sous presse, Qwen2-Math-72B-Instruct avait été téléchargé plus de 13,2 000 fois.

Et il y a une dernière découverte :

Bien que l'équipe affirme que Qwen2-Math est actuellement principalement destiné aux scènes anglaises,Si vous posez une question en chinois, Qwen2-Math peut toujours y répondre.。

Je vous réponds juste en anglais.

Il est entendu que Qwen2-MathUne version bilingue chinoise et anglaise sera lancée ultérieurement。

Liens de référence :
[1]https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo
[2]https://x.com/Alibaba_Qwen/status/1825559009497317406
[3]https://x.com/JustinLin610/status/1825559557411860649

nouvelles

Peu importe où vous ne savez pas scanner ! Jouez en ligne au modèle mathématique le plus puissant au monde, pris en charge par les modèles multimodaux d'Alibaba

Quel est l'effet ? Jouez-y maintenant

Vous pouvez également poser des questions en chinois

Introduction

Mes coordonnées