nouvelles

Ce grand modèle a vraiment guéri mon trouble de la lecture du papier

2024-08-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Coeur de machine original

Auteur : Zhang Qian

En mars de cette année, Jensen Huang, PDG de Nvidia, a organisé un événement très spécial. Il a invité les auteurs de l'article révolutionnaire « Attention Is All You Need » à se réunir au GTC pour discuter de l'orientation future du développement de l'IA générative.

"Tout ce dont notre domaine bénéficie aujourd'hui remonte à ce moment-là... Vous avez changé le monde...", a déclaré Huang Jenxun sur les lieux.



Pour une industrie axée sur la recherche scientifique comme l’IA, la prochaine opportunité de changer le monde peut également être cachée dans un certain article.

donc,Nous avons observé un phénomène inhabituel dans ce cercle : certains PDG ayant une formation non technique ont également commencé à veiller tard pour lire des articles, dans l'espoir de réduire le coût des essais et des erreurs liés à la prise de décision.

Si cela est vrai pour les PDG, sans parler des autres praticiens du domaine. Il y a quelque temps, OpenAI, Google et Meta ont fait de grands progrès, et certaines startups lancent également constamment de nouveaux modèles et méthodes. Je pense que de nombreux praticiens auront l'impression qu'il y a trop d'articles à couvrir.

Donner des articles à l'IA pour qu'ils les résument est une méthode de lecture courante de nos jours, mais de nombreux résumés d'IA manquent de niveaux clairs et de descriptions détaillées des innovations et des limites. Nous devons passer par plusieurs séries de questions pour avoir une compréhension complète de l'article. De plus, certains diagrammes d'architecture de modèle clés et diagrammes de résultats expérimentaux doivent être trouvés par vous-même dans l'article, et le temps réel gagné est très limité.

Dans Tencent "Yuanbao» dans la dernière mise à jour, nous avons vu les solutions à ces problèmes. Leur nouveau "Mode lecture approfondie"soutienLecture longue et intensiveCapacité à produire des analyses modulaires et illustrées, très approprié pour lire des articles.

Afin de vérifier l’effet de cette nouvelle fonction, Machine Heart a réalisé un test réel.

« Lecture intensive » de l'article, où est l'essentiel ?

Qu'est-ce que ça fait d'utiliser l'IA pour lire des articles ? C'est souvent le cas : vous lui lancez un PDF, et il renvoie un résumé + plusieurs résumés (parfois il peut atteindre 10). Ces informations sont effectivement utiles, mais il est parfois difficile de distinguer quels sont les points saillants, ce que le document résout et ce qu'il ne résout pas, et quelles questions fondamentales méritent d'être examinées.

Nos tests réels ont révélé que « Yuanbao » résout ces problèmes en fournissant une série d'informations modulaires et structurées.

Prenons comme exemple un papier SIGGRAPH que nous avons testé. Si vous y jetez directement le papier, le résumé qu’il renvoie n’est pas très différent de celui des autres IA. Cependant, tant que vous faites défiler patiemment vers le bas, vous verrez un bouton pour « lire le document en profondeur ». Il s'agit du commutateur « en un clic » pour une lecture intensive du papier.



Différent de l'interface précédente pour résumer les articles,Une lecture intensive de la page décomposera le papier en plusieurs couches., le contexte de la recherche, les méthodes de recherche, la conception expérimentale, l'analyse des résultats et la conclusion globale sont chacun organisés en un module, un peu comme la mise en page de l'article que Machine Heart présente habituellement. Tous ces éléments peuvent être rapidement accessibles via le contour sur la gauche.



Bien que chaque module ne contienne que quelques mots, ces mots sont en réalité très informatifs. Par exemple, dans le module de base de recherche, le paragraphe « Difficultés de recherche » décrit quatre difficultés en seulement trois phrases courtes, et « Travail connexe » est une version très condensée du « travail connexe » du chapitre 2. En un paragraphe, il décrit les quatre difficultés dans ce domaine. Les principales voies techniques sont clairement présentées. Par conséquent, après avoir lu ce module, nous pouvons fondamentalement comprendre à quel problème l’article étudie et à quel type de statut de recherche nous sommes confrontés.

En plus de ces informations structurées conventionnelles, la lecture intensive de Yuanbao a également un design accrocheur——Il énumérera les forces et les faiblesses du document, afin que les chercheurs puissent rapidement comprendre ce qu'ils peuvent apprendre de cet article et quelles questions méritent de continuer à être étudiées.





Pourquoi cette fonctionnalité est-elle si importante ? Peng Minghui, professeur à l'Université Tsinghua de Taiwan, a écrit un jour dans un article sur la lecture d'articles que les articles sont différents des manuels scolaires. Les manuels fournissent des connaissances systématiques compilées et organisées par d'autres, tandis que les articles exigent que les lecteurs récupèrent et organisent eux-mêmes des connaissances non organisées. Filtrer et organiser les connaissances. dans,La capacité d'analyser les forces et les faiblesses de la recherche existante est particulièrement importante. Il s'agit d'un élément clé de la pensée critique et d'un moyen important de s'améliorer dans la recherche universitaire.. En analysant et en résumant rapidement les avantages et les inconvénients des articles, Yuanbao peut aider les chercheurs à gagner beaucoup de temps dans la sélection et la compréhension préliminaire, leur permettant ainsi de se concentrer plus rapidement sur les articles directement liés à leur recherche.

Cependant, si vous estimez que les informations précédentes sont trop fastidieuses, vous pouvez également passer directement à la dernière.Module « Questions et réponses clés ». Voici quelques-unes des questions les plus critiques pour vous aider à comprendre rapidement la valeur de l'article, puis à déterminer s'il vaut la peine de consacrer du temps à lire le texte original. Bien sûr, de nombreux assistants IA précédents présenteront également quelques questions clés à la fin de la réponse, et vous pourrez obtenir la réponse en un seul clic. Cependant, si vous êtes un débutant ou un lecteur ayant une formation interdisciplinaire, cela peut ne pas être facile. à vous de juger quelles questions sont les plus critiques. La présentation directe de Yuanbao semble plus intuitive.



L'image originale est le numéro d'origine. Qui a dit que l'IA ne pouvait pas ajouter d'images lors de la lecture d'articles ?

Lorsqu’ils lisent un article, de nombreuses personnes ont l’habitude de lire la description de l’article tout en regardant les images. C'est plus rapide et plus facile à comprendre de cette façon. Cependant, la plupart des applications d'IA sur le marché renvoient désormais des résultats textuels. Si vous souhaitez voir des images, vous devez les trouver dans le texte original.

Lors de nos tests, nous avons constaté queYuanbao est l'une des rares IA capables de découper directement les images papier et de les placer aux positions correspondantes des paragraphes.. Par exemple, si un module parle d'architecture, il mettra le schéma d'architecture correspondant :





Si vous parlez de résultats expérimentaux dans un certain module, le tableau correspondant sera affiché :





Comme nous le savons tous, il n’existe aucun moyen de résoudre complètement le problème de l’illusion des grands modèles. Par conséquent, cette présentation de figures originales constitue en réalité une méthode de sortie plus fiable, qui permet aux lecteurs de vérifier plus facilement les réponses du modèle à tout moment et qui est plus sûre lorsqu’elle est utilisée comme référence.

De plus, nous avons également constaté que si vous avez besoin d'écrire un blog ou une autre sortie externe, Yuanbao peut également vous aider à dessiner des graphiques, et vous n'avez pas besoin de lui indiquer où trouver les données. Il peut localiser les tableaux pertinents dans le fichier. papier tout seul et mettez les données. Extrayez-le et dessinez-le. Cette fonction peut être invoquée via le bouton « Poser une question » sur le côté droit de la page de lecture intensive.



Vous pouvez lire quand et où vous voulez. Qui a dit qu’il y avait de nombreux obstacles à la lecture des journaux ?

En plus des informations structurées et des sorties avec des images et des textes, nous avons également constaté lors du test que Yuanbao dispose en fait de petites fonctions très pratiques qui peuvent rendre la lecture des documents plus pratique.

le premier estTraduction et recherche de mots, ce sont deux petites fonctions pratiques de l'interface de lecture "texte original". La traduction de mots croisés peut aider les lecteurs ayant un mauvais anglais à surmonter les barrières linguistiques à tout moment et en tout lieu, et la recherche de mots croisés va encore plus loin. Par exemple, la fonction de recherche de Yuanbao a été transformée en plug-in, afin que vous puissiez effectuer une recherche. pour obtenir des informations pertinentes à tout moment. De plus, l'explication donnée par Yuanbao n'est pas seulement un bref résumé, mais aussi une extension modulaire. Elle est vraiment « structurée » et « informative » dans les moindres détails.





suivi de"Lecture hors ligne». L'aspect pratique de cette fonction est qu'elle vous permet de revoir le contenu de lecture intensive et le texte original en « mode avion » sans perdre de temps fragmenté. Cela permet aux compagnies aériennes de regagner du terrain face à la concurrence du train à grande vitesse. Peut-être que la prochaine inspiration des chercheurs viendra de l’examen des lectures intensives faites dans l’avion.



La dernière petite fonction est "calculatrice». Il y a quelque temps, l'IA suscitait de nombreuses discussions car elle ne pouvait pas dire laquelle était la plus grande, 9.9 ou 9.11. Dans Yuanbao, nous constatons qu'il dispose d'une fonction de calculatrice intégrée qui garantit que les réponses sont générées sur la base de calculs précis. Cette fonctionnalité est très utile lorsque nous lisons des données expérimentales.

Derrière la lecture intensive de longs articles : il s’avère qu’il y a des conseils d’experts

Selon les informations officielles, cette mise à niveau de Tencent Yuanbao se concentre sur la « lecture intensive de textes longs » et peut prendre en charge nativement la saisie jusqu'à près de 500 000 mots. Les papiers que nous avons utilisés dans le test sont loin d’atteindre cette longueur, et la plupart des papiers avec lesquels nous sommes en contact quotidiennement ne peuvent pas atteindre cette longueur. Par conséquent, lorsque vous utilisez Yuanbao pour lire des articles de manière intensive, la fenêtre contextuelle est suffisante dans la plupart des cas. Sa modularité, sa sortie graphique et textuelle et ses petites fonctions telles que la recherche de mots et la traduction rendent également la lecture d'articles vraiment pratique et efficace, faisant un pas de plus vers la « praticabilité ».

Cette évolution est indissociable du modèle qui la sous-tend : la mise à niveau du grand modèle Hunyuan de Tencent. Il est rapporté que afin d'améliorer le professionnalisme et la praticité du modèle dans le domaine professionnel, l'équipe Tencent HunyuanDes experts du domaine sont spécialement invités à définir les compétences clés de chaque domaine professionnel et à formuler des normes pour répondre aux questions professionnelles., permettant au modèle de servir de véritable expert du domaine. Ainsi, après l'avoir utilisé, nous pensons que Yuanbao sait de quelles informations les lecteurs ont besoin et comment les informations doivent être présentées.

En plus des articles, cette nouvelle fonctionnalité peut également être utilisée pour une lecture intensiveRapports financiers, rapports de rechercheTexte de longueur égale. Dans ces scénarios, il peut trier les informations de plusieurs dimensions et générer des graphiques professionnels tels que des graphiques d'analyse DuPont basés sur le contenu du rapport, permettant aux personnes qui ne comprennent pas ces documents de comprendre la situation financière de l'entreprise et d'autres informations.



Cependant, pour le scénario de lecture d'une thèse, Yuanbao a encore quelques améliorations à apporter, comme l'absence de comparaison complète de la traduction originale du texte dans l'interface de lecture du texte original, et parfois l'identification des formules n'est pas assez précise. Nous espérons également que Yuanbao pourra améliorer ces problèmes dans les futures mises à jour.

Mais en tant qu'application lancée depuis seulement plus de deux mois, les performances de Tencent Yuanbao ont déjà dépassé les attentes. Sa trajectoire évolutive nous permet de voir comment les grands modèles deviendront étape par étape une nouvelle productivité. Nous attendons également avec impatience que cette application nous apporte plus de surprises.