nouvelles

L'Université Tsinghua a remporté le prix du meilleur test de temps papier, l'Université du Shandong a reçu une mention honorable et SIGIR 2024 est publié.

2024-07-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Rapport sur le cœur de la machine

Editeur : Xiao Zhou, Chen Chen

Les résultats de l’Université Tsinghua sont exceptionnels.

La 47e conférence de l'Association for Computing Machinery sur la recherche d'informations (ACM SIGIR) se tiendra à Washington, DC, États-Unis, du 14 au 18 juillet 2024. Cette conférence est la plus grande conférence académique dans le domaine de la recherche d'informations.

Tout à l'heure, la conférence a annoncé le prix du meilleur article, le prix du meilleur article, le prix de la mention honorable du meilleur article et le prix Time Test.

Parmi eux, l'Université Tsinghua, l'École d'intelligence artificielle Hillhouse de l'Université Renmin de Chine et l'équipe de Xiaohongshu ont remporté le meilleur article ; des chercheurs de l'Université de Glasgow et de l'Université de Pise ont remporté la deuxième place ; l'article a été décerné à l'Université du Shandong (Qingdao), à l'Université de Leiden et à l'Université d'Amsterdam ; le Time Test Award a été décerné à des chercheurs de l'Université Tsinghua et de l'Université de Californie à Santa Cruz.

Examinons ensuite le contenu spécifique de l’article gagnant.

meilleur papier



Thèse : Mise à l'échelle des lois pour une récupération dense

Auteurs de l'article : Fang Yan, Jingtao Zhan, Ai Qingyao, Mao Jiaxin, Weihang Su, Jia Chen, Liu Yiqun

Institutions : Université Tsinghua, Hillhouse School of Artificial Intelligence de l'Université Renmin de Chine, Xiaohongshu

Lien papier : https://dl.acm.org/doi/abs/10.1145/3626772.3657743

Introduction au document : Les chercheurs ont observé des lois d'échelle dans un large éventail de tâches, en particulier la génération de langage. La recherche montre que les performances des grands modèles de langage suivent des modèles prévisibles selon la taille des modèles et des ensembles de données, ce qui aide à concevoir des stratégies de formation efficaces et efficientes, d'autant plus que la formation à grande échelle devient de plus en plus gourmande en ressources. Cependant, en recherche dense, la loi d’expansion n’a pas été pleinement explorée.

Cette étude explore comment la mise à l'échelle affecte les performances des modèles de récupération dense. Plus précisément, l’équipe de recherche a mis en œuvre des modèles de récupération denses avec différents nombres de paramètres et les a formés à l’aide de différentes quantités de données annotées. Cette étude utilise l'entropie contrastive comme mesure d'évaluation Par rapport aux mesures de classement discrètes, l'entropie contrastive est continue et peut donc refléter avec précision les performances du modèle.



Les résultats expérimentaux montrent que les performances des modèles de récupération dense suivent une mise à l'échelle exacte de la loi de puissance avec la taille du modèle ainsi que le nombre d'annotations.







En outre, l'étude montre également que la loi d'échelle contribue à optimiser le processus de formation, par exemple en résolvant des problèmes d'allocation de ressources dans des contraintes budgétaires.



Cette étude contribue grandement à comprendre les effets d’échelle des modèles de récupération dense et fournit des orientations significatives pour les recherches futures.

Finaliste du meilleur article

La deuxième place pour le meilleur article de l'ACM SIGIR de cette année a été décernée à l'article « A Reproductibility Study of PLAID ». Les auteurs de l'article sont Sean MacAvaney de l'Université de Glasgow et Nicola Tonellotto de l'Université de Pise.



Adresse papier : https://arxiv.org/pdf/2404.14989

Résumé papier : L'algorithme PLAID de ColBERTv2 utilise des représentations de termes groupés pour récupérer et élaguer progressivement les documents afin d'obtenir le score final du document. Cet article reproduit et comble les lacunes manquantes du texte original. En étudiant les paramètres introduits par PLAID, les chercheurs ont découvert que sa limite de Pareto est formée par l'équilibre entre trois paramètres. Un écart par rapport aux paramètres recommandés peut augmenter considérablement la latence sans nécessairement améliorer son efficacité.

Sur la base de cette découverte, cet article compare PLAID à une base de référence importante absente de l'article : la réorganisation du système lexical. Il s’avère que l’application de ColBERTv2 en tant que réorganisateur au-dessus du pool de résultats initial BM25 offre un meilleur compromis efficacité-efficacité dans les paramètres à faible latence. Ce travail met en évidence l’importance d’une sélection minutieuse de lignes de base pertinentes lors de l’évaluation de l’efficacité du moteur de récupération.

Mention honorable du meilleur article

La mention honorable pour le meilleur article de cette conférence a été remportée par des chercheurs de l'Université du Shandong (Qingdao), de l'Université de Leiden et de l'Université d'Amsterdam. L'article gagnant est "Generative Retrieval as Multi-Vector Dense Retrieval".



Auteurs de l'article : Wu Shiguang, Wei Wenda, Zhang Mengqi, Chen Zhumin, Ma Jun, Ren Zhaochun, Maarten de Rijke, Ren Pengjie

Adresse papier : https://arxiv.org/pdf/2404.00684

Résumé papier : Cet article mesure la pertinence des requêtes documentaires en démontrant que la récupération générative et la récupération dense multi-vecteurs partagent le même cadre. Plus précisément, ils ont étudié la couche d’attention et la tête de prédiction de la récupération générative, révélant que la récupération générative peut être comprise comme un cas particulier de récupération dense multi-vecteurs. Les deux méthodes calculent la corrélation en calculant la somme des produits du vecteur de requête et du vecteur de document avec la matrice d'alignement.

Les chercheurs ont ensuite exploré comment ce cadre peut être appliqué à la récupération générative, en utilisant différentes stratégies pour calculer les vecteurs de jetons de documents et les matrices d'alignement. Des expériences sont menées pour vérifier les conclusions, montrant que les deux paradigmes présentent des points communs en termes d'appariement de termes dans leurs matrices d'alignement.

Prix ​​éprouvé

Le prix ACM SIGIR Time Test Award de cette année a été décerné à la recherche sur la recommandation explicable publiée au SIGIR 2014 il y a 10 ans. L'article était « Modèles de facteurs explicites pour une recommandation explicable basée sur l'analyse des sentiments au niveau de la phrase ».



Auteurs de l'article : Zhang Yongfeng, Lai Guokun, Zhang Min, Yi Zhang, Liu Yiqun, Ma Shaoping

Institution : Université Tsinghua, Université de Californie, Santa Cruz

Lien papier : https://www.cs.cmu.edu/~glai1/papers/yongfeng-guokun-sigir14.pdf

Cette recherche a défini pour la première fois le problème de la « recommandation interprétable » et a proposé des méthodes d'analyse des sentiments correspondantes pour résoudre ce défi technique, et a joué un rôle de premier plan dans des domaines connexes.

Résumé papier : Les algorithmes de recommandation basés sur le filtrage collaboratif (CF), tels que les modèles à facteurs latents (LFM), fonctionnent bien en termes de précision de prédiction. Cependant, les caractéristiques sous-jacentes rendent difficile l’explication des résultats des recommandations aux utilisateurs.

Heureusement, à mesure que les avis des utilisateurs en ligne continuent de croître, les informations disponibles pour les systèmes de recommandation de formation ne se limitent plus aux notes numériques par étoiles ou aux caractéristiques des utilisateurs/éléments. En extrayant les opinions explicites des utilisateurs sur divers aspects d'un produit à partir des avis, il est possible d'acquérir une compréhension plus détaillée de ce qui intéresse les utilisateurs, ce qui révèle en outre la possibilité de formuler des recommandations explicables.

Cet article propose l'EFM (Explicit Factor Model) pour générer des recommandations interprétables tout en maintenant une précision de prédiction élevée.

Les chercheurs extraient d’abord les caractéristiques explicites du produit et les opinions des utilisateurs en effectuant une analyse des sentiments au niveau des phrases sur les avis des utilisateurs, puis génèrent des recommandations et des déconseillations basées sur les caractéristiques spécifiques du produit qui intéressent les utilisateurs et les fonctionnalités latentes apprises. De plus, des explications intuitives au niveau des fonctionnalités expliquant pourquoi un élément est recommandé ou non sont générées à partir du modèle.

Les résultats expérimentaux hors ligne sur plusieurs ensembles de données du monde réel montrent que le cadre proposé dans cette étude surpasse les algorithmes de base concurrents sur les tâches de prédiction de notation et de recommandation top-K. Les expériences en ligne montrent que les explications détaillées rendent les recommandations et non-recommandations plus influentes sur le comportement d’achat des utilisateurs.

Prix ​​du jeune chercheur

Le prix ACM SIGIR Young Scholar Award vise à reconnaître les chercheurs qui ont joué un rôle important dans la recherche en matière de recherche d'informations, la création d'une communauté universitaire et la promotion de l'équité académique. Il doit être décerné aux jeunes chercheurs ayant obtenu leur doctorat dans les 7 ans. Ai Qingyao, professeur adjoint du Département d'informatique de l'Université Tsinghua, et Wang Xiang, professeur et directeur de doctorat de l'École de sécurité du cyberespace et de Big Data de l'Université des sciences et technologies de Chine, ont remporté le prix SIGIR 2024 Young. Prix ​​d'érudit.

Ai Qingyao

Ai Qingyao est professeur adjoint au département d'informatique de l'université Tsinghua. Ses principaux domaines de recherche portent sur la recherche d'informations, l'apprentissage automatique et le traitement du langage naturel. L'orientation principale de la recherche est la recherche et la conception de systèmes intelligents de recherche d'informations, y compris l'apprentissage de la représentation de l'information, la théorie de l'optimisation du classement et l'application de grands modèles de langage dans la recherche et la recommandation sur Internet et la justice intelligente.

Wang Xiang

Wang Xiang est professeur et directeur de doctorat à l'École de sécurité du cyberespace et à l'École de Big Data de l'Université des sciences et technologies de Chine. Les intérêts de recherche du professeur Wang Xiang comprennent la récupération d’informations, l’exploration de données et l’intelligence artificielle fiable et explicable, en particulier les systèmes de recommandation, l’apprentissage de graphiques et l’analyse des médias sociaux.