notizia

L'Università di Tsinghua ha vinto il premio Best Paper Time Testing, l'Università di Shandong ha ricevuto una menzione d'onore e SIGIR 2024 è stato rilasciato

2024-07-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Rapporto sul cuore della macchina

Redattore: Xiao Zhou, Chen Chen

I risultati della Tsinghua University sono eccezionali.

La 47a conferenza dell'Association for Computing Machinery on Information Retrieval (ACM SIGIR) si terrà a Washington, DC, USA dal 14 al 18 luglio 2024. Questa conferenza è la conferenza accademica più importante nel campo del recupero delle informazioni.

Proprio adesso, la conferenza ha annunciato il Best Paper Award, il Best Paper Runner-up, il Best Paper Honorable Mention Award e il Time Test Award.

Tra questi, la Tsinghua University, la Hillhouse School of Artificial Intelligence della Renmin University of China e il team di Xiaohongshu hanno vinto il miglior articolo; i ricercatori dell'Università di Glasgow e dell'Università di Pisa hanno vinto il secondo premio; l'articolo è stato assegnato all'Università di Shandong (Qingdao), all'Università di Leiden e all'Università di Amsterdam; il Time Test Award è stato assegnato a ricercatori dell'Università di Tsinghua e dell'Università della California, a Santa Cruz;

Successivamente, diamo un’occhiata al contenuto specifico del documento vincitore.

carta migliore



Tesi: Leggi di scala per il recupero denso

Autori dell'articolo: Fang Yan, Jingtao Zhan, Ai Qingyao, Mao Jiaxin, Weihang Su, Jia Chen, Liu Yiqun

Istituzioni: Tsinghua University, Hillhouse School of Artificial Intelligence presso Renmin University of China, Xiaohongshu

Link al documento: https://dl.acm.org/doi/abs/10.1145/3626772.3657743

Introduzione al documento : I ricercatori hanno osservato leggi di scala in un'ampia gamma di compiti, in particolare nella generazione del linguaggio. La ricerca mostra che le prestazioni di modelli linguistici di grandi dimensioni seguono modelli prevedibili tra le dimensioni dei modelli e dei set di dati, il che aiuta a progettare strategie di formazione in modo efficace ed efficiente, soprattutto perché la formazione su larga scala richiede sempre più risorse. Tuttavia, nel recupero denso, la legge di espansione non è stata completamente esplorata.

Questo studio esplora il modo in cui il ridimensionamento influisce sulle prestazioni dei modelli di recupero denso. Nello specifico, il gruppo di ricerca ha implementato modelli di recupero densi con diversi numeri di parametri e li ha addestrati utilizzando diverse quantità di dati annotati. Questo studio utilizza l'entropia contrastiva come metrica di valutazione. Rispetto alle metriche di classificazione discrete, l'entropia contrastiva è continua e pertanto può riflettere accuratamente le prestazioni del modello.



I risultati sperimentali mostrano che le prestazioni dei modelli di recupero densi seguono un esatto ridimensionamento della legge di potenza con le dimensioni del modello e il numero di annotazioni.







Inoltre, lo studio mostra anche che la legge di dimensionamento aiuta a ottimizzare il processo di formazione, ad esempio risolvendo problemi di allocazione delle risorse in presenza di vincoli di bilancio.



Questo studio contribuisce notevolmente a comprendere gli effetti di scala dei modelli di recupero densi e fornisce indicazioni significative per la ricerca futura.

Secondo classificato per il miglior articolo

Il secondo classificato per il miglior articolo dell'ACM SIGIR di quest'anno è stato assegnato all'articolo "A Reproducibility Study of PLAID". Gli autori dell'articolo includono Sean MacAvaney dell'Università di Glasgow e Nicola Tonellotto dell'Università di Pisa.



Indirizzo del documento: https://arxiv.org/pdf/2404.14989

Estratto di carta : L'algoritmo PLAID di ColBERTv2 utilizza rappresentazioni di termini raggruppati per recuperare e eliminare progressivamente i documenti per ottenere il punteggio finale del documento. Questo articolo riproduce e colma le lacune mancanti nel testo originale. Studiando i parametri introdotti da PLAID, i ricercatori hanno scoperto che il suo confine di Pareto è formato dall'equilibrio tra tre parametri. La deviazione dalle impostazioni consigliate può aumentare significativamente la latenza senza necessariamente migliorarne l'efficacia.

Sulla base di questa scoperta, questo articolo confronta PLAID con un'importante linea di base mancante nell'articolo: il riordino del sistema lessicale. Si è scoperto che l'applicazione di ColBERTv2 come riordinatore in aggiunta al pool di risultati iniziale di BM25 fornisce un migliore compromesso tra efficienza ed efficacia in impostazioni a bassa latenza. Questo lavoro evidenzia l'importanza di un'attenta selezione delle linee di base rilevanti quando si valuta l'efficienza del motore di recupero.

Premio Menzione d'Onore per il miglior articolo

Il premio con la menzione d'onore per il miglior articolo di questa conferenza è stato vinto da ricercatori dell'Università di Shandong (Qingdao), dell'Università di Leiden e dell'Università di Amsterdam. L'articolo vincitore è "Generative Retrieval as Multi-Vector Dense Retrieval".



Autori dell'articolo: Wu Shiguang, Wei Wenda, Zhang Mengqi, Chen Zhumin, Ma Jun, Ren Zhaochun, Maarten de Rijke, Ren Pengjie

Indirizzo del documento: https://arxiv.org/pdf/2404.00684

Estratto di carta : Questo articolo misura la rilevanza delle query sui documenti dimostrando che il recupero generativo e il recupero denso multivettoriale condividono lo stesso quadro. Nello specifico, hanno studiato lo strato di attenzione e la testa di previsione del recupero generativo, rivelando che il recupero generativo può essere inteso come un caso speciale di recupero denso multivettoriale. Entrambi i metodi calcolano la correlazione calcolando la somma dei prodotti del vettore di query e del vettore del documento con la matrice di allineamento.

I ricercatori hanno poi esplorato come questo quadro possa essere applicato nel recupero generativo, utilizzando diverse strategie per calcolare i vettori dei token dei documenti e le matrici di allineamento. Vengono condotti esperimenti per verificare le conclusioni, dimostrando che entrambi i paradigmi presentano punti comuni nella corrispondenza dei termini nelle rispettive matrici di allineamento.

Premio testato nel tempo

L'ACM SIGIR Time Test Award di quest'anno è stato assegnato alla ricerca sulle raccomandazioni spiegabili pubblicata al SIGIR 2014 10 anni fa. Il documento era "Modelli fattoriali espliciti per raccomandazioni spiegabili basati sull'analisi del sentiment a livello di frase".



Autori dell'articolo: Zhang Yongfeng, Lai Guokun, Zhang Min, Yi Zhang, Liu Yiqun, Ma Shaoping

Istituzione: Tsinghua University, Università della California, Santa Cruz

Collegamento al documento: https://www.cs.cmu.edu/~glai1/papers/yongfeng-guokun-sigir14.pdf

Questa ricerca ha definito per la prima volta il problema della "raccomandazione interpretabile" e ha proposto metodi di analisi del sentiment corrispondenti per risolvere questa sfida tecnica, e ha svolto un ruolo di primo piano in campi correlati.

Estratto di carta : Gli algoritmi di raccomandazione basati sul filtraggio collaborativo (CF), come i modelli a fattori latenti (LFM), funzionano bene in termini di accuratezza della previsione. Tuttavia, le caratteristiche sottostanti rendono difficile spiegare i risultati delle raccomandazioni agli utenti.

Fortunatamente, poiché le recensioni degli utenti online continuano a crescere, le informazioni disponibili per i sistemi di raccomandazione della formazione non si limitano più alle valutazioni numeriche in stelle o alle caratteristiche dell’utente/articolo. Estraendo dalle recensioni le opinioni esplicite degli utenti su vari aspetti di un prodotto, è possibile ottenere una comprensione più dettagliata di ciò che interessa agli utenti, il che rivela ulteriormente la possibilità di formulare raccomandazioni spiegabili.

Questo articolo propone l'EFM (Explicit Factor Model) per generare raccomandazioni interpretabili mantenendo un'elevata precisione di previsione.

I ricercatori innanzitutto estraggono le caratteristiche esplicite del prodotto e le opinioni degli utenti eseguendo un'analisi del sentiment a livello di frase sulle recensioni degli utenti, quindi generano raccomandazioni e sconsigliamenti basati su caratteristiche specifiche del prodotto di interesse dell'utente e sulle caratteristiche latenti apprese. Inoltre, dal modello vengono generate spiegazioni intuitive a livello di funzionalità del motivo per cui un articolo è consigliato o sconsigliato.

I risultati sperimentali offline su più set di dati del mondo reale mostrano che il quadro proposto in questo studio supera gli algoritmi di base concorrenti sia nelle attività di previsione della valutazione che in quelle di raccomandazione top-K. Esperimenti online mostrano che spiegazioni dettagliate rendono le raccomandazioni e le non raccomandazioni più influenti sul comportamento di acquisto degli utenti.

Premio per giovani studiosi

L'ACM SIGIR Young Scholar Award mira a riconoscere i ricercatori che hanno svolto un ruolo importante nella ricerca sul recupero delle informazioni, nella creazione di comunità accademiche e nella promozione dell'equità accademica. È necessario che venga assegnato a giovani ricercatori che hanno conseguito il dottorato entro 7 anni. Ai Qingyao, professore assistente del Dipartimento di Informatica dell'Università di Tsinghua, e Wang Xiang, professore e supervisore del dottorato della School of Cyberspace Security e Big Data School dell'Università di Scienza e Tecnologia della Cina, hanno vinto il SIGIR 2024 Young Premio studioso.

Ai Qingyao

Ai Qingyao è un professore assistente presso il Dipartimento di Informatica dell'Università di Tsinghua. Le sue principali aree di ricerca si concentrano sul recupero delle informazioni, sull'apprendimento automatico e sull'elaborazione del linguaggio naturale. La direzione chiave della ricerca è la ricerca e la progettazione di sistemi intelligenti di recupero delle informazioni, compreso l'apprendimento della rappresentazione delle informazioni, la teoria dell'ottimizzazione del ranking e l'applicazione di ampi modelli linguistici nella ricerca e raccomandazione su Internet e nella giustizia intelligente.

Wang Xiang

Wang Xiang è professore e supervisore del dottorato presso la School of Cyberspace Security e la School of Big Data dell'Università della Scienza e della Tecnologia della Cina. Gli interessi di ricerca del professor Wang Xiang includono il recupero delle informazioni, il data mining e l’intelligenza artificiale affidabile e spiegabile, in particolare i sistemi di raccomandazione, l’apprendimento dei grafici e l’analisi dei social media.