Tsinghuan yliopisto voitti Best Paper Time Testing Award -palkinnon, Shandongin yliopisto sai kunniamaininnan ja SIGIR 2024 julkaistaan

2024-07-18

Koneen sydänraportti

Toimittaja: Xiao Zhou, Chen Chen

Tsinghuan yliopiston tulokset ovat erinomaisia.

47. Association for Computing Machinery Conference on Information Retrieval (ACM SIGIR) järjestetään Washington DC:ssä, Yhdysvalloissa 14.-18.7.2024. Tämä konferenssi on akateemisen huippukonferenssi tiedonhaun alalla.

Konferenssi julkisti juuri nyt parhaan paperin palkinnon, parhaan paperin toiseksi sijoittuneen, parhaan paperin kunniamaininnan ja Time Test Award -palkinnon.

Heistä Tsinghuan yliopisto, Kiinan Renminin yliopiston Hillhouse School of Artificial Intelligence ja Xiaohongshu-tiimi voittivat parhaan tutkijat Glasgow'n yliopistosta ja Pisan yliopistosta paperi myönnettiin Shandongin yliopistolle (Qingdao), Leidenin yliopistolle ja Amsterdamin yliopistolle Time Test Award -palkinnolla Tsinghuan yliopiston ja Kalifornian yliopiston Santa Cruzista.

Seuraavaksi tarkastellaan voittajapaperin erityistä sisältöä.

paras paperi

Opinnäytetyö: Skaalauslait tiheää hakua varten

Paperin kirjoittajat: Fang Yan, Jingtao Zhan, Ai Qingyao, Mao Jiaxin, Weihang Su, Jia Chen, Liu Yiqun

Oppilaitokset: Tsinghuan yliopisto, Hillhouse School of Artificial Intelligence, Renmin University of China, Xiaohongshu

Paperilinkki: https://dl.acm.org/doi/abs/10.1145/3626772.3657743

Johdatus lehteen : Tutkijat ovat havainneet skaalauslakeja useissa eri tehtävissä, erityisesti kielten luomisessa. Tutkimukset osoittavat, että suurten kielimallien suorituskyky noudattaa ennustettavia malleja malli- ja tietojoukon kokojen välillä, mikä auttaa suunnittelemaan koulutusstrategioita tehokkaasti ja tehokkaasti, varsinkin kun laajamittaisesta koulutuksesta tulee yhä enemmän resursseja. Tiheässä haussa laajennuslakia ei kuitenkaan ole täysin tutkittu.

Tämä tutkimus tutkii, kuinka skaalaus vaikuttaa tiheiden hakumallien suorituskykyyn. Erityisesti tutkimusryhmä toteutti tiheitä hakumalleja eri parametrimäärillä ja koulutti niitä käyttämällä eri määriä annotoitua dataa. Tässä tutkimuksessa käytetään kontrastiivista entropiaa arviointimittarina. Verrattuna diskreeteihin rankingmittareihin, kontrastiivinen entropia on jatkuvaa ja voi siksi heijastaa tarkasti mallin suorituskykyä.

Kokeelliset tulokset osoittavat, että tiheiden hakumallien suorituskyky noudattaa tarkkaa teholain skaalausta mallin koon sekä huomautusten lukumäärän kanssa.

Lisäksi tutkimus osoittaa myös, että skaalauslaki auttaa optimoimaan koulutusprosessia, kuten ratkaisemaan resurssien allokointiongelmia budjettirajoittein.

Tämä tutkimus auttaa suuresti ymmärtämään tiheiden hakumallien skaalausvaikutuksia ja antaa mielekkäitä ohjeita tulevaa tutkimusta varten.

Toiseksi parhaasta paperista

Tämän vuoden ACM SIGIR -kilpailun parhaan paperin kakkonen palkittiin paperilla "A Reproducibility Study of PLAID". Kirjoittajia ovat Sean MacAvaney Glasgow'n yliopistosta ja Nicola Tonellotto Pisan yliopistosta.

Paperiosoite: https://arxiv.org/pdf/2404.14989

Paperi abstrakti : ColBERTv2:n PLAID-algoritmi käyttää klusteroituja termien esityksiä dokumenttien hakemiseen ja asteittaiseen karsimiseen asiakirjan lopullisen pistemäärän saamiseksi. Tämä artikkeli toistaa ja täyttää alkuperäisen tekstin puuttuvat aukot. Tutkiessaan PLAIDin käyttöönotettuja parametreja tutkijat havaitsivat, että sen Pareto-raja muodostuu kolmen parametrin välisestä tasapainosta. Poikkeaminen suositelluista asetuksista voi lisätä viivettä merkittävästi ilman, että se välttämättä parantaa sen tehokkuutta.

Tämän havainnon perusteella tässä artikkelissa verrataan PLAIDia tärkeään julkaisusta puuttuvaan lähtökohtaan: leksikaalisen järjestelmän uudelleenjärjestelyyn. On havaittu, että ColBERTv2:n käyttäminen uudelleenjärjestäjänä alkuperäisen BM25-tulospoolin päälle tarjoaa paremman tehokkuuden ja tehokkuuden kompromissin matalan viiveen asetuksissa. Tämä työ korostaa asiaankuuluvien perusarvojen huolellisen valinnan tärkeyttä arvioitaessa hakumoottorin tehokkuutta.

Parhaan paperin kunniamainintapalkinto

Kunniamaininnan parhaasta paperista tässä konferenssissa voittivat tutkijat Shandongin yliopistosta (Qingdao), Leidenin yliopistosta ja Amsterdamin yliopistosta. Voittajapaperi on "Generative Retrieval as Multi-Vector Dense Retrieval".

Paperin kirjoittajat: Wu Shiguang, Wei Wenda, Zhang Mengqi, Chen Zhumin, Ma Jun, Ren Zhaochun, Maarten de Rijke, Ren Pengjie

Paperiosoite: https://arxiv.org/pdf/2404.00684

Paperi abstrakti : Tämä artikkeli mittaa dokumenttikyselyiden relevanssia osoittamalla, että generatiivisella haulla ja monivektoritiheällä haulla on sama kehys. Erityisesti he tutkivat generatiivisen haun huomiokerrosta ja ennustuspäätä paljastaen, että generatiivinen haku voidaan ymmärtää monivektoritiheän haun erikoistapauksena. Molemmat menetelmät laskevat korrelaation laskemalla kyselyvektorin ja asiakirjavektorin tulojen summan kohdistusmatriisin kanssa.

Tämän jälkeen tutkijat tutkivat, kuinka tätä kehystä voidaan soveltaa generatiivisessa haussa käyttämällä erilaisia strategioita dokumenttien merkkivektorien ja kohdistusmatriisien laskemiseen. Kokeita suoritetaan johtopäätösten tarkistamiseksi, mikä osoittaa, että molemmilla paradigmoilla on yhteisiä piirteitä niiden kohdistusmatriiseissa.

Aika testattu palkinto

Tämän vuoden ACM SIGIR Time Test Award -palkinto myönnettiin SIGIR 2014:ssä 10 vuotta sitten julkaistulle selitettävissä olevalle suositukselle. Paperi oli "Explicit Factor Models for Explainable Recommendation perustuu fraasitason tunneanalyysiin".

Paperin kirjoittajat: Zhang Yongfeng, Lai Guokun, Zhang Min, Yi Zhang, Liu Yiqun, Ma Shaoping

Laitos: Tsinghuan yliopisto, Kalifornian yliopisto, Santa Cruz

Paperilinkki: https://www.cs.cmu.edu/~glai1/papers/yongfeng-guokun-sigir14.pdf

Tämä tutkimus määritteli "tulkittavan suosituksen" ongelman ensimmäistä kertaa ja ehdotti vastaavia tunteiden analysointimenetelmiä tämän teknisen haasteen ratkaisemiseksi, ja sillä on ollut johtava rooli asiaan liittyvillä aloilla.

Paperi abstrakti : Yhteiskäyttösuodatukseen (CF) perustuvat suositusalgoritmit, kuten latenttitekijämallit (LFM), toimivat hyvin ennustetarkkuuden suhteen. Taustalla olevat ominaisuudet tekevät kuitenkin suositusten tulosten selittämisen käyttäjille vaikeaksi.

Onneksi online-käyttäjien arvioiden kasvaessa edelleen, koulutussuosittelijoille saatavilla olevat tiedot eivät enää rajoitu numeerisiin tähtiluokitteluihin tai käyttäjien/tuoteominaisuuksiin. Poimimalla arvosteluista käyttäjien selkeät mielipiteet tuotteen eri näkökohdista, on mahdollista saada yksityiskohtaisempi käsitys siitä, mistä käyttäjät välittävät, mikä paljastaa edelleen mahdollisuuden antaa selittäviä suosituksia.

Tässä artikkelissa ehdotetaan, että EFM (Explicit Factor Model) tuottaa tulkittavia suosituksia säilyttäen samalla korkean ennustetarkkuuden.

Tutkijat poimivat ensin selkeät tuoteominaisuudet ja käyttäjien mielipiteet suorittamalla ilmaustason mielipideanalyysin käyttäjien arvosteluista ja luovat sitten suosituksia ja epäsuosituksia, jotka perustuvat käyttäjää kiinnostaviin tuoteominaisuuksiin ja opittuihin piileviin ominaisuuksiin. Lisäksi mallista luodaan intuitiiviset ominaisuustason selitykset siitä, miksi kohdetta suositellaan tai ei suositella.

Offline-kokeelliset tulokset useista todellisista tietojoukoista osoittavat, että tässä tutkimuksessa ehdotettu kehys ylittää kilpailevat perusalgoritmit sekä arvioiden ennustamisessa että suosituimpien K-suositusten tehtävissä. Verkkokokeet osoittavat, että yksityiskohtaiset selitykset tekevät suosituksista ja ei-suosituksista enemmän vaikutusta käyttäjien ostokäyttäytymiseen.

Nuoren tutkijan palkinto

ACM SIGIR Young Scholar Award -palkinnon tavoitteena on tunnustaa tutkijoita, jotka ovat olleet tärkeässä roolissa tiedonhakututkimuksessa, tiedeyhteisön rakentamisessa ja akateemisen tasa-arvon edistämisessä. Palkinto on myönnettävä nuorille tutkijoille, jotka ovat suorittaneet tohtorin tutkinnon 7 vuoden sisällä. Ai Qingyao, apulaisprofessori Tsinghuan yliopiston tietojenkäsittelytieteen laitokselta, ja Wang Xiang, professori ja tohtorinohjaaja Kiinan tiede- ja teknologiayliopiston kyberavaruusturvallisuuden koulusta ja Big Data Schoolista, voittivat SIGIR 2024 Youngin. Scholar-palkinto.

Ai Qingyao

Ai Qingyao on apulaisprofessori Tsinghuan yliopiston tietojenkäsittelytieteen laitoksella. Hänen päätutkimuksensa keskittyvät tiedonhakuun, koneoppimiseen ja luonnollisen kielen käsittelyyn. Keskeinen tutkimussuunta on älykkäiden tiedonhakujärjestelmien tutkimus ja suunnittelu, mukaan lukien tiedon esittämisen oppiminen, ranking-optimointiteoria sekä suurten kielimallien soveltaminen Internet-haussa ja -suosituksissa sekä älykkäässä oikeudenmukaisuudessa.

Wang Xiang

Wang Xiang on professori ja tohtorinohjaaja School of Cyberspace Securityssa ja School of Big Datassa Kiinan tiede- ja teknologiayliopistossa. Professori Wang Xiangin tutkimusintressejä ovat tiedonhaku, tiedon louhinta sekä luotettava ja selitettävissä oleva tekoäly, erityisesti suositusjärjestelmät, graafien oppiminen ja sosiaalisen median analyysi.

uutiset

Tsinghuan yliopisto voitti Best Paper Time Testing Award -palkinnon, Shandongin yliopisto sai kunniamaininnan ja SIGIR 2024 julkaistaan

Johdanto

yhteystietoni