ACL, huippukonferenssi, hyväksyi Alibaba Cloudin 38 asiakirjaa, ja Tongyi-tiimi paljasti useita suuria mallien huipputeknologioita.
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Chao News -asiakastoimittaja Zhang Yunshan
ACL 2024 Annual Conference, laskennallisen lingvistiikan ja luonnollisen kielen prosessoinnin alan huippukonferenssi, pidettiin tällä viikolla Thaimaassa. Konferenssiin hyväksyttiin yhteensä 38 korkean tason esitystä Alibaba Cloudista, mukaan lukien monet suuret malli- liittyviä asiakirjoja Tongyi Qianwen -tiimiltä, jotka kattavat laajoja aiheita Model SFT -teknologian, LLM-roolipelaamisen, multimodaalisen mallin arvioinnin vertailuarvot. Bangkokin konferenssin Tongyi-osastoa seurasivat NLP-tutkijat ja -kehittäjät kaikkialta maailmasta, ja Tongyista tuli tapahtumapaikan katsotuin kiinalainen malli.
ACL 2024 vuosikokous pidetään tällä viikolla Thaimaassa
ACL Annual Meeting of Association for Computational Linguistics on International Association for Computational Linguistics -järjestön järjestämä, ja se on laskennallisen lingvistiikan ja luonnollisen kielen käsittelyn alan paras akateeminen konferenssi. ACL 2024 on yhdistyksen 62. konferenssi. Tämän vuoden konferenssissa kiinnitetään erityistä huomiota aiheeseen "toistettavan luonnollisen kielen prosessointitutkimuksen edistäminen avoimen tieteen, avoimen datan ja avointen mallien avulla".
Alibaba Cloud on aina ollut yksi teknologiayrityksistä, joka on julkaissut eniten ACL-artikkeleita. Kiinan suurten mallien "avoimen lähdekoodin" voiman edustajana Tongyin suuri mallitiimi paljasti tässä konferenssissa useita huippuluokan suuria malliteknologioita ja kommunikoi kasvokkain NLP-tutkijoiden ja -kehittäjien kanssa ympäri maailmaa.
"Suuret kielimallit ovat kaikkien hahmojen superpositiota: mielivaltaisen roolileikin saavuttaminen itsensä mukauttamisen kautta" ehdotti ensin itsekohdistusstrategiaa DITTO:ta suuriin malliroolipeleihin, mikä paransi merkittävästi LLM:n roolipeliominaisuuksia DITTO ; "AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension" esittelee Tongyi-tiimin käynnistämän äänikielen ymmärtämismallin arviointivertailun AIR-Bench, jota käytetään mallin luovien ohjeiden seuraamiskyvyn arvioimiseen ja se täyttää aukon Teollisuus "Kuinka valvottu hienosäätöinen tietojen kokoaminen vaikuttaa kykyihin suurissa kielimalleissa" osoittaa kokeiden avulla, kuinka SFT-tiedot vaikuttavat LLM:n matemaattisiin, koodiin ja ihmisiin kohdistuviin kykyihin, mikä voi tarjota viittauksen tutkijoille ja kehittäjille; SFT-työssään.
Ulkomaiset kehittäjät kouluttivat suuren thai-kielimallin ja suuren Kaakkois-Aasian kielimallin, joka perustuu Qweniin
Elokuusta 2023 lähtien Tongyi Qianwen on hankkinut avoimen lähdekoodin kymmeniä LLM-, multimodaali- ja erikoiskykymalleja, ja Qwen-sarjan avoimen lähdekoodin malleja on ladattu yli 20 miljoonaa kertaa.
Kaakkois-Aasiassa avoimen lähdekoodin Tongyi Qianwen -mallilla on myös monia uskollisia käyttäjiä. Suuret Qwen-koulutukseen perustuvat mallit ovat usein nähtävissä thai-, vietnami-, kaakkois-aasialaisille ja muille kielille. Esimerkiksi singaporelainen insinööri Liu Gan koulutti suositun Kaakkois-Aasian suuren Sailor-mallin, joka perustuu Qwen1.5:een, joka kattaa koko valikoiman kokoja, kuten 0.5B, 1.8B, 4B, 7B ja 14B. Vietnamilainen insinööri Nguyen Quan kehitti suuren vietnamilaisen Hän sanoi: "Sisäisen vertailuarviomme mukaan Qwen2-perusmalli ylittää kaikki tällä hetkellä markkinoilla olevat suljetun lähdekoodin suuret kielimallit."
Liitteenä: Luettelo Alibaba Cloud -papereista, jotka sisältyvät ACL 2024:ään
Luettelo ACL 2024:ään sisältyvistä Alibaba Cloud -papereista
"Ilmoita lähde, kun tulostat uudelleen"