kamppailetko edelleen ai-loitsujen kanssa? pekingin yliopisto-baichuan on kehittänyt automaattisen muistutussuunnittelujärjestelmän pas

2024-09-10

aixiv-sarake on sarake, jossa machine heart julkaisee akateemista ja teknistä sisältöä. viime vuosina heart of the machine aixiv -kolumni on saanut yli 2 000 raporttia, jotka kattavat tärkeimpien yliopistojen ja yritysten huippulaboratoriot ympäri maailmaa ja edistävät tehokkaasti akateemista vaihtoa ja levittämistä. jos sinulla on erinomaista työtä, jonka haluat jakaa, ole hyvä ja osallistu tai ota meihin yhteyttä raportoidaksesi. lähetyssähköposti: [email protected]; [email protected]

zheng miao, paperin ensimmäinen kirjoittaja, on peräisin zhou zenanin johtamasta baichuan alignment -tiimistä. hän valmistui pekingin yliopistosta hankkeita, kuten mmflow. toinen kirjoittaja liang hao on tohtoriopiskelija institute of frontier interdisciplinary studiesissa pekingin yliopistossa hänen tutkimussuuntansa on suurten mallien datapuoli, ja hänen neuvonantajansa on professori zhang wentao. pekingin yliopiston ja baichuanin älykkään tekoälyjärjestelmän yhteislaboratorio perustettiin tammikuussa 2024. sen tavoitteena on tutkia tärkeitä asioita, kuten tieteellisiä ja systemaattisia tiedontuotanto- ja laadunarviointistrategioita, laajaa mallikoulutusta ja johtopäätösten kiihdytystä tekoälyn mallijärjestelmien koko teknisessä prosessissa. . yhteistä laboratoriota johtavat cui bin, pekingin yliopiston boyan professori, ja chen weipeng, baichuan intelligencen perustaja.

suuret transformer-arkkitehtuuriin perustuvat kielimallit ovat saavuttamassa läpimurtotuloksia eri aloilla. prompt engineeringillä on tässä ratkaiseva rooli.

hyvillä vihjeillä tutkijat ja kehittäjät voivat ohjata malleja toimimaan paremmin tietyissä tehtävissä. tämä menetelmä ei vain voi parantaa merkittävästi mallin suorituskykyä, vaan myös parantaa mallin mukautumiskykyä, mikä tekee siitä joustavamman ja tehokkaamman erilaisten monimutkaisten tehtävien edessä.

lisäksi nopea sanaprojekti voi myös optimoida mallin oppimisprosessia, parantaa monimutkaisen ongelmankäsittelyn tehokkuutta ja vähentää koulutusaikaa ja laskentaresurssivaatimuksia.

perinteisiin hienosäätömenetelmiin verrattuna nopea sanasuunnittelu voi mukauttaa mallin useisiin loppupään tehtäviin erittäin alhaisilla kustannuksilla, mikä säästää merkittävästi laskentaresursseja ja tiedonkeruukustannuksia. tehokkaiden vihjesanojen suunnittelu on kuitenkin edelleen haastavaa ei-asiantuntijoille ja vaatii usein paljon oppimista ja harjoittelua.

yleensä on vaikea saavuttaa ihanteellisia tuloksia käyttämällä suoraan suuria kielimalleja automaattisissa kehotusprojekteissa. sopimattomat vihjeet voivat häiritä mallia ja heikentää suorituskykyä. siksi on erityisen tärkeää kehittää automaattinen nopea suunnittelujärjestelmä, joka voi auttaa käyttäjiä ja jota on helppo käyttää.

pas: mullistava automaattinen hälytysjärjestelmä

tämän haasteen ratkaisemiseksi pekingin yliopiston ja baichuanin yhteislaboratorio ehdotti pas-automaattista nopeaa suunnittelujärjestelmää. pas:n innovaatio on:

1. suunnittele korkealaatuinen automaattinen kehote tietojoukko

2. suorita muutaman näytteen oppiminen ja tietojen seulonta gpt-mallilla

3. luo automaattisesti virtaviivainen ja tehokas nopea tietojoukko

4. toteuta tehokas automaattinen kehotussuunnittelu hienosäädön avulla

pas voi tiiviisti ja tehokkaasti täydentää käyttäjän syötteitä toteuttamalla nopean, yksinkertaisen ja automaattisen kehotusprojektin, joka tukee suoratoistonäyttöä.

useissa vertailutesteissä pas ylittää huomattavasti olemassa olevat sota-mallit ja vaatii vähemmän dataa. manuaaliset arviointitulokset osoittavat myös, että pas:n suorituskyky on erinomainen, mikä korostaa sen valtavaa potentiaalia käytännön sovelluksissa.

tämä läpimurtotulos ei ainoastaan edistä nopean sanatekniikan kehitystä, vaan myös tasoittaa tietä laajojen kielimallien soveltamiselle useammilla aloilla.

paperiosoite: https://arxiv.org/abs/2407.06027
pku-baichuan-mlsystemlab:

https://github.com/pku-baichuan-mlsystemlab

https://huggingface.co/pku-baichuan-mlsystemlab

menetelmä

pas-koulutus on jaettu pääasiassa kolmeen vaiheeseen:

vaihe 1: luo korkealaatuinen ongelmatietojoukko

ensimmäinen tehtävä pas-koulutuksessa on rakentaa laadukas ongelmatietojoukko. kuten kuvasta (a) näkyy, tutkijat seuloivat lmsys-1m- ja wildchat-tietosarjoihin perustuvia korkealaatuisia kysymyksiä seuraavien kolmen näkökohdan kautta:

1. tietojen päällekkäisyyden poistaminen: käytä upotustekniikkaa yhdistettynä klusterointialgoritmeihin, jotta voit poistaa tehokkaasti päällekkäisiä tietoja.

2. laadunseulonta: käytä baichuanin suurta mallia tietojen laadun arvioimiseen ja seulomiseen.

3. monimuotoisuustakuu: lopulta valittiin 9 000 korkealaatuista kysymystietoa, jotka kattavat yli 10 luokkaa.

vaihe 2: täydennä nopeat tekniset tiedot

tässä vaiheessa tutkijat käyttivät kattavasti sisäisesti kertynyttä 100 korkealaatuista dataa ja ensimmäisessä vaiheessa seulottua ongelmatietoa ja käyttivät muutaman laukauksen oppimismenetelmää automaattisen nopean suunnitteludatan rakentamiseen gpt-mallin avulla:

1. alkutietojen luominen: käytä muutaman kerran oppimista ohjataksesi gpt:tä luomaan alustavat nopeat suunnittelutiedot.

2. laadunvalvonta: suunnittele kritiikki-vaihe ja käytä muutaman kerran oppimista uudelleen, jotta gpt arvioi luotujen tietojen laadun.

3. iteratiivinen optimointi: suodata automaattisesti pois huonolaatuiset tiedot ja luo se uudelleen varmistaaksesi tietojen laadun useiden iterointikierrosten avulla.

4. lopputulos: lopulta saatiin 9 000 kappaletta korkealaatuista automaattista nopeaa suunnittelutietoa.

tietojen jakelu

syntyneen 9000 tiedon jakautuminen on esitetty yllä olevassa kuvassa, mikä varmistaa aineiston monimuotoisuuden ja edustavuuden.

vaihe 3: hienosäädä automaattisen kehotteen malli

viimeisessä vaiheessa käytetään kahdessa ensimmäisessä vaiheessa saatua tietojoukkoa suuren kielimallin hienosäätämiseen:

1. valitse perusmalli: kuten qwen2-7b ja muut mallit.

2. suunnattu hienosäätö: käytä korkealaatuisia tietojoukkoja hienosäätöön.

3. erikoiskoulutus: lopuksi hankitaan laaja kielimalli erityisesti automaattisia pikaprojekteja varten.

kokeilut ja tulokset

manuaalinen tarkistus

ihmisarvioijan arvion mukaan pas osoittaa korkeampaa voittoprosenttia eri aloilla verrattuna aiempaan sota-malliin (state-of-the-art). keskimääräinen voittoprosentti monilla aloilla ylittää 50 % ja voitto- ja arvonnan summa on jopa yli 80 %.

koneen arviointibenchmark

jotta pas:n suorituskykyä voitaisiin arvioida kattavasti, tutkijat valitsivat kolme vertailukohtaa: arena-hard, alpaca-eval 2.0 ja alpaca-eval 2.0 (lc).

tämän jälkeen tutkijat sovelsivat pas:ää kuuteen parhaaseen tekoälymalliin, mukaan lukien:

gpt-4 (kolme versiota)
gpt-3.5
qwen2-72-ohje
llama3-70b-ohje

arvioinnin tulokset osoittavat:

pas saavuttaa merkittäviä parannuksia verrattuna sekä no-prompt -tapaukseen että aiempaan sota-automaattisen kehotteen suunnittelumalliin.
verrattuna aikaisempiin bpo-malleihin, pas on mukautuvampi, se on yhteensopiva useiden erittäin suurten mallien kanssa ja parantaa suorituskykyä jokaisessa mallissa.

laskennallinen tehokkuusanalyysi

pas ei ainoastaan toimi hyvin suorituskyvyn suhteen, vaan se on myös erittäin laskennallisesti tehokas: tiedon tehokkuuden kannalta se vaatii vain 9 000 hienosäädettyä dataa ylivertaisen suorituskyvyn osoittamiseksi. tuotostehokkuuden kannalta se voi rajoittaa automaattisten lisäkehotteiden pituutta, yleensä enintään 30 sanaa.

käyttökokemuksen kannalta pas tuo etuja myös suuriin malleihin, erityisesti:

toisin kuin aikaisemmat mallit, kuten bpo, pas:n ei tarvitse muokata käyttäjän alkuperäistä kysymystä, vain täydentäviä automaattisia kehotteita.
tarjoa erinomainen käyttökokemus hallittavalla vasteajalla.
tukee gpt-tyyppistä suoratoistonäyttöä vuorovaikutteisen kokemuksen parantamiseksi.

esimerkki: pas auttaa suuria malleja välttämään logiikkaansa

"jos puussa on 10 lintua ja yksi niistä ammutaan kuoliaaksi, kuinka monta lintua on maassa?"

tämä näennäisesti yksinkertainen kysymys kätkee itse asiassa nokkelan loogisen ansan.

kuten kuvasta näkyy, gpt antaa vääriä vastauksia ilman pas:n apua. pas-järjestelmä parantaa merkittävästi mallin suorituskykyä täydentämällä kehotussanoja:

pas:n ohjauksessa mallin uusi vastauskierros osoitti merkittäviä parannuksia. se ei ainoastaan onnistunut välttämään kysymysten loogisia ansoja, osoittanut selkeän, monivaiheisen loogisen päättelyn, mutta myös opastanut käyttäjiä ymmärtämään koko päättelyprosessin.

kiinnostuneet lukijat voivat lukea artikkelin alkuperäisen tekstin saadakseen lisätietoja tutkimuksen sisällöstä.

uutiset

kamppailetko edelleen ai-loitsujen kanssa? pekingin yliopisto-baichuan on kehittänyt automaattisen muistutussuunnittelujärjestelmän pas

johdanto

yhteystietoni