Kun agentit alkavat luoda itseään, jääkö tekoälytuotteiden räjähdysmäinen unelma edelleen?

2024-08-21

TencentTeknologiakirjailija Hao Boyang

Toimittaja Zheng Kejun

2024,AI Alan kuumin aihe on epäilemättä agentti.

“iso malliSiistiä, mutta mitä voin tehdä sille? "Tämä on vuotuinen tekoälysovelluskysymys vuonna 2023. Vuoteen 2024 mennessä agenteista on tullut lupaavin vastalääke tälle ongelmalle.

Älykkäitä agentteja voidaan käyttää monimutkaisten prosessien ja työkalujen kautta, jolloin suuret mallit voivat käsitellä monimutkaisempia ja räätälöityjä tehtäviä, mikä lopulta tuottaa ohjelmistokokonaisuuksia tai fyysisiä kokonaisuuksia, joilla on autonomia, havainto-, päätöksenteko- ja toimintakyky. Ng Enda, Jim Fan ja muut alan suuret nimet ovat liittyneet todistamaan älykkään agentin tehokkuutta.

Professori Ng Enda ehdotti blogissaan tämän vuoden maaliskuussa, että sitä tulisi käyttää HumanEval-aineistossa GPT-3.5(Zero-shot) -testin tarkkuus on 48,1 %. GPT-4(Zero-shot) on 67,0 %. Yhteistyöllä Agent-työnkulun kanssa GPT-3.5 saavutti 95,1 prosentin tarkkuuden.

(Kuvahuomautus: Ng Endan kokeet älykkäällä agenttitekniikalla,GPT 3.5-suorituskyky ylittää huomattavasti alkuperäisen GPT4:n)

Siksi viime vuoden aikana kaikki suuryrityksistä yksityisiin asiantuntijoihin ovat rakentaneet älykkäitä kehoja. tarpeeksi isoMicrosoftCopilit, järjetön tekoälyn ennustaminen, älykkäiden agenttikehysten rakentamisen työkalut, kuten Langchain, Coze ja Dify, ovat myös nousseet kuin sieniä sateen jälkeen, ja niiden suosio jatkaa kasvuaan.

(Kuvahuomautus: INSIGHTin kokoamat agentteihin ja tekoälyautomaatioprosesseihin liittyvät yritykset)

Andrew Karpathy, entinen OpenAI:n tutkija, sanoi kerran, että tavalliset ihmiset, yrittäjät ja nörtit rakentavat tekoälyagentteja harvemmin kuinOpenAITällaisilla yrityksillä on jopa etu.

Onko tekoälyagentin työnkulkuun perustuvien tuotejohtajien uusi aikakausi tulossa? Ei välttämättä, koska tekoäly saattaa olla parempi älykkäiden agenttien rakentamisessa kuin ihmiset.

Automatisoitu silmukkalogiikka

19. elokuuta kolme Brittiläisen Kolumbian yliopiston tutkijaa julkaisi paperin nimeltä "Agenttijärjestelmien automatisoitu suunnittelu". Tässä artikkelissa hän suunnitteli järjestelmän, jonka avulla tekoäly voi löytää ja rakentaa agentteja yksinään, ja se voi iteroida itsekseen.

Muista OpenAI:n klassinen agentin määritelmä Agentti on tuote, joka voi tallentaa tietoa, suunnitella ja soveltaa työkaluja.

Kun käytämme työnkulkua agenttien rakentamiseen, käytämme myös olemassa olevaa tietoa (tietoa agenttien muodosta) suunnitellaksemme itse (rakennusprosessit) ja käyttääksemme työkaluja (pääsysovellusliittymiä) lopputuloksen suorittamiseen agentti itse.

Joten miksi et rakentaisi agenttia, joka voi automaattisesti löytää ja suunnitella agentit?

Paperin kirjoittaja noudattaa tätä ajatusta ja kutsuu suunnittelijaa meta-agentiksi, jota hän pyytää suunnittelemaan uusia agentteja. Lisää suunniteltu agentti tietokantaan datana ja iteroi jatkuvasti uusia ja vahvempia versioita agentista.

Tätä koko joukkoa menetelmiä he kutsuvat ADAS:ksi (Automated Design of Intelligent Systems).

Miten tämä järjestelmä sitten tarkalleen ottaen tulee voimaan?

Anna ketjun kääntyä

Uusien agenttien luontiprosessi ADAS-järjestelmissä voidaan jakaa kolmeen osaan:

Ensimmäinen osa luo hakuavaruuden, joka voidaan ymmärtää joidenkin perustyökalujen ja -sääntöjen käyttämisenä mahdollisten uusien agenttien suunnittelussa.

Toinen osa on suorittaa hakualgoritmi, joka määrittää, kuinka meta-agentti käyttää hakutilaa ja käyttää sen elementtejä erityisesti uusien agenttien rakentamiseen.

Viimeinen osa on suorittaa arviointitoiminto, joka arvioi rakennetun agentin suorituskyvyn ja muiden tavoitteiden perusteella.

Tutkijat selittävät vaihe vaiheelta, kuinka yllä olevat kolme ydinosaa rakennetaan paperissa.

Ensin on selvitettävä hakuavaruuden rakentamisen peruselementit. Tutkijat uskovat, että paras menetelmä on koodi.

Tämä johtuu siitä, että koodi on Turingin valmis ja voi ilmaista kaikki mahdollisuudet. Joten teoriassa meta-agentit voivat löytää mahdollisia rakennuspalikoita (kuten vihjeitä, työkalujen käyttöä, ohjausvirtaa) ja agenttijärjestelmiä, jotka yhdistävät nämä rakennuspalikat millä tahansa tavalla.

Vielä tärkeämpää on, että erilaiset työnkulut, jotka ovat jo olemassa verkkosivustoilla, kuten Langchain rakennusagenteille, on kodifioitu. Siksi asiaankuuluvat tiedot ovat käden ulottuvilla, eikä niitä tarvitse muuntaa uudelleen. Työkalukutsuilla, kuten RAG (retrieval augmented generation) ja muilla ominaisuuskomponenteilla on jo erittäin riittävä koodikanta.

Koodin käyttäminen hakutilan rakentamiseen tarkoittaa myös sitä, että ADAS:n luomia agentteja voidaan käyttää suoraan virheiden korjaamiseksi ja tulosten suorittamiseksi ilman manuaalista puuttumista.

Hakutilan määrittämisen jälkeen tutkijat alkavat suunnitella hakualgoritmeja, joiden avulla meta-agentti voi tutkia mahdollisia tapoja suorittaa tehtävä. Tämä prosessi on pohjimmiltaan valmis luottamalla nopeaan sanaprojektiin.

Ensimmäinen on antaa sille sarja järjestelmäkehotteita.

Laita sitten perusKehoteMainitut tiedot annetaan meta-agentille, mukaan lukien

1. Tehtävän peruskuvaus.

2. Perusteellisin kehyskoodi, kuten muotoilukehotteet, kapselointi ja muut toimintojen nimet, sekä mahdollisuus kutsua muita perusmalleja (FM) ja API:ita.

(Kuvahuomautus: osa kehyskoodia)

3. Tehtävän syötteen ja tulosteen muoto ja esimerkkejä.

4. Joidenkin alkuperäisessä iteraatiossa luotujen agenttien muodostama näytekirjasto, mukaan lukien niiden lähtötason testitulokset.

(Kuvahuomautus: Esimerkki älykkäästä agenttikirjastosta)

Näiden perusvihjeiden perusteella ADAS voi alkaa toimia ja luoda älykkään agentin ratkaisemaan tietyn ongelman.

Tässä prosessissa meta-agentti suorittaa kaksi pohdintakierrosta varmistaakseen, että luotu agentti on uusi ja oikea. Se tarkistaa, onko äskettäin luodussa koodikehyksessä virheitä ja onko se tarpeeksi innovatiivinen verrattuna agenttiesimerkkikirjaston aikaisempiin tuloksiin.

Meta-agentin on myös suoritettava alustava arvio luodusta agentista, joka perustuu sen "ymmärrykseen" käytännön suorituskykyominaisuuksista määrittääkseen, toimiiko se paremmin kuin edellinen agentti.

Jos jotkut näistä ehdoista eivät täyty, meta-agentin on joko muokattava luotua agenttia tai yksinkertaisesti luotava se uudelleen.

(Kysy ensimmäiselle pohdiskelukierrokselle)

Kahden pohdiskelu- ja muokkauskierroksen jälkeen meta-agentti lähettää äskettäin luodun agentin, jonka se pitää uutena ja hyvänä arviointijärjestelmään kolmannessa vaiheessa.

Arviointijärjestelmä antaa objektiivisen pistemäärän agentin kyvylle perustestin perusteella ja palauttaa sen sitten agentin esimerkkikirjastoon.

Meta-agentti jatkaa seuraavan iteraation optimointia aiempien pisteytystulosten ja esimerkkikirjaston aikaisempien esimerkkien perusteella saavuttaakseen korkeamman tehtävän suorituspisteen.

Tässä prosessissa syntyi kokonainen täysin automatisoitu ketju. Erittäin tehokkaan agentin luominen voi kestää yli kaksinumeroisia iteraatioita.

Käsien hieromisen lisäksi älykkyyttä

Kuinka monimutkaisia voivat olla ADAS-menetelmillä automatisoimalla prosesseja saadut älykkäät agentit? Alla oleva kuva on agenttikehys, joka on luotu 14 iteroinnin jälkeen.

Tämän agentin rakenteessa on viisi ajatusketjua, jotka antavat alustavia vastauksia. Kolmen asiantuntija-asiantuntijamallin ja ihmisen arviointia jäljittelevän mallin palautteen jälkeen vastauksia muokataan ja parannetaan kolme kertaa optimointiprosessin aikana. Lopuksi kolme tulosta seulottiin arvioinnin jälkeen ja yhdistettiin lopullisen vastauksen saamiseksi.

Jos ihminen toimisi näin monimutkaisesti, se kestäisi todennäköisesti viikon. Nyt on vain aika kirjoittaa kehotteita ja suunnitteluarkkitehtuuria, puhumattakaan testaamisesta ja horisontaalisesta vertailusta.

Tietenkin tämä on myös seurausta jatkuvasta iteraatiosta meta-agentin suunnittelussa.

Iteratiivisen prosessin aikana sen kyky luoda älykkäitä agentteja kasvaa myös nopeasti iteraatioiden määrän myötä. Kolmannessa iteraatiossa metaagentti oppi moniajatteluketjustrategian yksinään, ja neljännessä iteraatiossa se oppi käyttämään dynaamista muistia vastausten optimointiin. 14. kertaan mennessä sen luoma agentti saavutti yllä mainitun monimutkaisuuden.

Loppujen lopuksi sen optimaalisen ratkaisun kykyä voidaan parantaa yli 250 % verrattuna alkuperäiseen yksinkertaiseen isokieliseen malliin, ja se paranee 75 % verrattuna parhaiten suoriutuneeseen manuaaliseen agenttiin COT-SC (multi-thought chain). vastaus) menetelmä.

ARC:n lisäksi ADAS-tilassa luodut agentit ovat kaikilta osin huomattavasti tehokkaampia kuin kaikki nykyiset vahvimmat käsin hierotut perusagentit, kuten COT, LLM Debate ja Self-Refine. Ja mitä monimutkaisempia tehtäviä ja verkkotunnusten välisiä sovelluksia käsitellään, sitä vahvempia ADASin luomat älykkäät agentit ovat.

Lisäksi näillä generoiduilla agenteilla on tiettyjä migraatiokykyjä. Esimerkiksi agentit, jotka voivat ratkaista tieteellisiä ongelmia, voivat saavuttaa hyviä tuloksia myös matematiikassa. Siksi optimaalinen viitekehys pystyy todennäköisesti ratkaisemaan liittyviä ongelmia monilla aloilla.

Vaikka käsiä hierovien agenttien aikakausi on päättymässä, agenttien paradigmojen löytämisen aikakausi saattaa jatkua. Kokonaistestissä ADAS ei löytänyt uusia rakennusmenetelmiä nykyisen älykkäiden agenttien rakentamisparadigman ulkopuolelta, vaan järjesti uudelleen ja käytti näitä menetelmiä.

Keskimääräiselle AI Agent -kehittäjälle tämä riittää kuitenkin korvaamaan työnsä.

ADAS:n suosio saattaa kuitenkin vielä ylittää esteen, ja se on kustannuskysymys.

Tutkijoiden mukaan OpenAI API maksaa noin 500 dollaria ARC:n etsinnästä ja arvioinnista ja noin 300 dollaria yhdestä ajosta päättelyn ja ongelmanratkaisun alalla. Se on noin 20 dollaria iteraatiota kohti. Näin korkeisiin kustannuksiin verrattuna työvoimalla on vielä tässä vaiheessa tiettyjä etuja.

Mutta tutkijat sanoivat myös, että koska he tutkivat sitä varhain, he käyttivät "gpt-3.5-turbo-0125" -mallia. Uusin GPT-4-malli "gpt-4o-mini" on alle kolmanneksen "gpt-3.5-turbo-0125":n hinnasta ja sen suorituskyky on parempi. Lisäksi kokeet osoittavat, että GPT 3.5 -ominaisuuksilla iteroitu agentti joutuu suorituskyvyn pullonkaulaan tietyn iteraatiomäärän jälkeen, ja kaikki iteraatiot neljäntoista kerran jälkeen ovat turhaa. Siksi suunnittelut, joissa on parempi arviointi ja resurssien hallinta, voivat myös vähentää kustannuksia merkittävästi.

On selvää, että työn hintaetua ei voida säilyttää pitkään.

Onko älykkyyden räjähdys todella alkanut?

Miksi tämä automatisoitu tekniikka on niin tärkeä?

Mobiili-Internetin aikakaudella kukoistavat erilaiset sovellukset eri kappaleille, jotka yhdessä luovat teknisen vaurauden aikakauden. Koska tuolloin uudet työkalut vaativat kuitenkin oppimista, myös mobiilisovellusten kehitys kävi läpi pitkän tunkeutumisvaiheen, ennen kuin tarpeeksi kehittäjiä saatiin vihdoin mukaan.

Aikaisemmin tämä oli hitaampaa. Geoffrey Mooren 1990-luvulla henkilökohtaisten tietokoneiden kokemukseen perustuvan "kuilun ylittämisen" teorian mukaan tekniikan ilmaantumisen alkuvuosina vain noin 13,5 % varhaisista käyttäjistä käytti tätä tekniikkaa. Tämä ei ole kehitystä vaan käyttöä .

Siksi kehittäjien pula voi olla tärkeä pullonkaula teknologian edistämisessä.

Tietysti älykkäiden agenttien rakentaminen ja tunkeutumisnopeus voivat olla paljon nopeampia. Koska se on paljon yksinkertaisempaa kuin edellinen ohjelmistokehitys. Esimerkiksi Wordware, joka tuli suosituksi jokin aika sitten, antaa tavallisille käyttäjille mahdollisuuden rakentaa älykkäitä agentteja luonnollisella kielellä, mikä alentaa kynnystä.

Suunnitelmat, kuten ajatteluketjut ja monivaiheiset silmukat, ovat kuitenkin edelleen hyvin monimutkaisia, ja prosessiin tarvitaan yhä enemmän työkaluja. Siksi ei ole monia ihmisiä, jotka voivat todella omistautua älykkäiden agenttien kehittämiseen ja hyödyntää tätä työkalua.

Zuckerberg sanoi kerran keskustelussa Huang Renxunin kanssa, että vaikka suuren mittakaavan mallitekniikka ei enää kehittyisi, kestää viisi vuotta ymmärtää täysin älykkäiden agenttien mahdollisuudet.

Siksi kehittäjät voivat teknologiaan verrattuna olla ydinpullon kaula älykkäille agenteille, jotka eivät ole vielä räjähtäneet. Vielä on liian vähän ihmisiä, jotka voivat tehdä tämän.

Agentteja on kuitenkin monia.

Jos tätä automaattisesti generoivaa viritysagenttitekniikkaa ottavat käyttöön ja optimoivat useammat kaupalliset yritykset, varhaisen teknisen henkilöstön pullonkaulaa ei luonnollisesti enää ole. Nopeus, jolla agentit voivat tutkia eri alojen valmiuksien kattavuutta ja syvyyttä, kasvaa huomattavasti.

Ehkä ensi vuonna julkaistaan ihmiskunnan historian ensimmäinen Killer AI -sovellus, jonka kirjoittaja on tekoäly.

uutiset