uutiset

Tehokkain tekoälyohjelmoija menettää työnsä: hän käy koodin läpi 84 sekunnissa ja ajattelee kuin ihminen! Joukkueessa on vain 5 henkilöä

2024-08-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jin Lein länsituuli on peräisin Aofein temppelistä
Qubits |. Julkinen tili QbitAI

Devinin jälkeen toinenAI-ohjelmistosuunnittelijaNäyttöä pyyhkäistiin...

sitä kutsutaanGenie, joka tunnetaan nimellä virtaPinnalla vahvin, osaa jo ajatella ja toimia kuin ihmiset!



Joten kuinka vahva tämä "vahvin pinnalla" on?

Katsotaanpa ensinTarkista pisteet

Arvovaltaisessa listassa SWE-Bench, Genie ratkaisi30.07%Kysymys oli listan kärjessä.

(SWE-Bench on benchmark, jota käytetään arvioimaan suuria malleja todellisten ohjelmistoongelmien ratkaisemiseksi.)

Tämän tuloksen voidaan sanoa olevan kaukana toisesta sijasta 19,27 %, mikä avaa lukituksenSuurin lisäys SOTA-parannuksessa - 57%!



Mitä tulee GenienTodellinen vaikutusjoukkueen sanoin:

Se voi ratkaista tosielämän ohjelmistoongelmia aivan kuten insinöörit.

Ensinnäkin voit käyttää Genien käynnistämiseen neljää tapaa, nimittäin kehotussanoja, GitHub-ongelmaa, Lineaarista lippua tai API:ta.



GitHub-ongelmien ratkaiseminen esimerkkinä, syötä ensin Genielle linkki repoon, niin se alkaaRatkaise ongelmat automaattisestiSain:



Genie ClubAutomaattinen iteratiivinen ajatteluJos se haluaa ratkaista tämän ongelman, mitä tiedostoja se tarvitsee, kunnes se tuntee löytäneensä sellaisen, johon se on tyytyväinen:



Välittömästi sen jälkeen se tekee aAutomaattinen iteratiivinen analyysiProsessi:



Sitten Genie alkoi "supista, swish, swish"Kirjoita + suorita koodi automaattisestiSain:





Jos koodia suoritettaessa ilmenee virhe, Genie keskittyy vain ongelma-alueeseen ja toistaa analysoinnin, koodin kirjoittamisen ja sen suorittamisen, kunnes se käy läpi.

Koko prosessi vie vain aikaa84 sekuntia



Joukkueen sanoin:

Genie on katsonut ja oppinut siitä, kuinka ohjelmoijat ratkaisevat ohjelmistoongelmia miljoonia kertoja.
Tämä on luku, jota kukaan ohjelmoija ei voi saavuttaa elämänsä aikana.



Mutta vielä odottamattomampaa on Genien takana oleva tiimi...Cosinus, vain 5 henkilöä

Ja toimitusjohtaja Alistair lähetti myös viestin kiittäen OpenAI:ta:

Emme voisi tehdä Genietä ilman sinua.



Joten miten Cosinen tiimi rakensi Genien?

Kuinka tulla vahvimmaksi tekoälyinsinööriksi?

Genien pääominaisuus on sen kyky jäljitellä ihmisinsinöörien kognitiivisia prosesseja, logiikkaa ja työnkulkua.

Tätä varten Genie-tiimi paljasti keränneensä tietojoukon, joka sisältää todellisten ihmisohjelmoijien kehitystoiminnan viimeisen vuoden aikana.

Se ei vain käytä tulosanalyysiä, staattista analyysiä, itsepelaamista, vaiheittaista varmennusta ja muita menetelmiä, vaan käyttää myös tekoälymalleja, jotka on koulutettu suuren määrän merkittyjen tietojen perusteella. Hyöty on, että kun taustalla olevien mallien ominaisuudet paranevat, myös niiden poimien tietojen laatu paranee.

Lopulta GenieKäytä näitä omistusoikeudellisia tietoja harjoitteluun

Koko ihmisen päättelyprosessi on koodattu tietojoukkoon, mukaan lukien täydellinen tiedon jäljitys, inkrementaalinen tiedonhaku ja vaiheittainen päätöksentekoprosessi, joka perustuu ohjelmistosuunnittelijoiden todellisiin työtapauksiin.

Genien päättelyprosessi sisältääSuunnittelu, haku, koodin kirjoittaminen ja koodin suoritusNeljä päävaihetta rikkovat muiden tekoälyinsinöörien rajoitukset, jotka luottavat lisätyökalujen, kuten verkkoselaimien ja kooditulkkien, lisäämiseen perusmallin päälle ja voivat käsitellä erilaisia, erittäin tilannekohtaisia ​​ja ennennäkemättömiä ongelmia, kuten ihmisten.



Tämä koulutustapa sai nettiläiset heti miettimään samanlaisia ​​ajatuksia, joita Karpathy oli aiemmin esittänyt:

LLM:lle ihanteellinen harjoitustieto ei ole itse kirjoittamasi sisältö, vaan täydellinen ajatteluprosessisi ja jokainen muokkaustoiminto kirjoitusprosessin aikana. Voimme kuitenkin tehdä parhaamme vain niillä resursseilla, jotka meillä on.



Lisäksi Genie koulutus esittelee myösitsensä kehittämismekanismi

Alkuharjoitteludata on enimmäkseen virheetöntä koodia, joka voi toimia normaalisti, mikä tekee Genien vaikeasta käsitellä virhetilanteita. Tämän ongelman ratkaisemiseksi tiimi käytti Genien ensimmäistä versiota synteettisten virheiden sisältävien tietojen luomiseen ja käytti näitä tietoja mallin seuraavan version kouluttamiseen.

Tarkemmin sanottuna Genien vanhaa versiota käytetään ratkaisun ehdottamiseen, ja jos ratkaisu on väärä, tehtävän masteroitua lopullista tilaa opetetaan saavuttamaan oikea tila nykyisestä tilasta.

Toistamalla tätä prosessia Genien ehdottama alkuperäinen ratkaisu tarkentuu vähitellen ja antaa useimmissa tapauksissa suoraan oikean vastauksen, ja vaikka se tekisi virheen, se vaatii vain vähemmän korjauksia tietojoukossa.



Toinen avain Genien ominaisuuksien parantamiseen on OpenAI:n tarjoama laaja mallituki.

Ryhmä totesi, että kun he kehittivät Genien ensimmäisen kerran, he pystyivät käyttämään vain lyhyitä kontekstimalleja 16-32k hienosäätöä varten. He käyttivät näitä malleja paljon varhaisessa kehityksessä ja käyttivät yli 100 miljoonaa merkkidataa mallit Vaikka he havaitsivat, että suunnitellulla arkkitehtuurilla oli tiettyjä etuja, mutta niitä rajoittaa olennaisesti tiedon määrä, jonka malli pystyy käsittelemään tietyssä ajassa.

Erilaisten pakkaus-/palautusmenetelmien kokeilun jälkeen ainoa ratkaisu oli käyttää mallia, jolla on laajempi konteksti.

OpenAI tarjoaa pitkän kontekstin mallituen, ja Genien uusin versio on koulutettu miljardeihin tunnuksiin.

Tiimi uskoo, että hyperparametrien säätöön ja datamäärään verrattuna tiedon laatu on avainasemassa. Siksi he tekivät myös paljon kokeita tietojen sekoittamisesta, mukaan lukien useita ulottuvuuksia, kuten kieli, tehtävätyyppi, tehtävän pituus jne. Seuraava on Genien kouluttamiseen käytetyn eri ohjelmointikielidatan osuus:



Myös erityyppisten esiintymien dataosuudet ovat olemassa:



Vain 5 hengen joukkue

Kuten edellä mainittiin, Cosinen start-up-tiimissä on tällä hetkellä vain 5 henkilöä.

Virallisen verkkosivuston johdannossa he myös kuvaavat itseään hyvin suoraan seuraavasti:

Pieni mutta voimakas.
Pieni mutta voimakas.



Esittelystä päätellen osa jäsenistä on yksisarvisyrityksistä, osalla on kokemusta globaalien tiimien johtamisesta ja osa on jopa aloittanut ohjelmoinnin 8-vuotiaasta lähtien.

Mutta kun Cosine perustettiin, heidän tavoitteenaan oli vain kolmeYmmärrä inhimillinen päättely



On syytä mainita, että yksi joukkueen jäsenistä on kiinalainen.Yang Li, on Cosinen perustaja ja listattiin Forbes-listalla 30 alle 30 vuonna 2021.



Lisäksi toimitusjohtaja Alistair sanoi Genien itsestään:

Aloitimme Genien visioimisen jo vuonna 2022, mutta se ei ollut tuolloin teknisesti mahdollista.
Genie tuli todeksi vasta viimeisen kuuden kuukauden aikana, kun suuri malli vähitellen kypsyi.



No, minun on sanottava, että iso malli on antanut jälleen suuren panoksen.

Genie voi tällä hetkellä hakea jonotuslistalle Kiinnostuneet ystävät voivat klikata artikkelin lopussa olevaa linkkiä

Odotuslistan osoite:
https://cosine.sh/register

Viitelinkit:
[1]https://x.com/alistairpullen/status/1822981361608888619?s=46
[2]https://cosine.sh/blog/genie-technical-report
[3]https://cosine.sh/blog/state-of-the-art
[4]https://x.com/AlistairPullen/status/1823030874579120223
[5]https://x.com/yangli_