uutiset

"ohjelmointi ammatiksi päättyy tänään", pelottaa openai:n uusi malli o1

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

kirjoittaja: fanfan, toimittaja: odette, otsikkokuva: ai-sukupolvi

muistatko vielä openai:n korkean maanjäristyksen aiemmin?

se, mikä laukaisi sam altmanin erottamisen, perustajajäsen greg brockmanin eron ja openai:n sisäisten konfliktien pahenemisen, oli projekti nimeltä q* (lausutaan q-star).

asiaan perehtyneiden mukaan q*-projekti oli tuolloin edistynyt merkittävästi ja pystyi jo ratkaisemaan matemaattisia perusongelmia. toisin kuin laskimet, jotka voivat ratkaista vain rajoitetun määrän operaatioita, ja gpt-4, joka antaa eri vastaukset samaan kysymykseen joka kerta,q*:lla saattaa jo olla kyky yleistää, oppia ja ymmärtää, mikä on keskeinen askel kohti agi:tä.openai-tutkijat lähettivät hallitukselle kirjeen, jossa varoittivat, että q*:n suuri löytö voi uhata koko ihmiskuntaa, mutta sam altman salasi tämän.

openai on kokenut maanjäristäviä sisäisiä muutoksia, eikä openai itse ole koskaan reagoinut suoraan q*:n olemassaoloon.

tänään openai julkaisi yhtäkkiä uuden mallin, joka on edelleen esikatseluversio. se on legendaarinen q*, myöhemmin koodinimeltään "strawberry" ja nyt openai o1-preview.

uusi päättelymalli monimutkaisten ongelmien ratkaisemiseen, joka ei ole enää sama sarja kuin chatgpt|openai

o, edelleen "omini", kaiken kattava o, mutta openai:n mukaan tämä malli "edustaa tekoälyn uutta huippua" ja eroaa työmenetelmiltään suuresti edellisestä suuresta mallista, joten uusi malli voidaan perustaa erikseen sarja , lasketaan yhdestä (gpt5: olen vanha!).

mitä tulee siihen, "uhkaako tämä malli ihmiskuntaa", kuten ilja sutskever ja muut kapinalliset openai:n entiset ydintutkijat arvioivat, työntäen ihmiskunnan agi:n (artificial general intelligence) aikakauteen ilman täydellisiä moraalisia rajoituksia, voit lukea artikkelin arvioi sitten itse.

o1, ylittää kaiken

ensimmäinen on tuttu pisteytyslinkki.

jokainen suurten mallien sukupolvi tulee ulos ja saavuttaa ennennäkemättömät uudet korkeudet, mutta tällä kertaa o1 on täysin erilainen.

suurin osa tällä hetkellä suosituista isoista malleista on chatbottien muotoisia, joiden ajattelupolkuja on vaikea selittää ja joiden kehityssuunta on multimodaalinen (osoittaa puhua, nähdä ja kuunnella) ja muuttuu sävyltään yhä ihmismäisemmiksi. ja reaktiot. o1 on erilainen kuin he.

ensinnäkin sen tavoitteena ei ole saada nopeammin ja nopeammin tai edes hitaammaksi ja hitaammaksi.

openai-tutkija noam brown sanoi, että tällä hetkellä o1 voi antaa vastaukset muutamassa sekunnissa, mutta tulevaisuudessa sen on kyettävä ajattelemaan tunteja, päiviä tai jopa viikkoja. sitten liitettiin kuva, jossa o1 diagnosoi tapauksen yli kymmenen sekunnin pohdinnan jälkeen. mitä noam brown tarkoitti,pitkä päättelyaika tarkoittaa, että malli voi rakentaa pidempiä ajatteluketjuja ja johtaa syvempää ajattelua.

toiseksi o1 murtaa aikaisempien suurten kielimallien, matematiikan, akilleen kantapään.

aime, american mathematics invitational examination, on yksinkertaisempi kuin olympialainen ja paljon vaikeampi kuin sat. sitä käytetään yleensä parhaiden matematiikan lukiolaisten valitsemiseen. kun gpt4-o:ta pyydettiin kirjoittamaan kutsukilpailun kysymyksiä, hän sai vain 12 pistettä, mutta o1 vastasi kysymyksiin yhdellä kertaa ja sai 74 pistettä. jos otat 1 000 näytettä ja järjestät sitten 1 000 näytettä uudelleen pisteytystoiminnolla (tämä heijastaa paremmin mallin odotettua tasoa), o1 sai 93 pistettä ja voi olla yhdysvaltojen 500 parhaan joukossa, ja se voidaan valita amerikkalaisten ehdokkaaksi. matemaattinen olympialainen.

o1:n ja gpt-4o:n suorituskykyä verrattaessa matemaattinen edistys on erittäin suuri|openai

anna o1:n kirjoittaa kysymyksiä vuoden 2024 kansainväliseen tietotekniikan olympiadiin (ioi). se sai 213 pistettä 10 tunnissa, ja jokainen kysymys voitiin lähettää jopa 50 kertaa, mikä sijoittui ihmispelaajien parhaan 49 prosentin joukkoon.jos lähetysten määrä nostetaan 10 000:een, o1 voi saada 362,14 pistettä ja ioi:n kultamitalin ja tulla suositukseksi tsinghuan yliopistoon.

varsinaisessa testissä käytettiin o1:n hienosäädettyä versiota, ei sitä tulevaisuuteen katsovaa versiota, jota voimme käyttää |

lisäksi on monia testejä, joita ei ole saatavilla. esimerkiksi gpqa:ssa (älykkyystestissä, joka yhdistää fysiikan, kemian ja biologian) o1 ohitti tohtorintutkinnot vastaavilla aloilla joissakin kysymyksissä.

lyhyesti sanottuna,involuutio jo ennestään vahvalla alalla ei ole enää pitkään aikaan ollut o1:n tarkoitus. se on läpimurto monimutkaisessa logiikassa, johon suuret kielimallit eivät ole hyviä.

yksi askel taaksepäin, kaksi askelta eteenpäin

kuten edellä mainittiin, o1:n reaktionopeus on hidastunut.

se vie enemmän aikaa ajatella ennen reagoimista, sitten tarkentaa ajatteluprosessia, kokeilee erilaisia ​​strategioita ja oppii virheistään. tämä on pelottavaa.

lisäksi o1 ei ole nyt monimuotoinen malli, jonka avulla suuri malli pystyy näkemään ja kuulemaan. nyt se on palannut alkuperäiseen luonteeseensa.

hitaampi ja yksitoikkoinen, o1:lle,se on yksi askel taaksepäin ja kaksi askelta eteenpäin. ihmiset, jotka ovat jo käyttäneet o1:tä, sanovat, että o1 on älykkäin malli, jota he ovat koskaan käyttäneet, ja keskustelut sen kanssa ovat menneet pidemmälle kuin aiemmat pikkutaistelut.

yhdessä testissä käyttäjä esitti o1:lle loogisen paradoksikysymyksen: "kuinka monta sanaa on vastauksessa tähän kysymykseen?"

o1 ajatteli kymmenen sekuntia ja näytti ajatteluprosessinsa. ensinnäkin se luuli, että tämä on itseviittausparadoksi tai rekursiivinen kysymys kun vastausta ei ole määritetty, vastauksen sanojen määrää ei voida määrittää."tarpeettomien ilmaisujen välttäminen on tärkeää selkeiden ja ytimekkäiden vastausten kannalta". seuraava askel on laskea sanat, jolloin lauseessa esiintyvien numeroiden on vastattava lauseen sanojen määrää. sitten se listasi monia lauseita ja löysi sopivimman hakuvaihtoehdon. se havaitsi, että "tässä on viisi sanaa" on viisi sanaa, joten kun lauserakenne on muutettu täydelliseksi vastaukseksi, viisi tulisi korvata seitsemällä.

joten se vastasi: "vastauksessa on seitsemän sanaa."

tämä päättelyprosessi ei juurikaan eroa minun päättelyprosessistani|x

toisessa esimerkissä o1 kesti 5,6 sekuntia ja 631 merkkiä vastatakseen yksinkertaiseen kysymykseen "kuinka monta r-kirjainta mansikkassa on?"

yllä olevasta esimerkistä voidaan nähdä, ettäo1:n työskentelytapa eroaa olennaisesti chatgpt:stä.nyt o1 on lisännyt perustelut, jotka jakavat kysymyksen useisiin vaiheisiin, ajattelevat niitä erikseen ja poistavat sitten perustelut vastausten luomiseksi.

alla olevasta kuvasta näkyy ideaketjun toiminta, mikä selittää myös miksi o1:n vastenopeus on hidastunut.

kun käytät o1:tä, voit yhtä hyvin käyttää klassisia logiikkatehtäviä ja matemaattisia tehtäviä testataksesi sen kykyä.

ehkä yksinkertaisiin kysymyksiin vastattaessa ero useiden päättelykierrosten välillä ei ole ilmeinen, mutta jos sitä käytetään monimutkaisten ongelmien ratkaisemiseen koodin kirjoittamisessa, matemaattisten tehtävien tekemisessä ja tieteessä, tällainen ajattelukyky on välttämätön.

openai sanoi lehdessä, että nyt lääkintähenkilöstö voi käyttää o1:tä solusekvensointitietojen merkitsemiseen, fyysikot voivat käyttää o1:tä kvanttioptiikassa vaadittavien monimutkaisten matemaattisten kaavojen luomiseen ja eri alojen kehittäjät voivat käyttää o1:tä monivaiheisen työn rakentamiseen ja suorittamiseen. .

mitä muuta,tämä on ajattelutavan prototyyppi ja viisauden varhainen muoto.

uudet mallit, uudet tavat

koska o1 toimii eri tavalla kuin chatgpt, aiemmin näkemäni opetusohjelmat, joissa kehotteiden kirjoittaminen opetetaan, eivät ole enää käyttökelpoisia - nykyisessä tilanteessa liian monet kuvaukset kuluttavat vain suuren määrän tunnuksia, mutta eivät välttämättä hanki niitä. parempia tuloksia.

jotta tämä olisi selvää kaikille käyttäjille, openai on kirjoittanut uudet merkkiohjeet. o tässä muutamia virallisia suosituksia:

kehotteiden tulee olla yksinkertaisia ​​ja suoria. mallit vastaavat parhaiten lyhyisiin, selkeisiin ohjeisiin, jotka eivät vaadi liikaa ohjausta.

vältä ajatusketjuja kehotteissa. o1 tekee oman sisäisen päättelynsä, joten sen ohjaaminen askel askeleelta ja ajattelupolun selittäminen on turhaa.

on parempi käyttää erottimia selkeyden parantamiseksi. käytä erottimia, kuten "", <> ja § erottaaksesi kehotteiden eri osat selkeästi, mikä auttaa mallia käsittelemään ongelmia erissä.

rajoita lisäkontekstin hakua tehostetussa sukupolvessa. anna vain tärkeimmät tiedot välttääksesi mallin liioittelua.

kun näin kolmannen artikkelin, tämä muoto tuntui hieman tutulta. tulevat ohjelmoijat käyttävät todennäköisesti luonnollisen kielen ohjelmointia. perusohjeet ovat edelleen samat, mutta niistä on tullut kansankielisiä. uusimpien ohjeiden mukaan hyvä kehote näyttää tältä:

tai jotain tämän kaltaista:

§ isäntä § kirjoittaja § baarin omistaja § öljymaalari § nahkatyöläinen § hopeaseppä § laulaja § tamburiinitaiteilija § reppumatkaaja § kultainen vasen poski § ranskalainen ritari § zen-oppilas §

anna mallin hoitaa loput.

anna minulle hetki aikaa tehdä 3d-käärme

on syytä käyttää käärmettä esimerkkinä. alle päivä o1:n julkaisun jälkeen ihmiset ovat tehneet monia yrityksiä sen kanssa, mukaan lukien 3d snake.

@ammaar reshi x:ssä käytti erittäin yksinkertaisia ​​kehotteita kirjoittaakseen 3d-käärmeen vain minuutissa, ja o1 opetti hänelle myös koodin käytön.

oletko oppinut kirjoittamaan kehotteita? |@ammaar reshi

vaikka vaikutus on hieman karkea, kukaan ei voi sanoa, että se ei ole ahne käärme.

ja se on aika hauskaa|@ammaar reshi

netizen @james wade käytti o1:tä data-analyysisovelluksen tekemiseen, joka voi näyttää lyhyen kuvauksen ja esimerkin jokaisesta jakelusta. se kesti vain 15 minuuttia, mukaan lukien käyttöönottoaika. hän sanoi: en ole koskaan aiemmin ajatellut tehdä jotain tällaista. se oli liian hankalaa.

vaikutus on kuvan mukainen|@james wade

toinen täyden pinon insinööri @dallas lones, joka on työskennellyt 16 vuotta, sanoi liikuttuneena tehtyään react nativen täyden pinon kehityssovelluksen muutamassa minuutissa,en aloittanut yritystä niin pian kuin mahdollista, mutta nyt tästä käsityöstä on tullut ajan kyyneleitä.hän sanoi,"ohjelmointi ammatiksi päättyy virallisesti tänään."

on enemmän ihmisiä, jotka haastavat o1:n rajat, ja jotkut pelaavat sitä jo"katsotaan, kenen kysymys on vaikeampi ja saa o1:n ajattelemaan pisimpään."peli.

tällä hetkellä o1 on avoinna ensin chatgpt plus- ja team-käyttäjille, kun taas api-pääsy avataan ensin tason 5 käyttäjille, jotka käyttävät yli 1 000 dollaria openai-sovellusliittymään. seuraavassa vaiheessa openai avaa asteittain o1-minin matalaprofiilisen version ilmaisille käyttäjille.

onko tämä ihmiskunnan auringonlasku?