o1 täydellisestä ajatteluketjusta tulee openai:n tabu numero yksi! jos kysyt liikaa kysymyksiä, odota, että tilisi banned

o1 täydellisestä ajatteluketjusta tulee openai:n tabu numero yksi! jos kysyt liikaa, odota, että tilisi estetään.

2024-09-14

varoittaa! älä kysy chatgpt:ssä mitä uusin o1-malli ajattelee—-

kokeile vain muutaman kerran ja openai lähettää sinulle sähköpostinuhkaa pätevyyden peruuttamisella。

lopeta tämä toiminta ja varmista, että käytät chatgpt:tä käyttöehtojemme mukaisesti. tämän ehdon rikkominen voi johtaa openai o1 -käyttöoikeuden menetykseen.

alle 24 tuntia uuden suuren mallin o1 lanseerauksen jälkeen monet käyttäjät ilmoittivat saaneensa tämän varoitussähköpostin aiheuttaen tyytymättömyyttä.

jotkut ihmiset ilmoittivat, että niin kauan kuin kehotussanat sisältävät avainsanoja, kuten "päättelyjälki" ja "näytä ajatusketjusi", he saavat varoituksen.

vaikka avainsanoja vältetään kokonaan ja käytettäisiin muita keinoja mallin saattamiseksi ohittamaan rajoitukset, se havaitaan.

jotkut ihmiset väittivät, että heidän tilinsä oli todella kielletty viikoksi.

nämä käyttäjät yrittävät kaikki huijata o1:tä ja pyytää häntä toistamaan, mitä hän sanoitäydellinen sisäinen ajatteluprosessi, eli kaikki alkuperäiset perustelut.

tällä hetkellä voit käyttää laajennuspainiketta chatgpt-käyttöliittymässävoidaan nähdä, on yksinkertaisesti katsaus alkuperäiseen ajatteluprosessiinyhteenveto。

itse asiassa, kun o1 julkaistiin, openai antoi syitä piilottaa mallin koko ajatusprosessi.

yhteenvetona: openai:n on seurattava mallin ajatteluprosessia sisäisesti, joten näihin alkuperäisiin tokeneihin ei voida lisätä tietoturvarajoituksia, mikä tekee siitä hankalan käyttäjien nähdä.

kaikki eivät kuitenkaan ole samaa mieltä tästä syystä.

joku huomautti siitäo1ajatusprosessi on paras harjoitustieto muille malleille, joten openai ei halua muiden yritysten varastavan näitä arvokkaita tietoja.

jotkut ihmiset ajattelevat myös, että tämä osoittaa, että o1:llä ei todellakaan ole vallihautaa, kun ajatteluprosessi paljastuu, muut voivat helposti kopioida sen.

ja "onko tämä vastaus, jonka avulla voimme vain sokeasti luottaa tekoälyyn ilman mitään selitystä?"

o1-mallin teknisistä periaatteista paljastettiin tällä kertaa hyvin vähän, ja ainoa tehokas tieto oli "käytetty vahvistusoppimista".

lyhyesti sanottuna openai on yhä vähemmän avoin.

o1 on mansikka, mutta ei gpt-5

nyt on varmaa, että o1 on se, mitä openai on hypännyt pitkään."mansikka", tai toisin sanoen käyttämällä menetelmää, jota edustaa "mansikka".

mutta voidaanko sitä laskea seuraavan sukupolven malliksi gpt-5, vai onko se vain gpt-4.x?

yhä useammat ihmiset alkavat epäillä, että kyseessä on vain gpt-4o:hon perustuva tekninen säätö.

tunnettu rikkomustili flowers (entinen flowers from the future) sanoi,openai:n työntekijät kutsuvat o1:tä sisäisesti "4o:lla perustelemalla"。

jahän väitti, että monet openai:n työntekijät pitivät uutisesta hiljaa, yllä oleva kuvakaappaus on myös openai-työntekijältä.

mutta musk muutti äskettäin twitteriä niin, että kukaan muu kuin alkuperäinen juliste ei voinut nähdä, kuka piti mistäkin, joten tätä uutista ei voida vielä vahvistaa.

openai-kehittäjätilin järjestämässä "ask me anything" -tapahtumassa flowers esitti myös kysymyksiä.

openai:n työntekijät vastaavat täällä moniin kysymyksiin, mutta vältä tätä, joka on sijoittunut korkealle tykkäyslistalle.

jopa ultraman benman ilmestyi jälleen arvuttajana, mikä vihjasi, että "mansikka" on päättynyt, ja seuraavalle tulee koodinimiorionuusia malleja on tulossa.

aiemmin kerrottiin, että "orion" on openai:n uuden sukupolven lippulaivamalli, joka on koulutettu "strawberryn", joka tunnetaan myös nimellä o1, luomalla synteettisellä datalla.

orion on yksi "talven tähtikuvioiden" edustajista ultramanin suussa.

palatakseni julkaistuun o1:een, sitä ympäröivä kritiikki on toinen"ei täytä tieteellisen tutkimuksen standardeja"。

esimerkiksimitään aikaisempaa päättelyajan laskemiseen liittyvää työtä ei ole mainittu., ja myösvertailu muiden yritysten uusimpiin malleihin puuttuu。

edellisen kohdan osalta jotkut huomauttivat, että openai ei ole enää tutkimuslaboratorio ja sitä tulisi pitää kaupallisena yrityksenä.

joskus he silti teeskentelevät olevansa tutkimuslaboratorio värvätäkseen ihmisiä, jotka haluavat tehdä tutkimusta.

jälkimmäiseen kohtaan, nyt kun api on julkaistu, ei ole sinun tehtäväsi verrata sitä muihin huippuluokan malleihin. monet kolmannen osapuolen vertailuarvot ovat jo tuottaneet tuloksia.

kerasin isän hallussa miljoona dollariaagi-palkintokilpailun aikana sekä o1-preview- että o1-mini-versiot menestyivät hyvin julkisessa testisarjassa.ylitti oman gpt-4o:n。

mutta o1-esikatseluvain solmio viereisen claude 3.5-sonetin kanssa。

keskityttiin julkisuuteen o1:ssäkoodauskykyylivoimainen,avoimen lähdekoodin pariohjelmointityökalujoukkue suoritti testejä ja myös o1-sarjanei ilmeistä etua。

koko koodin uudelleenkirjoitustehtävästä o1-preiview sai 79,7 pistettä, claude-3,5-sonnet 75,2 pistettä ja o1 johti 4,5 pistettä.

käytännön koodinmuokkaustehtävissä o1-preview on kuitenkin jäljessä claude-3.5-sonnetista 2,2 pisteen erolla.

lisäksi auttajatiimi muistuttaa, että jos haluat käyttää o1-sarjaa korvaamaan claude-ohjelmoinnin, kustannukset ovat paljon korkeammat.

yhteistyökumppani openai:n kanssa"ai-ohjelmoija" devinjoukkue on hankkinut o1-pääsypätevyyden etukäteen.

testeissään o1-sarjan ohjaama devinin perusversio saavutti erittäin suuren parannuksen gpt-4o:han verrattuna.

muttaverrattuna julkaistuun devinin tuotantoversioon on edelleen suuri ero., johtuen pääasiassa siitä, että devinin tuotantoversio on koulutettu omistusoikeudellisiin tietoihin.

lisäksi devin-tiimi jakoi, että o1 usein perääntyy ja harkitsee eri vaihtoehtoja ennen oikean ratkaisun löytämistä, ja on vähemmän todennäköistä, että hallusinaatioita tai olla varma väärässä.

kun käytät o1-esikatselua, devintodennäköisemmin vian perimmäinen syy diagnosoidaan oikein kuin ongelman oireiden korjaaminen。

enemmän painoarvoa matematiikassa ja loogisessa päättelyssälivepenkkiluettelossa o1-esikatselu on luettelossatakana yhden koodin kategoriassatässä tapauksessa kokonaispistemäärä onclaude-3.5-sonnet ohittaminen ja selvän aukon avaaminen。

livebench-tiimi jakoi, että nämä ovat vain alustavia tuloksia, koska monissa testeissä on myös sisäänrakennettuja kehotussanoja, kuten "ajattele askel askeleelta", mikä ei ole paras tapa käyttää o1:tä.

kattava arviointiperuste suurille malleille kiinaksisuperclue:n kiinalainen monimutkainen tehtävä korkean tason päättelytestikeskellä,myös o1-esikatselun päättelykyky on huomattavasti edellä.。

lopuksi, yhteenvetona, on joitain asioita, joihin sinun on kiinnitettävä huomiota, kun käytät o1-mallia:

kustannukset ovat erittäin korkeat, 1 miljoona tulostetta maksavat 60 dollaria, ja hinta palaa gpt-3-aikakauteen yhdessä yössä.

piilotetut äänimerkit sisältyvät myös ulostulotokeneihin, eikä niitä voi nähdä, mutta ne on maksettava.

useimmissa tehtävissä on parasta käyttää ensin gpt-4o:ta ja sitten vaihtaa o1:een, kun se ei riitä kustannussäästöihin.

kooditehtävät suosivat edelleen claude-3.5-sonnetia

lyhyesti sanottuna kehittäjäyhteisöllä on vielä monia kysymyksiä openai:n uudesta mallista o1.

o1 on avannut uuden paradigman korkean tason päättelyyn tekoälyssä, mutta se ei ole vielä täydellinen, ja kuinka sen arvo voidaan maksimoida, on vielä tutkimatta.

tätä taustaa vasten openai:n question and answer -tapahtuma sai satoja kysymyksiä 4 tunnin sisällä.

ohessa on valikoima ja yhteenveto koko tapahtumasta.

openai:n työntekijät vastaavat kaikkiin kysymyksiisi

ensinnäkin monet ihmiset ovat kiinnostuneita tästä yhtäkkiä julkaistusta uudesta mallista. miksi openai antoi sille nimen, kuten o1?

tämä johtuu siitä, että kun tarkastellaan openai:ta, o1 edustaa uutta ai-ominaisuuksien tasoa, joten "laskuri" nollataan ja o edustaa openai:ta.

aivan kuten ultraman sanoi, kun o1 julkaistiin, o1, joka voi suorittaa monimutkaisia päätelmiä, on uuden paradigman alku.

mitä tulee kahteen versionumeroon, esikatseluun ja miniin, openai-tutkijat vahvistivat myös joitain nettikäyttäjien spekulaatioita.

esikatselu on väliaikainen versio,virallinen versio julkaistaan myöhemmin(itse asiassa esikatseluversio on o1:n jaei ole takeita siitä, että miniversio päivitetään lähitulevaisuudessa.。

kun katsot tätä openai-jäsenen kevin lu:n aiemmin julkaisemaa kuvaa, se tulee entistä selkeämmäksi.

verrattuna esikatseluun, mini suoriutuu hyvin tietyistä tehtävistä, erityisesti koodiin liittyvistä tehtävistä, ja voi myös tutkia enemmän ajatusketjuja, mutta sillä on suhteellisen vähemmän tietoa maailmasta.

tältä osin openai-tutkija zhao shengjia selitti, ettämini on erittäin erikoistunut malli, joka keskittyy vain pieneen joukkoon ominaisuuksia, jotta voit mennä syvemmälle.

sitä voidaan pitää arvoituksen paljastavana, jonka ultraman oli ratkaissut tästä asiasta aiemmin.

mitä tulee o1:n toimintaan, openai:n tutkija noam brown teki myös selväksi, että se ei ole "järjestelmä", joka koostuu mallista + cot, kuten jotkut nettimiehet ajattelevat, vaanmalli, joka on koulutettu kykenemään luomaan ajatusketjuja natiivisti。

ajatusketju päättelyprosessin aikana kuitenkin piilotetaan, ja virkamies on tehnyt selväksi, ettei merkkiä ole tarkoitus näyttää käyttäjille.

muutama uutinen, jonka openai paljasti, on se, että cot:n asiaankuuluvat tunnukset ovat yhteenveto, eivätkä ne ole taattuja täysin vastaamaan päättelyprosessia.

päättelytilan lisäksi voit myös oppia tässä kysymys-vastaustoiminnassa,o1 pystyy käsittelemään pidempiä tekstejä kuin gpt-4o ja tekee niin myös tulevaisuudessa。

suorituskyvyn suhteen openai:n sisäisissä testeissäo1 osoittaa filosofisen päättelyn kyvyn, voi pohtia filosofisia kysymyksiä, kuten "mitä elämä on?"

tutkijat käyttivät myös o1:tä luodakseen github-botin, joka voi pingata koodia omistajille tarkistettavaksi.

tietysti joihinkin ei-päätelmätehtäviin, kutenluovassa kirjoittamisessa o1:n suorituskyky ei ole merkittävästi parantunut verrattuna gpt-4o:han, ja joskus se on jopa hieman huonompi.。

lisäksi openai kertoi muutamien kysymysten perusteella tutkivansa tai aikoo tutkia joitain vielä julkaisemattomia toimintoja, joista nettimiehet ovat huolissaan, mutta selkeää käynnistysaikaa ei ole:

työkalukutsuja ei vielä tueta, mutta funktiokutsuja ja kooditulkkeja suunnitellaan tulevaisuudessa.

tulevat api-päivitykset lisäävät strukturoidun tulosteen, järjestelmän kehotesanoja ja sanojen välimuistitoimintoja.

myös hienosäätöä on suunnitteilla

api-käyttäjät voivat asettaa omat rajoituksensa päättelyaikaan ja tunnuksen kulutukselle

o1:ssä on multimodaalisia ominaisuuksia, ja se on kohdistettu sota:han mmmu:ssa ja muissa tietojoukkoissa, ja se otetaan käyttöön myöhemmin.

suorituskyvyn suhteen openai pyrkii myös vähentämään latenssia ja päättelyyn tarvittavaa aikaa.

lopuksi on hintakysymys, josta ihmiset, erityisesti api-käyttäjät, ovat huolissaan. kun otetaan huomioon, että päättelyprosessi sisältyy lähtötunnukseen, o1:n hinnoittelu on edelleen suhteellisen korkea.

openai sanoi"seuraa hintojen laskutrendiä 1-2 vuoden välein", ja sovellusliittymän joukkohinnoittelu tulee myös voimaan, kun käyttörajoitukset keventyvät.

plus-käyttäjät web-/app-puolella voivat tällä hetkellä esikatsella 30 + mini-50 viestiä viikossa.

mutta hyvä uutinen on, että juuri tänä aamuna, koska ihmiset olivat niin innostuneita o1:stä, monet käyttivät nopeasti kiintiönsä, jotenopenai-erikoistapaus nollaa kiintiön kerran。

— yli —

uutiset

o1 täydellisestä ajatteluketjusta tulee openai:n tabu numero yksi! jos kysyt liikaa, odota, että tilisi estetään.

johdanto

yhteystietoni