2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
kirjailija| sukhoi
toimittaja | wang bo
koska johtajat lähtevät ja apple vetäytyy rahoitusneuvotteluista, tämä on epäilemättä myrskyinen viikko openai:lle. mutta openai vaatii edelleen vakuuttamaan kehittäjät rakentamaan sovelluksia käyttämällä tekoälymalleja.
1. lokakuuta paikallista aikaa yhdysvalloissa openai järjesti devdayn san franciscossa. toisin kuin viime vuoden suuri tapahtuma, tämän vuoden tapahtuma oli hillitty ja siitä tuli kehittäjien roadshow.
tällä kertaa openai ei lanseeraa suurta tuotetta, vaan työskentelee sen sijaan olemassa olevien parissaaityökaluja jaapisarjaa on parannettu asteittain.
he ilmoittivat neljästä innovaatiosta:näön hienosäätö, reaaliaikainenapi(realtime api), mallin tislaus ja välimuisti.
esimerkiksi reaaliaikaisen api:n julkinen beta-versio antaa kehittäjille mahdollisuuden luoda sovelluksia, jotka voivat luoda nopeasti tekoälyäänivastauksia. tämä uusi tekniikka ei vain reagoi nopeasti, vaan se tarjoaa myös kuusi erilaista äänivaihtoehtoa. äänet ovat kaikki openai:n kehittämiä, jotta vältetään kolmansien osapuolien tekijänoikeusongelmat. tämä api ei "kopioi" chatgpt:n edistynyttä äänitilaa, mutta toiminnallisuus on periaatteessa samanlainen.
romain huet, openai:n kehittäjäkokemusjohtaja, osoitti myös kuinka o1:n avulla rakennetaan iphone ios -sovellus kehotteen avulla noin 30 sekunnissa.
yute esittelee iphone ios -sovellusten rakentamista. kuvan luotto: romain huetin x
kahden viime vuoden aikana openai on alentanut kehittäjien api-käyttökustannuksia 99 % vastauksena kilpailijoiden, kuten metan ja googlen, aiheuttamaan markkinapaineeseen. ja uuden työkalun kontekstista voimme selvittää,openai:n strategia suosii kehittäjäekosysteemin vahvistamista sen sijaan, että kilpailisi suoraan loppukäyttäjien sovelluksista.
ennen tapahtumaa openai:n tuotejohtaja kevin weil mainitsi, että teknologiajohtaja mira murati ja tutkimusjohtaja bob mcgrew'sirtisanoutuminen ei vaikuta yhtiön pitkän aikavälin kehitykseen.hän sanoi, että huolimatta "säännöllisistä henkilövaihdoksista" openai voi silti "säilyttää kehitysvauhtia".
kun googlen ja applen kaltaiset teknologiaryhmät kilpailevat niin sanottujen tekoälyagenttien tuomisesta kuluttajille,openai ajatteleeaiassistant siirtyy valtavirtaan ensi vuonna.tekoälyassistenttien kyvyistä, mukaan lukien päättely ja monimutkaisten tehtävien suorittaminen, on tullut uusin taistelukenttä teknologiayrityksille, joista jokainen toivoo pääsevänsä hyödyntämään tätä nopeasti kehittyvää teknologiaa kehittääkseen tulovirtoja.
"toivotaan, että tekoälyn vuorovaikutusmenetelmät voivat kattaa kaikki tavat, joilla ihmiset ovat vuorovaikutuksessa." siinä olevat menetelmät, olipa kyseessä sanallinen kommunikaatio, tunneilmaisu tai ei-verbaalinen viestintä jne., tekevät ihmisten ja tekoälyn välisestä vuorovaikutuksesta mahdollisimman luonnollisen ja saumattoman.
openai:n lisäksi muut yritykset, kuten microsoft, salesforce ja workday, asettavat agenttiominaisuudet tekoälysuunnitelmiensa ytimeen, kun taas google ja meta ovat myös todenneet, että tekoälymallien integrointi tuotteisiinsa on niille keskeinen painopistealue.
viime vuonna openai julkaisi "assistant api" -sovelluksen, jonka avulla kehittäjät voivat rakentaa agentteja sen teknologian avulla. mutta he paljastivat myös, että varhaisten mallien rajoitettu toiminnallisuus haittasi suunnitelmia.
weill mainitsi, että openai:n uusimpien mallien tuomat parannukset ajattelussa ja päättelyssä näkyvät sen tuotteissa, kuten chatgpt:ssä, sekä startupeissa ja kehittäjissä, jotka rakentavat sovelluksia sen api:lla, mutta ei kertonut, kehittävätkö he välittömästi omia. ai agentti.
openai esitteli suoraa keskustelua tekoälyjärjestelmän kanssa, jonka tehtävänä oli auttaa löytämään ja ostamaan paikallisesti saatavilla olevia tuotteita. jos esimerkiksi ostat mansikoita, tekoäly soittaa kauppiaalle tilauksen tekemiseksi käyttäjän ohjeiden mukaan.
esittely tekoälyn ostamisesta mansikoita kehotteiden perusteella. kuvan lähde: ken collins’ x
openai korostaa, että jokaisen teknologiaa hyödyntävän on tehtävä selväksi, että kyseessä on tekoäly, ei ihminen, ja että se tarjoaa kehittäjille vain rajoitetut esiasetetut vaihtoehdot, ei kykyä luoda uusia ääniä.
"jos teemme sen oikein, meillä on enemmän aikaa omistautua tärkeille asioille ja vähemmän aikaa tuijottaa puhelimia", ware sanoi.
1. vihjeiden välimuisti: pelastaa kehittäjien budjetit
"vihjevälimuisti"-ominaisuus on yksi tämän tapahtuman tärkeimmistä julkaisuista, ja sitä käytetään vähentämään kehittäjien kustannuksia ja viivettä.
monet tekoälysovelluksia rakentavat kehittäjät käyttävät samaa kontekstia uudelleen useissa api-kutsuissa, kuten muokattaessa koodipohjaa tai käydessään pitkää monikäännöstä keskustelua chatbotin kanssa. vihjevälimuisti antaa automaattisesti 50 %:n alennuksen mallin viimeksi käsittelemään syöttötunnukseen käyttämällä uudelleen viimeksi nähtyä syöttötunnusta.
välimuistiin tallennetut syöttötunnukset voivat säästää jopa 50 % verrattuna välimuistiin tallentamattomiin eri gpt-malleihin. kuvan lähde: openai
vihjevälimuistin saatavuus ja hinnoittelu tästä päivästä alkaen vihjevälimuistia sovelletaan automaattisesti uusimpiin gpt-4o-, gpt-4o mini-, o1-preview- ja o1-mini-versioihin sekä näiden mallien hienosäädetyihin versioihin. välimuistissa olevat vinkit tarjoavat alennuksen verrattuna välimuistiin tallentamattomiin vihjeisiin.
sovellusliittymäkutsut tuettuihin malleihin hyötyvät automaattisesti välimuistista, jos kehotteet ovat yli 1024 tunnistetta. pisin vihjeiden etuliite, joka on laskettu ennen api-välimuistia, alkaen merkistä 1024 ja 128 merkin askelin. jos käyttäjä käyttää usein vihjeitä yleisillä etuliitteillä, openai käyttää automaattisesti vihjevälimuistin alennusta ilman, että käyttäjän tarvitsee tehdä muutoksia api-integraatioon.
välimuisti tyhjennetään yleensä 5–10 minuutin käyttämättömyyden jälkeen, ja se poistetaan aina tunnin kuluessa välimuistin viimeisestä käytöstä. kuten kaikki api-palvelut, vihjeiden välimuistiin sovelletaan opai:n corporate privacy commitment -sitoumusta. vihjeiden välimuistia ei jaeta organisaatioiden kesken.
kustannusten merkittävä aleneminen tarjoaa eri yrityksille mahdollisuuksia kehittää uusia sovelluksia, jotka aiemmin olivat liian kalliita toteuttaa.
olivier godement, openai-alustan tuotepäällikkö, puhui pienessä lehdistötilaisuudessa openai:n san franciscon päämajassa: "olemme olleet erittäin kiireisiä. kaksi vuotta sitten gpt-3 johti teknologiaa luokassaan, mutta nyt olemme saavuttaneet lähes 1000- hän sanoi ylpeänä, ettei hän löytänyt mitään muuta tekniikkaa, joka olisi saavuttanut samansuuruisen kustannussäästön vain kahdessa vuodessa.
2. visuaalinen hienosäätö: visuaalisen tekoälyn uusi raja
toinen suuri ilmoitus on visuaalisten hienosäätöominaisuuksien käyttöönotto openai:n uusimmassa laajamittaisessa kielimallissa, gpt-4o:ssa. kehittäjät voivat hienosäätää tekstin lisäksi myös kuvia, mikä voi muuttaa alueita, kuten itseajavia autoja, lääketieteellistä kuvantamista ja visuaalisia hakuominaisuuksia.
tekstin hienosäädön käyttöönoton jälkeen sadat tuhannet kehittäjät ovat hyödyntäneet vain tekstiä sisältäviä tietojoukkoja optimoidakseen malleja parantaakseen suorituskykyä tietyissä tehtävissä. mutta monissa tapauksissa tekstin hienosäätö ei yksinään täytä kaikkia tarpeita. visuaalisen hienosäädön avulla kehittäjät voivat optimoida gpt-4o-mallin yksinkertaisesti lataamalla vähintään 100 kuvaa parantaakseen sen suorituskykyä näkötehtävissä, etenkin kun käsitellään suuria määriä teksti- ja kuvadataa.
grab, kaakkois-aasian johtava ruoan toimitus- ja kyytipalveluyritys, on openai:n mukaan jo hyödyntänyt teknologiaa parantaakseen kartoituspalvelujaan. vain 100 esimerkin avulla grab paransi kaistanlaskennan tarkkuutta 20 % ja nopeusrajoitusmerkkien paikannustarkkuutta 13 %.
esimerkki nopeusrajoitusmerkistä, joka on merkitty onnistuneesti visuaalisella hienosäädöllä gpt-4o kuvalähde: openai
automat käyttää visuaalista hienosäätöä opettaakseen gpt-4o:ta tunnistamaan käyttöliittymäelementit näytöllä näyttökaappausten datajoukon perusteella, mikä parantaa automaatiotyökalujensa onnistumisastetta. tällä tavalla automatin robottiagentin onnistumisprosentti nousi 16,60 %:sta 61,67 %:iin.
työpöytärobotti tunnistaa onnistuneesti käyttöliittymäelementtikeskukset visuaalisen hienosäädön avulla verkkosivustojen kuvakaappausten avulla, lähde: openai
visuaalisen hienosäädön todelliset sovellukset osoittavat visuaalisen hienosäädön mahdollisuudet parantaa merkittävästi tekoälypalveluja useilla eri aloilla käyttämällä pieniä eriä visuaalista koulutustietoa.
visuaalinen hienosäätöominaisuus on nyt kaikkien maksavien käyttäjien saatavilla ja tukee uusinta gpt-4o-mallia. kehittäjät voivat hyödyntää näitä ominaisuuksia laajentaakseen olemassa olevia harjoitustietojoukkoja kuvan hienosäätöä varten. lisäksi openai tarjoaa miljoona ilmaista koulutustunnusta päivässä 31.10.2024 asti. hienosäätökoulutuksen ja päättelyn maksut tarkentuvat myöhemmin.
3. reaaliaikaiset sovellusliittymät: kurkkaa keskustelun tekoälyn välistä kuilua
reaaliaikainen api on tällä hetkellä julkisessa beta-vaiheessa. sen avulla kehittäjät voivat luoda matalan latenssin, multimodaalisia kokemuksia erityisesti puheen puheeksi -sovelluksissa. tämä tarkoittaa, että kehittäjät voivat alkaa lisätä chatgpt:n ääniohjaimia sovelluksiinsa.
havainnollistaakseen api:n mahdollisuuksia openai esitteli päivitetyn version wanderlustista, matkasuunnittelusovelluksesta, joka esiteltiin viime vuoden konferenssissa.
reaaliaikaisen api:n avulla käyttäjät voivat keskustella suoraan sovelluksen kanssa ja suunnitella matkaansa luonnollisella keskustelutavalla. järjestelmä sallii jopa puheen keskeytyksiä jäljittelemällä ihmisten keskustelua.
healthify on ravitsemus- ja kuntovalmennussovellus, joka käyttää reaaliaikaisia sovellusliittymiä mahdollistamaan luonnolliset keskustelut tekoälyn kanssa. kuvan lähde: openai
vaikka matkasuunnittelu on vain yksi esimerkki, reaaliaikaiset api-liittymät tarjoavat laajan valikoiman mahdollisuuksia puhesovelluksille useilla eri toimialoilla. asiakaspalvelusta koulutukseen ja esteettömyystyökaluihin kehittäjillä on nyt tehokkaita uusia resursseja luodakseen intuitiivisempia ja reagoivampia tekoälyyn perustuvia kokemuksia.
"aina kun suunnittelemme tuotetta, ajattelemme pohjimmiltaan sekä startup-yrityksiä että yrityksiä samanaikaisesti", goldment selitti "joten alfa-vaiheessa meillä on paljon yrityksiä, jotka käyttävät sovellusliittymiä sekä uusia malleja uusille tuotteille."
reaaliaikainen sovellusliittymä yksinkertaistaa olennaisesti ääniavustajien ja muiden keskusteluapua tekevien tekoälytyökalujen rakentamista, jolloin ei tarvitse yhdistää useita malleja transkriptiota, päättelyä ja tekstistä puheeksi muuntamista varten.
varhaiset käyttäjät, kuten ravitsemus- ja kuntovalmennussovellus healthify ja kieltenoppimisalusta speak, ovat integroineet tuotteisiinsa reaaliaikaisia sovellusliittymiä. sovellusliittymillä on potentiaalia luoda luonnollisempia ja kiinnostavampia käyttökokemuksia terveydenhuollon ja koulutuksen aloilla.
reaaliaikaisen api:n hinnoittelurakenne, vaikka se ei ole halpa (0,06 dollaria minuutissa äänituloa, 0,24 dollaria minuutissa äänilähtöä), edustaa silti merkittävää arvoehdotusta kehittäjille, jotka haluavat luoda äänipohjaisia sovelluksia.
4. mallin tislaus: kohti helpompaa tekoälyä
ehkä kaikkein mullistavin ilmoitus tästä on mallitislauksen käyttöönotto.
sen integroidun työnkulun ansiosta kehittäjät voivat käyttää edistyneitä malleja, kuten o1-preview ja gpt-4o, parantaakseen tehokkaampien mallien, kuten gpt-4o minin, suorituskykyä. pienet yritykset voivat myös käyttää kehittyneiden mallien vastaavia ominaisuuksia huolehtimatta laskentakustannuksista.
hienosäätödemo, lähde: openai
mallin tislaus kattaa tekoälyteollisuuden pitkäaikaisen kuilun huippuluokan, resurssiintensiivisten järjestelmien ja helpommin saavutettavien mutta vähemmän tehokkaiden järjestelmien välillä.
oletetaan, että pieni lääketieteellisen teknologian startup kehittää tekoälyn diagnostiikkatyökalua maaseutuklinikoille. mallin tislaamisen avulla tiimi voi kouluttaa pienen mallin, joka toimii tavallisella kannettavalla tietokoneella tai tabletilla ja tallentaa suurimman osan suuremman mallin diagnoosista .
tämä voi tuoda kehittyneitä tekoälyominaisuuksia resurssirajoitteisiin ympäristöihin terveydenhuollon tulosten parantamiseksi alipalvelualueilla.
tästä päivityksestä ei ole vaikea nähdä, että openai on tehnyt tärkeän strategisen muutoksen - keskittyen enemmän ekosysteemin kehittämiseen sen sijaan, että pyrittäisiin vain katselemaan huomiota herättäviä tuotelanseerauksia, vaikka strategia ei ehkä olekaan yhtä suora yleisölle kuin tuote. käynnistää.
verrattuna jännittävään kehittäjäpäivään vuonna 2023, jossa lanseerattiin gpt-kauppa ja mukautetut gpt-työkalut, tämän vuoden tapahtuma on paljon vähemmän tärkeä. tekoälyn alalla tapahtuneet nopeat muutokset yhdistettynä kilpailijoiden edistymiseen ja lisääntyvään huoleen koulutusdatan saatavuudesta ovat saaneet openai:n keskittymään enemmän olemassa olevien työkalujen jalostukseen ja kehittäjien valmiuksien parantamiseen selviytyäkseen näistä muutoksista.
parannamalla mallin tehokkuutta ja alentamalla kustannuksia openai toivoo säilyttävänsä etunsa kovassa kilpailussa ja ratkaisevansa resurssiintensiivisyyttä ja ympäristövaikutuksia. openai:n menestys riippuu suuresti sen kyvystä viljellä tehokkaasti elinvoimaista kehittäjäekosysteemiä.
viitteet:
《esittelyssä realtime api》,openai
《esittelemme vision hienosäädettävään api:hen》,openai
《kehotevälimuisti api:ssa》,openai
《mallin tislaus api:ssa》openai
《openai's devday 2024: 4 suurta päivitystä, jotka tekevät tekoälystä helpomman ja edullisemman》,venturebeat
《openai:n devday tuo realtime api:n ja muita herkkuja tekoälysovellusten kehittäjille》,techcrunch
(kansikuvan lähde: openai)