uutiset

openai developer conference jakaa lahjapakkauksia: alentaa merkittävästi mallin kustannuksia, tekoälyä tukevia sovelluksia ja pieniä malleja, jotka "parantavat" suurten mallien suorituskykyä

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

tämän artikkelin kirjoittaja: li dan

tiistaina, 1. lokakuuta, itäistä aikaa, openai piti vuotuisen devday-kehittäjän konferenssin. tämän vuoden konferenssissa ei ollut merkittäviä tuotejulkaisuja, mutta openai jakoi myös useita suuria "lahjapaketteja". kehittäjät ”, tekemällä parannuksia olemassa oleviin tekoälytyökaluihin ja api-sarjoihin.

tämä openai devday tuo markkinoille joukon uusia työkaluja, mukaan lukien neljä suurta innovaatiota: pikavälimuisti, vision fine-tuning, realtime api ja model distilation se tuo hyviä uutisia kehittäjille kustannusten suhteen, parantaa mallien visuaalista ymmärtämistä ääni-ai-toiminnot ja pieni mallin suorituskyky.

jotkut kommentit kertoivat, että tämän vuoden devdayn painopiste on kehittäjien kyvykkyyden parantaminen ja kehittäjäpiirin tarinoiden esittely, mikä osoittaa, että kilpailun ai-kentässä kiristyessä, openai:n strategia on muuttunut. yllä olevat uudet työkalut korostavat openai:n strategista keskittymistä kehittäjäekosysteemin vahvistamiseen sen sijaan, että kilpailisi suoraan loppukäyttäjien sovelluksista.

jotkut tiedotusvälineet mainitsevat, että devday-tapahtumaa edeltävässä lehdistötilaisuudessa openai:n tuotejohtaja kevin weil puhui openai:n teknologiajohtajan mira muratin ja tutkimusjohtaja bob mcgrewn äskettäisistä lähteistä sanoen, että heidän lähtönsä ei vaikuta yrityksen kehitykseen, emme. se hidastuu."

pikavälimuisti voi vähentää syöttötunnuksen kustannuksia jopa 50 %

sanojen nopeaa tallentamista pidetään tämän devdayn tärkeimpänä päivityksenä. tämä ominaisuus on suunniteltu vähentämään kehittäjien kustannuksia ja viivettä.

openai:n käyttöönoton nopea sanavälimuistijärjestelmä tarjoaa automaattisesti 50 % alennuksen mallin äskettäin käsittelemistä syöttötunnisteista, mikä voi johtaa merkittäviin säästöihin sovelluksissa, jotka usein käyttävät kontekstia uudelleen. tällaiset jyrkät kustannussäästöt tarjoavat yrityksille ja startup-yrityksille merkittäviä mahdollisuuksia tutkia uusia sovelluksia, jotka ovat aiemmin olleet ulottumattomissa kohtuuttomien kustannusten vuoksi.

openai-alustan tuotepäällikkö olivier godement sanoi, että gpt-3 oli suuri menestys kaksi vuotta sitten, ja nyt openai on vähentänyt siihen liittyviä kustannuksia lähes 1000 kertaa. hän ei osannut mainita muuta esimerkkiä, jossa kustannukset olisivat pienentyneet saman verran kahdessa vuodessa.

seuraava openai-kaavio osoittaa, että nopea sanavälimuisti voi vähentää merkittävästi tekoälymallien soveltamiskustannuksia verrattuna eri gdp-mallien välimuistiin tallentamattomiin merkintöihin, syöttötunnisteiden välimuistiin tallentamisen kustannuksia voidaan vähentää jopa 50 %.

vision fine tuning: visuaalisen tekoälyn uusi raja

openai devday ilmoitti, että openai:n uusin suuri kielimalli (llm) gpt-4o esittelee visuaalisen hienosäädön. tämän ominaisuuden avulla kehittäjät voivat mukauttaa malliensa visuaalista ymmärrystä kuvien ja tekstin avulla.

tämä on merkittävä päivitys, joka tunnetaan visuaalisen tekoälyn uutena rajana. sillä voi olla kauaskantoisia vaikutuksia sellaisilla aloilla kuin itse ajavat autot, lääketieteellinen kuvantaminen ja visuaaliset hakuominaisuudet.

openai sanoi, että grab, meituan + didin kaakkois-aasian versio, on käyttänyt tekniikkaa parantaakseen karttapalveluitaan. vain 100 esimerkin avulla grab paransi kaistanlaskennan tarkkuutta 20 % ja nopeusrajoitusmerkkien sijaintia 13 %.

tämä tosielämän sovellus esittelee visuaalisen hienosäädön mahdollisuudet käyttämällä pieniä eriä visuaalista koulutusdataa, mikä parantaa merkittävästi tekoälypalveluja useilla eri aloilla.

reaaliaikainen api täyttää keskustelun tekoälyn kuilun

openai devday julkaisi reaaliaikaisen api:n, joka on tällä hetkellä julkisessa beta-vaiheessa. reaaliaikainen sovellusliittymä yksinkertaistaa luontaisesti ääniavustajien ja muiden keskusteluapua tekevien tekoälytyökalujen rakentamisprosessia, jolloin ei tarvitse yhdistää useita malleja transkriptiota, päättelyä ja tekstistä puheeksi muuntamista varten.

tämä uusi tuote antaa kehittäjille mahdollisuuden luoda matalan latenssin multimodaalisia kokemuksia erityisesti puheen puheeksi -sovelluksissa. tämä tarkoittaa, että kehittäjät voivat alkaa lisätä chatgpt:n ääniohjaimia sovelluksiin.

havainnollistaakseen api:n mahdollisuuksia openai esitteli päivitetyn version wanderlustista, matkasuunnittelusovelluksesta, jota se esitteli viime vuoden konferenssissa.

reaaliaikaisen api:n avulla käyttäjät voivat puhua suoraan sovelluksen uudelle versiolle ja käydä luonnollisia keskusteluja suunnitellakseen reittiään. järjestelmän avulla käyttäjät voivat jopa keskeyttää lauseiden keskellä, jäljittelemällä ihmisten keskustelua.

matkasuunnittelu on vain yksi esimerkki, reaaliaikaiset sovellusliittymät tarjoavat laajan valikoiman mahdollisuuksia äänisovelluksille eri toimialoilla. olivatpa kehittäjät erikoistuneet asiakaspalveluun, koulutukseen tai esteettömyystyökaluihin vammaisille, kehittäjät voivat nyt hyödyntää uusia resursseja luodakseen intuitiivisempia ja reagoivampia tekoälyyn perustuvia kokemuksia.

jotkut sovellukset, mukaan lukien ravitsemus- ja kuntovalmennussovellus healthify ja kieltenoppimisalusta speak, ovat jo ottaneet johtoaseman reaaliaikaisten sovellusliittymien integroinnissa tuotteisiinsa.

kommenttien mukaan reaaliaikainen sovellusliittymä ei ole halpa, sillä se veloittaa 0,06 dollaria minuutissa äänitulosta ja 0,24 dollaria minuutissa, mutta se voi silti edustaa merkittävää arvoehdotusta kehittäjille, jotka haluavat luoda äänipohjaisia ​​sovelluksia.

mallin tislaus mahdollistaa pienille malleille huippuluokan mallitoiminnot

mallitisslaamista pidetään tällä kertaa openai:n mullistavimpana uutena työkaluna. tämän integroidun työnkulun avulla kehittäjät voivat hienosäätää suhteellisen pieniä ja kustannustehokkaita yliopistomalleja käyttämällä huippuluokan malleja, kuten gpt o1-preview ja gpt-4o, mikä parantaa tehokkaampia malleja, kuten gpt-4o mini suorituskykyä.

tämä lähestymistapa antaa pienemmille yrityksille mahdollisuuden hyödyntää huippuluokan mallien vastaavia ominaisuuksia ilman, että tällaisten mallien käytöstä aiheutuu laskentakustannuksia. se auttaa kuromaan umpeen tekoälyteollisuudella pitkään ollut kuilu huippuluokan, resurssiintensiivisten järjestelmien ja helpommin saavutettavissa olevien mutta vähemmän tehokkaiden järjestelmien välillä.

esimerkiksi pieni lääketieteen teknologian startup haluaa kehittää tekoälyyn perustuvan diagnostisen työkalun maaseutuklinikoihin. mallin tislauksen avulla yritys voi kouluttaa kompaktin mallin, joka kaappaa suuren osan suuremman mallin diagnostisista tehoista, vaikka sitä tarvitsee käyttää vain tavallisessa kannettavassa tai tabletissa.

siksi mallitislaus voi mahdollistaa resurssirajoitteisten ympäristöjen nauttia monimutkaisista tekoälytoiminnoista, mikä saattaa parantaa sairaanhoidon tasoa alipalveltuilla alueilla.