2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
kirjailija: jessica
tänään openai:n ensimmäinen devday vuonna 2024 pidettiin hillitysti gateway pavilionissa pier 2:ssa san franciscossa.
viime vuoden myrskyisästä virallisesta ilmoituksesta poiketen tämän vuoden developer day -uutinen ilmestyi vain kerran openai developersin x-tilillä kaksi kuukautta sitten, joten monet ihmiset eivät tienneet siitä.
osallistujat ovat periaatteessa kutsuttuja asiakkaita ja valikoituja etulinjan kehittäjiä. paikka pidettiin salassa viime hetkeen asti, salaperäinen aikataulu paljastettiin vasta päivällä, eikä suoraa lähetystä ollut.
ennen kokousta sam altman twiittasi nopeasti:
"joitakin uusia työkaluja kehittäjille julkaistaan tänään!
edellisestä devdaysta tähän: tokenin hinta gpt-4:stä 4o miniin on laskenut 98 %, järjestelmämme merkkien määrä on kasvanut 50-kertaiseksi, mallin älykkyys on edistynyt erinomaisesti, ja hieman draamaa prosessissa.
odotan innolla edistymistä tästä devdaysta seuraavaan. polku agi:hen ei ole koskaan ollut selkeämpi. "
kuten yrityksen kehittäjäkokemusjohtaja romain huet kertoi aiemmin x-alustalla, tämän vuoden devday ei julkaissut uusia malleja ja keskittyi vain api-parannuksiin.
ja openai todellakin pakkasi sarjan reaaliaikaisia sovellusliittymiä, nopeaa välimuistia, mallien tislaamista, visuaalista hienosäätöä, leikkikentän optimointia sekä o1-sovellusliittymän laajuutta ja kehittäjien nopeusrajoituksen nostamista tänä todellisena "kehittäjien päivänä". tärkeitä työkalupäivityksiä.
näiden uusien sovellusliittymien hinnoittelu ei ole ehdottoman halpa. monet kehittäjät kommentoivat, että hinnoittelun ja ominaisuuksien yhdistelmä tekee niistä houkuttelevia. tämä vilpitön kehittäjälahjapaketti esitellään kerralla, ja openai haluaa silti tienata eniten myymällä parhaita tuotteita.
kuvan lähde: @swyx |
1
reaaliaikainen sovellusliittymä: luo oma "hän"-sovelluksesi yhdessä vaiheessa
nykypäivän silmiinpistävimpänä ominaisuutena realtime api antaa kehittäjille mahdollisuuden kutsua gpt-4o-realtime-previewia, joka on chatgpt:n edistyneen äänitilan taustalla oleva malli, rakentaakseen nopean ja luonnollisen äänistä puheeseen -keskustelukokemuksen sovelluksissa. tukee 6 esiasetettua ääntä matalan latenssin äänivuorovaikutuksen saavuttamiseksi.
aiemmin ääniavustajaa luodessaan kehittäjien piti luottaa useisiin malleihin eri tehtävien suorittamisessa: ensin puheentunnistusmallilla, kuten whisperilla, äänen transkribointi tekstiksi, sitten tekstin välittäminen kielimalliin päätelmiä varten ja lopuksi puheen luominen. tekstistä puheeksi -mallin kautta. prosessi ei ole vain monimutkainen, vaan tunteet ja korostus voivat helposti kadota, ja viiveet ovat merkittäviä.
reaaliaikainen api vaatii vain yhden kutsun koko keskusteluprosessin suorittamiseksi. paranna dramaattisesti keskustelujen luonnollisuutta ja reagointikykyä suoratoistamalla äänen tuloa ja lähtöä. se käyttää jatkuvaa websocket-yhteyttä viestien vaihtamiseen gpt-4o:n kanssa ja tukee toimintokutsuja, jotka voivat vastata nopeasti pyyntöihin, suorittaa toimintoja, kuten tilausten tekeminen tai henkilökohtaisten palvelujen tarjoaminen. se voi myös käsitellä automaattisesti keskeytyksiä, kuten edistynyt äänitila varmistaakseen sujuvamman käyttökokemuksen. se sopii erittäin hyvin asiakastukeen, kieltenoppimiseen ja muihin korkeaa vuorovaikutteisuutta vaativiin tilanteisiin.
paikalla henkilökunta esitteli reaaliaikaisen api:n kautta rakennettua ääniavustajaa, joka auttoi yli 100:aa yleisössä olevaa kehittäjää "soittamaan ja tilaamaan 400 mansikka toimitusta varten".