openai veranstaltet eine unauffällige entwicklerkonferenz: deutliche kostensenkung und einführung öffentlicher echtzeit-apis beta

openai veranstaltet eine unauffällige entwicklerkonferenz: deutliche kostensenkung und einführung einer öffentlichen beta-version der echtzeit-api

2024-10-02

höhepunkte:

openai hielt am dienstag seine zweite entwicklerkonferenz in san francisco in zurückhaltender atmosphäre ab. die medien wurden nicht zur teilnahme eingeladen und es wurden keine neuen produkte veröffentlicht.
diese entwicklerkonferenz findet jeweils in san francisco, london und singapur statt, die anderen beiden finden am 30. oktober und 21. november statt.
openai hat vier neue tools für entwickler auf den markt gebracht und verlagert damit seinen schwerpunkt vom direkten wettbewerb bei endbenutzeranwendungen hin zur stärkung des entwickler-ökosystems.
derzeit haben mehr als 3 millionen entwickler das openai-modell zur entwicklung von anwendungen genutzt und damit die attraktivität und wettbewerbsfähigkeit der plattform unter beweis gestellt.

laut nachrichten vom 2. oktober war die vergangene woche voller herausforderungen für openai, darunter der abgang des top-managements und wichtige spendenaktionen, aber das unternehmen hat sich wieder darauf konzentriert, auf seiner entwicklerkonferenz 2024 (devday) aufmerksamkeit zu erregen modelle zum bau von werkzeugen. openai-ceo sam altman, der in letzter zeit große mediale aufmerksamkeit erregte, erschien nicht auf der entwicklerkonferenz.

auf einer pressekonferenz am montag versicherte kevin weil, chief product officer von openai, den anwesenden medien, dass die chief technology officer mira murati (mira murati) und der chief research officer bao bob mcgrew des unternehmens zwar kürzlich seinen rücktritt angekündigt haben, diese änderung jedoch keine auswirkungen auf das unternehmen haben wird den fortschritt des unternehmens. „ich möchte zunächst sagen, dass bob und myra unglaubliche führungspersönlichkeiten sind“, sagte ware respektvoll. „ich wurde tief von ihnen beeinflusst und sie haben maßgeblich dazu beigetragen, uns dorthin zu bringen, wo wir heute sind. und das haben wir nicht vor.“ verlangsamen. „die geschwindigkeit unserer entwicklung.“

im vergangenen jahr veranstaltete openai in san francisco, usa, die erste entwicklerkonferenz (devday 2023), die in der branche für aufsehen sorgte. die große ankündigung machte das unternehmen während einer 45-minütigen keynote, zu der zahlreiche medienvertreter eingeladen waren, und stellte eine reihe neuer produkte und tools vor, darunter gpt-4 turbo mit 128k-kontextunterstützung, api-preissenkung, neue assistenten-api usw gpt-4 turbo für visuelle funktionen, dall·e 3 api und ein stark verbessertes json-modell sowie die unglückseligen gpts und die app store-ähnliche plattform gpt store. auch microsoft-chef satya nadella hatte einen gastauftritt.

olivier godement, plattformproduktleiter von openai, sagte, das unternehmen werde keine neuen modelle mehr auf entwicklerkonferenzen veröffentlichen und die modelle ihren eigenen forschungs- und sicherheitszeitplänen folgen lassen. die änderung erfolgt vor dem hintergrund, dass openai dafür kritisiert wird, die technologie zu schnell voranzutreiben. openai, das als gemeinnützige organisation begann, befindet sich mitten in einer umstrukturierungsphase, die dazu führen könnte, dass die gemeinnützige organisation die kontrolle verliert und sich in ein traditionelles startup verwandelt – ein schritt, der ihr dabei helfen soll, kapital zu beschaffen, talente zu rekrutieren und zu halten. doch diese veränderungen „zerreißen das unternehmen“, und mulati und chefwissenschaftler ilya sutskever verließen das unternehmen, weil das unternehmen zu schnell wuchs.

nachdem es nach der letztjährigen entwicklerkonferenz zu hochrangigen personellen veränderungen kam, wählte openai für die diesjährige entwicklerkonferenz einen zurückhaltenderen ansatz. im vergleich zur letztjährigen veranstaltung scheint die entwicklerkonferenz von openai dieses jahr zurückhaltender zu sein. das unternehmen hatte zuvor erklärt, dass es die medien nicht zur teilnahme einladen werde. nach offiziellen angaben findet die 2. devday-entwicklerkonferenz am 1. oktober, 30. oktober und 21. november in singapur statt. zu den aktivitäten gehören technische seminare, gruppendiskussionen, produktdemonstrationen usw. teilnehmer dieser veranstaltung können nach erfolgreicher bewerbung auf der offiziellen website und zahlung einer anmeldegebühr von 450 us-dollar teilnehmen.

das management von openai gab an, dass das unternehmen zwar vor einem führungswechsel steht, das unternehmen jedoch immer noch mehr als 3 millionen entwickler hat, die seine ki-modelle für die entwicklung nutzen, was die attraktivität und wettbewerbsfähigkeit seiner plattform demonstriert. dennoch ist sich openai des zunehmenden wettbewerbs im markt bewusst, insbesondere des preisdrucks durch konkurrenten wie meta und google. um entwickler anzuziehen und zu halten, hat openai die kosten für den zugriff auf seine api in den letzten zwei jahren um 99 % gesenkt, eine strategie, die möglicherweise eine reaktion auf die herausforderungen der wettbewerber ist.

openai stellte auf dieser entwicklerkonferenz kein neues spitzenmodell für künstliche intelligenz vor, sondern konzentrierte sich auf den aufbau von ökosystemen und konzentrierte sich darauf, entwicklern dabei zu helfen, sich miteinander zu vernetzen und ein tiefgreifendes verständnis für neue funktionen und produkte der künstlichen intelligenz zu erlangen. während sich openai vom branchendisruptor zum plattformanbieter wandelt, wird sein erfolg von seiner fähigkeit abhängen, ein lebendiges entwickler-ökosystem aufzubauen. durch die bereitstellung fortschrittlicherer tools, die senkung der kosten und den verstärkten support hat openai eine solide grundlage für weiteres wachstum und stabilität im bereich der künstlichen intelligenz gelegt. auch wenn die direkten auswirkungen dieser strategie möglicherweise nicht sofort offensichtlich sind, wird erwartet, dass sie letztendlich zu einer nachhaltigen und tieferen einführung von ki in einem breiteren spektrum von branchen führen wird.

openai stellte auf dieser entwicklerkonferenz vier wichtige innovationen vor: vision fine-tuning, realtime api, model distillation und prompt caching. diese neuen tools markieren eine verschiebung des strategischen fokus von openai vom direkten wettbewerb bei endbenutzeranwendungen hin zur stärkung seines entwickler-ökosystems.

01 prompt caching: ein geldsparendes tool für entwickler

openai kündigte auf der entwicklerkonferenz ein revolutionäres feature an – prompt caching, das die kosten für entwickler und betriebsverzögerungen deutlich reduzieren wird. diese funktion kann kürzlich vom modell verarbeitete eingabe-tokens automatisch identifizieren und zwischenspeichern und preisnachlässe von bis zu 50 % für diese zwischengespeicherten token gewähren. dies ist ein großer vorteil für anwendungen, die häufig denselben kontext verwenden.

„wir haben hart gearbeitet“, sagte gudmont, produktleiter der openai-plattform. „vor zwei jahren war gpt-3 der dominierende marktführer. heute ist es uns gelungen, die kosten um das tausendfache zu senken. ich kann mir wirklich keine andere technologie vorstellen, die in zwei jahren eine so deutliche kostensenkung erreichen kann.“ reduzieren."

diese erhebliche kostensenkung eröffnet unternehmen und start-ups aller größen die möglichkeit, neue anwendungen zu erkunden, insbesondere projekte, deren einführung sich aus kostengründen verzögert hat. jetzt ist es endlich möglich.

02 visuelle feinabstimmung: eine neue ära der visuellen künstlichen intelligenz

eine weitere wichtige ankündigung ist die einführung visueller feinabstimmungsfunktionen für das neueste große sprachmodell von openai, gpt-4o. mit dieser neuen funktion können entwickler bilder und text nutzen, um das visuelle verständnis ihrer modelle anzupassen. die auswirkungen dieser funktion sind weitreichend und könnten erhebliche auswirkungen auf bereiche wie selbstfahrende autos, medizinische bildgebung und visuelle suchfunktionen haben.

laut openai nutzt das südostasiatische lebensmittelliefer- und fahrdienstunternehmen grab die technologie bereits, um seine kartendienste zu verbessern. mit nur 100 beispielen erzielte grab eine 20-prozentige verbesserung der fahrspurzählgenauigkeit und eine 13-prozentige verbesserung der position von geschwindigkeitsbegrenzungsschildern. diese reale anwendung zeigt, wie durch visuelle feinabstimmung kleine mengen visueller trainingsdaten genutzt werden können, um die möglichkeiten für dienste für künstliche intelligenz in verschiedenen branchen erheblich zu verbessern.

03 instant api: füllt die lücke in der konversations-ki

openai hat außerdem eine öffentliche betaversion seiner instant-api veröffentlicht. hierbei handelt es sich um einen neuen dienst, der es entwicklern ermöglicht, multimodale erlebnisse mit geringer latenz zu erstellen, insbesondere in speech-to-speech-anwendungen. dies bedeutet, dass entwickler damit beginnen können, die sprachsteuerungsfunktionen von chatgpt zu ihren apps hinzuzufügen.

um das potenzial der api zu demonstrieren, präsentierte openai eine aktualisierte version der reiseplanungs-app wanderlust, die es letztes jahr auf der konferenz gezeigt hatte. mithilfe der instant-api können benutzer direkt mit der app kommunizieren, um ihre reise auf natürliche weise zu planen.

während die reiseplanung nur ein beispiel ist, eröffnen instant-apis vielfältige möglichkeiten für sprachaktivierte anwendungen in einer vielzahl von branchen. vom kundenservice bis hin zu schulungs- und barrierefreiheitstools verfügen entwickler jetzt über leistungsstarke neue ressourcen, um intuitivere und reaktionsfähigere ki-gesteuerte erlebnisse zu schaffen. „wenn wir ein produkt entwerfen, denken wir grundsätzlich an startups und unternehmen“, erklärt gudmont. „beim alpha-testen verwenden viele unternehmen apis, neue modelle für neue produkte.“

instant apis vereinfachen von natur aus den prozess der erstellung von sprachassistenten und anderen konversations-ki-tools und machen die kombination mehrerer modelle für transkription, inferenz und text-in-sprache-konvertierung überflüssig. frühanwender wie die gesundheits- und fitness-coaching-app healthify und die sprachlernplattform speak haben instant-apis in ihre produkte integriert. die preisstruktur der instant api ist zwar mit 0,06 us-dollar pro minute audioeingabe und 0,24 us-dollar pro minute audioausgabe nicht billig, kann aber dennoch einen erheblichen wert für entwickler darstellen, die sprachbasierte anwendungen erstellen möchten.

04 modelldestillation: ein neues kapitel in der popularisierung künstlicher intelligenz

openai hat auch die modelldestillationstechnologie veröffentlicht, die möglicherweise die transformativste weiterentwicklung darstellt. mit dieser technologie können entwickler die ausgabe fortschrittlicher modelle wie o1-preview und gpt-4o nutzen, um die leistung effizienterer modelle wie gpt-4o mini zu verbessern.

diese innovation ermöglicht es klein- und kleinstunternehmen, fähigkeiten zu erreichen, die mit großen modellen bei geringeren rechenkosten vergleichbar sind, und löst damit einen seit langem bestehenden widerspruch in der ki-branche: zwischen ressourcenintensiven und zugänglichen systemen mit begrenzten funktionen. beispielsweise könnte ein kleines medizintechnik-startup die modelldestillationstechnologie nutzen, um ki-gestützte diagnosetools für ländliche kliniken zu entwickeln. das unternehmen ist in der lage, ein leichtes modell zu trainieren, das nicht nur mit standardgeräten läuft, sondern auch eine diagnostische genauigkeit bietet, die der von größeren modellen nahekommt, was hoffentlich die medizinische versorgung in gebieten mit begrenzten ressourcen verbessern wird. (wuji, speziell zusammengestellt von tencent technology)

nachricht

openai veranstaltet eine unauffällige entwicklerkonferenz: deutliche kostensenkung und einführung einer öffentlichen beta-version der echtzeit-api

01 prompt caching: ein geldsparendes tool für entwickler

02 visuelle feinabstimmung: eine neue ära der visuellen künstlichen intelligenz

03 instant api: füllt die lücke in der konversations-ki

04 modelldestillation: ein neues kapitel in der popularisierung künstlicher intelligenz

einführung

meine kontaktdaten