Nachricht

„Die leistungsstärkste Funktion und die niedrigsten Kosten“! OpenAI veröffentlicht GPT-4o mini, um am kleinen Modellwettbewerb teilzunehmen

2024-07-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

OpenAI brachte am Donnerstag Eastern Time „GPT-4o mini“ auf den Markt und trat damit in die Konkurrenz der „kleinen, aber feinen“ KI-Modelle ein. Es bezeichnete dieses neue Modell als „das leistungsstärkste und kostengünstigste Modell“ und plante die Integration von Bildern, Videos und Audio in Zukunft in dieses Modell.

Mehr als 60 % günstiger als GPT-3.5 Turbo und die Chat-Leistung ist besser als bei Konkurrenzprodukten

Das Unternehmen sagte, dass GPT-4o mini ab Donnerstag für kostenlose ChatGPT-Benutzer, ChatGPT Plus- und Teams-Abonnenten verfügbar ist und nächste Woche für ChatGPT-Unternehmensbenutzer verfügbar sein wird. GPT-4o mini wird das ältere Modell GPT-3.5 Turbo in ChatGPT ersetzen. Laut OpenAI kostet GPT-4o mini 15 Cent pro Million Input-Tokens und 60 Cent pro Million Output-Tokens und ist damit mehr als 60 % günstiger als GPT-3.5 Turbo.

Das Unternehmen gab außerdem an, dass das neue Modell derzeit das GPT-4-Modell bei den Chat-Präferenzen übertrifft und beim Massive Multi-Task Language Understanding (MMLU)-Test eine Punktzahl von 82 % erreicht. Medienberichten zufolge ist MMLU ein Benchmark für Textintelligenz und Argumentation, der zur Bewertung der Fähigkeiten von Sprachmodellen verwendet wird. Ein höherer MMLU-Wert weist auf ein besseres Verständnis und einen besseren Gebrauch der Sprache in einer Vielzahl von Bereichen hin und verbessert so deren praktische Anwendung.

Laut OpenAI-Daten erreichte das Mini-Modell GPT-4o 82 %, was mehr ist als die beiden anderen Billigkonkurrenten, Googles Gemini Flash erzielte 77,9 % und Claude Haiku von Anthropic 73,8 %.

Unter den größeren Modellen erreichte GPT-3.5 in diesem Test 70 %, GPT-4o 88,7 % und Google behauptet, sein Gemini Ultra habe mit 90 % die höchste Punktzahl aller Zeiten erreicht.

Die Analyse legt nahe, dass kleinere Sprachmodelle zum Betrieb weniger Rechenleistung benötigen, was sie zu einer erschwinglicheren Option für Unternehmen mit begrenzten Ressourcen für den Einsatz generativer KI macht.

Darüber hinaus wird dieses neue, leichtgewichtige Modell auch Text- und visuelle Funktionen in der API unterstützen, und OpenAI sagt, dass es bald alle multimodalen Ein- und Ausgaben wie Video und Audio verarbeiten wird. Mit diesen Funktionen könnte dies möglicherweise wie ein leistungsfähigerer virtueller Assistent fungieren, der in der Lage ist, Ihre Reiseroute zu verstehen und Empfehlungen auszusprechen. Allerdings ist dieses Modell derzeit überwiegend nur für einfache Aufgaben einsetzbar.

Der Wettbewerb um „kleine, aber feine“ KI-Modelle ist hart und OpenAI kommt endlich ins Spiel

Laut Medienberichten liegt der Wert von OpenAI, hinter dem Microsoft steht, bei über 80 Milliarden US-Dollar. Obwohl das Unternehmen immer noch eine führende Position im Markt für generative KI einnimmt, ist es einem zunehmenden Wettbewerbsdruck ausgesetzt. OpenAI muss auch Wege finden, Geld zu verdienen, da das Unternehmen viel Geld für Prozessoren und Infrastruktur ausgibt, um seine Modelle zu erstellen und zu trainieren.

Allerdings können sich viele Unternehmen größere und teurere Modelle nicht leisten, sodass leichte und günstigere Modelle möglicherweise beliebter sind. Bis dahin würden sich viele Entwickler für Claude 3 Haiku oder Gemini 1.5 Flash entscheiden, anstatt die hohen Rechenkosten zu zahlen, die für den Betrieb der leistungsstärksten Modelle erforderlich sind. Beispielsweise eignet sich ein kleineres Modell möglicherweise am besten für die Automatisierung umfangreicher, grundlegender Aufgaben, während ein größeres Modell möglicherweise komplexere Arbeiten erledigt. Einige Entwickler möchten möglicherweise beide Modelle in einer einzigen Anwendung verwenden.

Olivier Godement, API-Produktleiter von OpenAI, erklärte in einem Interview mit den Medien, warum das Unternehmen es versäumt hatte, „kleine und raffinierte“ KI-Modelle früher auf den Markt zu bringen. Er sagte, dies sei eine reine „Prioritätssache“, da sich OpenAI auf die Entwicklung größerer und besserer Modelle konzentriere Modelle wie GPT-4 erfordern erhebliche personelle und rechnerische Ressourcen. Im Laufe der Zeit bemerkte OpenAI, dass Entwickler immer bestrebter wurden, kleinere Modelle zu verwenden, und so beschloss das Unternehmen, dass es jetzt an der Zeit sei, Ressourcen in die Entwicklung des GPT-4o Mini zu investieren.

„Unsere Mission ist es, die modernste Technologie zu entwickeln und die leistungsstärksten und nützlichsten Anwendungen zu entwickeln, und wir hoffen auf jeden Fall, weiterhin modernste Modelle zu entwickeln und den technologischen Fortschritt zu fördern“, sagte Olivier Godement, API-Produktleiter von OpenAI, in einem Interview mit die Medien. „Aber wir wollen auch das beste kleine Modell haben und ich denke, es wird sehr beliebt sein.“

„Ich denke, GPT-4o Mini verkörpert wirklich die Mission von OpenAI, KI zugänglicher zu machen. Wenn wir wollen, dass KI jedem Winkel der Welt, jeder Branche und jeder Anwendung zugute kommt, müssen wir die API-Plattformprodukte von OpenAI erschwinglicher machen, Direktor Olivier.“ sagte Godement den Medien.

GPT-4o mini hilft den Mitarbeitern, sich zu konzentrieren

Godement sagte, einige Entwickler hätten das Modell in der vergangenen Woche getestet.

OpenAI hat das Fintech-Startup Ramp gebeten, das Modell zu testen und mithilfe von GPT-4o Mini ein Tool zu entwickeln, das Spesendaten aus Belegen extrahiert. So können Nutzer Fotos ihrer Belege hochladen und das Model organisiert die Daten für sie. Der E-Mail-Client Superhuman hat auch GPT-4o Mini getestet und damit eine Funktion erstellt, die automatisch E-Mail-Antworten vorschlägt.

Zunächst wird GPT-4o mini in der Lage sein, Texte und Bilder zu verarbeiten und zu generieren. Sobald die endgültige Version fertiggestellt ist, wird OpenAI nach eigenen Angaben auch andere Arten von Inhalten verarbeiten können.

OpenAI sagte außerdem, dass GPT-4o mini das erste KI-Modell des Unternehmens sei, das seine neue Sicherheitsrichtlinie „Anweisungshierarchie“ nutzt. Ziel dieses Ansatzes ist es, KI-Systeme dazu zu bringen, bestimmte Anweisungen – beispielsweise von Unternehmen – zu priorisieren, um es für Menschen schwieriger zu machen, das Tool dazu zu bringen, etwas zu tun, was es nicht tun soll.

Analysis geht davon aus, dass das GPT-4o-Minimodell Teil des Engagements von OpenAI für „Multimodalität“ ist, d. h. die Bereitstellung einer breiten Palette von KI-generierten Medien (wie Text, Bilder, Audio und Video) in einem Tool: ChatGPT.

Letztes Jahr sagte Brad Lightcap, COO von OpenAI, den Medien:

„Die Welt ist multimodal. Wenn man darüber nachdenkt, wie wir als Menschen die Welt verarbeiten und mit ihr interagieren, wir sehen Dinge, hören Dinge, sprechen – die Welt besteht nicht nur aus Text. Für uns gibt es also nur Text und Code Eine einzelne Modalität, eine einzelne Schnittstelle fühlt sich immer unvollständig an, weil die Leistungsfähigkeit dieser Modelle und ihre Möglichkeiten so viel größer sind.“