zhipu ai ist verrückt nach openai und muss bis zum tod kämpfen

2024-09-18

geschrieben von |. zhang yu

herausgeber |. yang yong

vor kurzem hat das große ki-modell „einhorn“ zhipu ai eine neue finanzierungsrunde unter der leitung der zhongguancun science city company mit einer pre-money-bewertung von 20 milliarden yuan abgeschlossen, mit einem finanzierungsbetrag von mehreren milliarden yuan. es wird berichtet, dass diese finanzierungsrunde die dritte finanzierungsrunde ist, die zhipu ai seit 2024 abgeschlossen hat.

im juni 2024 wurde berichtet, dass prosperity7, ein von der risikokapitalabteilung des nahöstlichen ölriesen saudi aramco verwalteter fonds, mit einem investitionsbetrag von 400 millionen us-dollar in zhipu ai investiert hat. diese finanzierungsrunde hat die entwicklung von zhipu direkt vorangetrieben ai ist in den „20-milliarden-yuan-club“ eingetreten, und die 20-milliarden-yuan-bewertung gilt allgemein auch als grundlage für den einstieg in die erste stufe der branche.

zur aktionärsliste von zhipu ai gehören derzeit bekannte investmentinstitute wie hillhouse capital, qiming venture partners und sequoia capital sowie internetgiganten wie meituan strategic investment department, ant group, alibaba und tencent investment. darüber hinaus gibt es staatliche vermögenswerte wie den zhongguancun fund for social security fund, den beijing artificial intelligence industry fund und die zhongguancun science city.

zhipu ai wurde im juni 2019 gegründet. es entstand aus den technischen errungenschaften des knowledge engineering laboratory (keg) der tsinghua-universität und ist derzeit das einzige vollständig in inländischem besitz befindliche und vollständig selbst entwickelte große modellunternehmen in china. sie haben bereits im jahr 2020 die trainingsarchitektur entwickelt und im jahr 2022 das 10-milliarden-parameter-modell glm-10b trainiert. zhipu ai brachte die glm-serie mit 100 milliarden open-source-basisdialogmodellen auf den markt. nach der einführung von glm-4 im januar 2024 veröffentlichte zhipu ai im juni das open-source-modell glm-4-9b und brachte im juli das videogenerierungstool qingying auf den markt.

„aufholen mit openai“ und „benchmarking von open ai sind die ziele von zhipu ai“ sind die slogans, die zhang peng, ceo von zhipu ai, oft erwähnt hat, als er sie mit der öffentlichkeit teilte. der aktuelle wettbewerb großer modelle reicht jedoch nicht mehr von 0 zu 1 der kampf ist kein kampf, sondern ein kampf um die umsetzung. kann zhipu ai, bekannt als „china openai“, im groß angelegten modellwettbewerb erfolgreich durchbrechen?

1. openai ist immer noch führend

seit der gründung von zhipu ai ist openai das ziel, aufzuholen. bisher hat zhipu ai modellprodukte erstellt, die vollständig mit openai verglichen werden, darunter der ki-effizienzverbesserungsassistent zhipu qingyan, das hocheffiziente codemodell codegeex, das multimodale verständnismodell cogvlm und das vincent-diagrammmodell cogview , usw.

obwohl zhipu ai als chinas größtes open-source-modell bekannt ist, ist ein vergleich mit openai nicht einfach.

beispielsweise veröffentlichte zhipu ai beim ersten technology open day (zhipu devday) im januar 2024 ein sprachmodell der neuen generation glm-4. obwohl die gesamtleistung von glm-4 im vergleich zur vorherigen generation deutlich um 60 % verbessert wurde, es wird als „vergleichbar mit gpt-4“ bezeichnet, tatsächlich erreicht es jedoch nur etwa 90 % des niveaus von gpt-4.

zhang peng sagte auch offen, dass die entwicklung inländischer großmodelle im vergleich zu ausländischen großmodellen später begann. in verbindung mit den einschränkungen der hochleistungsrechenleistung und der lücke in der datenqualität seien inländische großmodelle auf dem gleichen niveau wie die weltweit fortgeschrittenen modelle hinsichtlich des umfangs und der kernkompetenzen besteht eine gewisse lücke, die etwa ein jahr beträgt.

erstens legt openai aus technischer sicht mehr wert auf vielseitigkeit, portabilität und skalierbarkeit. die modelle der gpt-serie können in mehreren szenarien eingesetzt werden und sind hochgradig anpassbar. im gegensatz dazu ist der technische weg von zhipu ai „großes modell + kleines modell“, der sich durch vortraining und feinabstimmung großer modelle an die anforderungen verschiedener szenarien und aufgaben anpasst. dieser technische weg kann die generalisierungsfähigkeit und den anwendungsbereich des modells verbessern es gibt jedoch auch probleme wie eine hohe modellkomplexität, einen großen rechenaufwand und eine lange trainingszeit.

zweitens sind die modelle der gpt-serie von openai größer und können große mengen natürlichsprachlicher daten verarbeiten, wodurch eine bessere modellleistung erzielt wird. im gegensatz dazu ist die modellgröße von zhipu ai möglicherweise kleiner und seine fähigkeit, daten zu verarbeiten, ist begrenzt, was sich auf die modellleistung und die generalisierungsfähigkeiten auswirken kann.

darüber hinaus verfügt openai hinsichtlich der datenressourcen über eine große menge an datenressourcen in natürlicher sprache, die zum trainieren und optimieren seines modells verwendet werden können, während zhipu ai möglicherweise über relativ wenige datenressourcen verfügt, was zu einschränkungen in der wirkung und leistung seines modells führt modelltraining.

die kluft zwischen den beiden seiten spiegelt sich am intuitivsten in der anzahl der nutzer wider. im november 2022 überstieg die zahl der nutzer von openais chatgpt eine million, nachdem es nur fünf tage online war. im januar 2023 überstieg die zahl der monatlich aktiven nutzer 100 millionen und war damit die am schnellsten wachsende verbraucheranwendung in der geschichte. im gegensatz dazu liegt die zahl der täglich aktiven nutzer von zhipu qingyan, einer tochtergesellschaft von zhipu ai, im november 2023 nur zwischen 100.000 und 400.000.

tatsächlich wird die kluft zwischen zhipu ai und openai immer größer. am 13. september veröffentlichte openai die o1-modellreihe, einschließlich der o1-vorschauversion und des o1-mini. in einer reihe von benchmark-tests zeigte o1 erneut eine enorme verbesserung im vergleich zu gpt-4o und war in benchmark-tests zu physikalischen, biologischen und chemischen problemen sogar „mit menschlichen experten vergleichbar“.

beispielsweise erzielte gpt-4o bei der internationalen mathematikolympiade (imo) eine punktzahl von 13,4 %, während o1 beim codeforces-programmierwettbewerb sogar eine hervorragende punktzahl von 89 % erreichte, während die genauigkeit von gpt-4o betrug nur 11 %. darüber hinaus erreichten menschliche experten im gpqa-diamanttest eine genauigkeit von 69,7, während o1 eine genauigkeit von 78 % erreichte.

es ist ersichtlich, dass zhipu ai noch weit von openai entfernt ist. obwohl die erfolge von zhipu ai bereits sehr selten sind, muss zhipu ai angesichts des neuen modells der o1-serie zweifellos härter arbeiten.

2. der preiskampf verschärft sich

seit mai 2024 dauert der preiskampf im bereich der großmodelle bereits seit mehr als vier monaten an, wodurch immer mehr große modellbauunternehmen in den strudel der preiskämpfe verwickelt werden.

dieser preiskampf begann mit deepseek, einem ki-unternehmen im besitz des private-equity-riesen magic square quantitative. am 6. mai kündigte deepseek das open-source-moe-großmodell deepseek-v2 der zweiten generation an, dessen preis fast 1 % des gpt-4-turbo beträgt und nur 1 yuan für eine million token.

zhipu ai folgte diesem beispiel. am 11. mai gab zhipu ai bekannt, dass der call-preis der persönlichen version von glm-3 turbo von 5 yuan/million token auf 1 yuan/million token gesenkt wurde. beim zhipu ai open day am 5. juni gab zhipu ai erneut bekannt, dass der preis für die vollständige modellmatrix gesunken sei. unter anderem wurde der preis für glm-4-air und glm-3-turbo auf 0,6 yuan/million token gesenkt, der preis für das embedding-2-modell lag bei nur 0,3 yuan/million token und der preis für das glm-4-flash-modell ist auf nur 0,06 yuan/million token gefallen.

bytedance hat sich ebenfalls dem preiskampf angeschlossen und bekannt gegeben, dass der preis für das hauptmodell von doubao (doubao universal model pro) auf dem unternehmensmarkt bei 0,0008 yuan/tausend token liegt und damit 99,3 % unter dem branchendurchschnittspreis liegt gleiche spezifikationen auf dem markt. der preis beträgt im allgemeinen 0,12 yuan/tausend token, was dem 150-fachen preis des sitzsackmodells entspricht.

seitdem haben alibaba, tencent, baidu und iflytek preissenkungen für große modelle angekündigt. beispielsweise reduzierte alibaba cloud den input-preis von qwen-long auf 0,0005 yuan/tausend token, und der output-preis sank um 90 % auf 0,002 yuan/tausend token; baidu smart cloud kündigte zwei hauptmodelle des wenxin large model an, enire speed und enire lite kostenlos und offen.

openai ist auch die treibende kraft im preiskampf. sein gpt-4o-preis wurde im vergleich zu gpt-4-turbo erneut halbiert. dies ist die vierte preissenkung von openai seit anfang 2023. nach den erwartungen von openai werden seine großen modelle weiterhin jedes jahr um 50–75 % reduziert.

es ist erwähnenswert, dass der anhaltende preisverfall bei großen modellen zwar voraussichtlich zu einer schnelleren kommerzialisierung führen wird, preiskämpfe jedoch häufig dazu führen, dass große modellunternehmen preiszugeständnisse machen müssen. für zhipu ai ist die eigene rentabilität entscheidend wenn wir uns weiterhin auf preiskämpfe einlassen, können die gewinne weiter sinken und es wird schwieriger, rentabilität zu erzielen.

im gegensatz dazu hat der preiskampf möglicherweise weniger auswirkungen auf openai. schließlich gab openai-ceo sam altman bereits im dezember 2023 bekannt, dass der aktuelle monatliche umsatz hunderte von millionen dollar erreicht hat, und der jahresumsatz ist möglicherweise sehr hoch 1,5 milliarden überschreiten. auch drittinstitutionen gehen davon aus, dass sich der umsatz von openai im jahr 2024 wahrscheinlich mehr als verdoppeln wird als im jahr 2023, wobei optimistische schätzungen 5 milliarden us-dollar erreichen.

es ist absehbar, dass es zhipu ai aufgrund des preiskampfs und der technischen lücke im jahr 2024 möglicherweise nicht leicht haben wird. zhang peng räumte auch ein, dass die herausforderungen, vor denen zhipu ai im jahr 2024 stehen wird, sehr schwierig sein werden: einerseits wird openai dies tun im jahr 2024 große anerkennung finden. die technologie in bezug auf wissen und superausrichtung wird neue durchbrüche erzielen, was erfordert, dass zhipu ai die technologie kontinuierlich iteriert und in die fußstapfen der weltspitze tritt. andererseits werden große modelle im jahr 2024 eine welle der kommerzialisierung einleiten , und die kommerzialisierung von zhipu ai der wettbewerbsdruck wird ebenfalls zunehmen.

3. ökologische investitionen beschleunigen

produktlayout und investitionslayout sind die beiden hauptlinien für die kommerzialisierung von zhipu ai.

zhang peng erklärte einmal öffentlich die anlageideen von zhipu ai: „wir hoffen, ein großes modell-ökosystem zu schaffen, in dem wir hand in hand mit unseren partnern zusammenarbeiten, um das ökosystem immer größer zu machen.“ zur geschäftsvision für 2024 sagte zhang peng: „es ist unsere wichtige aufgabe, das große modell wirklich praktisch und fundiert zu gestalten.“

im jahr 2024 wird zhipu ai einen open-source-großmodell-open-source-fonds auflegen. der plan umfasst drei „1000er“: zhipu ai wird der großen modell-open-source-community 1.000 computerkarten zur verfügung stellen, um die open-source-entwicklung zu unterstützen wird zur unterstützung von open-source-projekten im zusammenhang mit großen modellen verwendet; stellt herausragenden open-source-entwicklern 100 milliarden kostenlose api-tokens zur verfügung. zhang peng sagte, dass der zweck des large model open source fund darin bestehe, große fortschritte in der forschung und entwicklung großer modelle zu fördern und den wohlstand des gesamten open-source-ökosystems großer modelle zu fördern.

angesichts globaler großer modellunternehmer wird zhipu ai den „z-plan“ aktualisieren und mit ökologischen partnern einen großen modellunternehmerfonds in höhe von insgesamt 1 milliarde yuan auflegen, um die ursprüngliche innovation großer modelle zu unterstützen, der große modellalgorithmen, zugrunde liegende betreiber usw. abdeckt chipoptimierung, industrie-großmodelle und superanwendungen.

im august 2024 gab zhang peng auf der unternehmens-roadshow-tagesveranstaltung „z plan“ von zhipu ai offiziell bekannt, dass zhipu ai und ökologische partner den agi ecological fund: z fund ins leben rufen werden, um mehr frühphasenprojekte mit potenzial für großmodelle zu unterstützen spuren. am 3. september schloss der hersteller humanoider roboter eine angel-runde im wert von mehreren zehn millionen yuan ab. der hauptinvestor war z fund. dies ist auch die erste externe investition des z fund. bisher hat zhipu ai in das ki-modellschichtunternehmen „lingxin intelligence“, den anbieter intelligenter rechtsdienstleistungsprodukte „power law intelligence“, den software- und informationstechnologiedienstleister „sudao intelligence“ und den anbieter generativer ki-anwendungen investiert „shengshu technology“ und weitere 11 unternehmen.

objektiv gesehen ist die investition in die gesamte industriekette eine möglichkeit, die situation zu überwinden, wenn die unterstützenden einrichtungen der industriekette nicht ausreichen. der wichtigere weg, die situation zu überwinden, liegt jedoch darin, produkte zu schaffen, die die vorstellungskraft der benutzer erweitern, und wie man sie umsetzt diese produkte in produktivität umsetzen. dies wird die nächste frage sein, die zhipu ai beantworten muss.

nachricht

zhipu ai ist verrückt nach openai und muss bis zum tod kämpfen

einführung

meine kontaktdaten