Was ist der Kampf um Open und Closed Source für große Modelle?
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Streitigkeiten können den Marktwert des anderen nicht leugnen. Die beiden Marktbedürfnisse werden für lange Zeit nebeneinander bestehen.
Text |. Wu Junyu Xu Wenpu
Seit diesem Jahr haben Unternehmer, Investoren und Unternehmer der KI-Branche (künstliche Intelligenz) in China und den Vereinigten Staaten gleichzeitig eine Debatte darüber begonnen, ob große Modelle Open Source oder Closed Source sein sollten.In China steht im Mittelpunkt der Kontroverse der Baidu-Gründer Robin Li. Im April dieses Jahres erklärte er öffentlich: „Jeder hat früher Open Source verwendet und dachte, Open Source sei billig. Tatsächlich ist Open Source in groß angelegten Modellszenarien am teuersten. Das Open-Source-Modell wird immer rückständiger.“ An Widerstand gegen diese Auffassung mangelt es nicht. Zu den Gegnern zählen Zhou Jingren, CTO (Chief Technology Officer) von Alibaba Cloud,Baichuan-GeheimdienstCEO Wang Xiaochuan und Cheetah Mobile-CEO Fu Sheng. Im Mai dieses Jahres sagte Zhou Jingren in einem Medieninterview unverblümt: „Es besteht kein Zweifel daran, dass Open Source zur globalen Technologie und Ökologie beiträgt. Das wurde weltweit schon oft bewiesen, und es besteht kein Grund mehr, darüber zu diskutieren.“In den USA ist die Debatte noch hitziger. Tesla-Gründer Musk hat einst KI-Startups verklagtOpenAI. Musk war 2015 einer der Hauptgründer und Investoren von OpenAI. Er glaubt, dass OpenAI unter der Leitung des derzeitigen CEO Altman gegen seine Verpflichtung verstoßen hat, „als gemeinnützige Organisation zu agieren und KI Open Source und Open Source zu machen“. Zwei bekannte Investoren im Silicon Valley, Andreessen, der Gründer von a16z, und Kosla, der Gründer von Kleiner Perkins Caufield & Byers, hatten in den sozialen Medien viele Konfrontationsrunden. Ersterer glaubt, dass das Closed-Source-Modell zu einem Monopol der Giganten führen und die akademische Forschung untergraben wird. Letzterer ist der Ansicht, dass große Modelle wirtschaftliche Waffen sind und nicht Open Source sein sollten.
Open Source ist ein Softwareentwicklungsmodell – der Quellcode wird kostenlos veröffentlicht und lebt von Spenden der Community. Entwickler können Software frei herunterladen, ändern und verteilen, Softwarefehler (Softwaredefekte oder Fehler) melden und Optimierungsvorschläge machen. Diese kollektive Innovation wird die Software-Iteration beschleunigen.Open-Source-Modelle beziehen sich auf Modelle, die kostenlos genutzt werden können und über veröffentlichte technische Details wie Modellparameter verfügen; Closed-Source-Modelle beziehen sich auf Modelle, die kostenpflichtig sind und keine technischen Details veröffentlichen.Verstehen Sie einfach, dass Open Source kostenlos ist, aber Sie müssen Ihr eigenes Essen kaufen und kochen. Bei Closed Source geht es darum, zu bezahlen, was einem Restaurantbesuch entspricht, und Sie können bessere Dienstleistungen erhalten.Sollten große Modelle Open Source oder Closed Source sein? Kommerzielle Interessen, technische Meinungen und andere Faktoren wurden vermischt, so dass viele Fakten verwechselt wurden – hinter dieser Debatte stehen jedoch einige bestimmte Fakten.Erstens ermöglichen unterschiedliche Geschäftsstrategien Unternehmen, unterschiedliche technische Wege zu wählen.Unternehmen wie Baidu und OpenAI, die auf eine schnelle Kommerzialisierung großer Modellunternehmen hoffen, haben sich für Closed Source entschieden; Alibaba Cloud, Meta und andere Unternehmen vertrauen daraufCloud-ComputingOder Unternehmen mit profitablem Werbegeschäft entscheiden sich für Open Source, um den Kuchen größer zu machen.Zweitens werden die Marktanforderungen von Open Source und Closed Source noch lange nebeneinander bestehen, und es ist unmöglich, einfach zu beurteilen, welches besser ist.Open-Source- und Closed-Source-Modelle haben ihre eigenen anwendbaren Szenarien, und welches Modell ausgewählt werden soll, hängt von der Marktnachfrage ab. Dies ändert sich nicht nach dem Willen des Modellherstellers.Drittens gibt es wesentliche Unterschiede zwischen Open-Source-Modellen und Open-Source-Software.Open-Source-Software veröffentlicht den Quellcode und die meisten technischen Details. Das Open-Source-Modell ähnelt eher einer kostenlosen technischen Blackbox – die Modellparameter sind offen, aber der Quellcode, die Trainingsdaten, der Trainingsprozess und andere technische Details sind selten offen.Darüber hinaus geht es beim Kampf zwischen offenen und geschlossenen Quellen in Chinas KI-Industrie eher um kommerziellen Wettbewerb.Open Source kennt keine Grenzen, dieses Konzept ist allgemein anerkannt. Allerdings wird im Kontext des verschärften Wettbewerbs zwischen China und den USA in der KI-Branche der Widerstand der US-Industrie gegen Open Source immer lauter.
Wer ist Open Source und wer Closed Source?Die Entwicklung großer Modelle steckt noch in den Kinderschuhen und erfordert noch Versuch und Irrtum.Open Source und Closed Source sind nicht zu unterscheiden. Wenn Unternehmen vor der Multiple-Choice-Frage Open Source und Closed Source stehen, gehen sie drei unterschiedliche Wege.Das Extremste ist, nur Open-Source-Modelle zu erstellen. Es gibt relativ wenige Unternehmen, die diesen Weg gehen, und Meta ist eines der wenigen. Der Vorteil besteht darin, dass es mehr Nutzer anzieht. Das Problem ist, dass es kein Gewinnmodell gibt und es sich nur große Unternehmen leisten können.Llama 3, im Besitz von Meta, ist das Open-Source-Modell mit den meisten Benutzern weltweit. Das Hauptgeschäft von Meta sind soziale Medien (wie Facebook, Instagram), wobei der Nettogewinn im Jahr 2023 39 Milliarden US-Dollar erreichen wird. Meta hat den Drang, neue Geschäftsfelder zu erkunden, aber es besteht kein Druck, mit Modellen Geld zu verdienen. Daher kann es nur das Open-Source-Modell verwenden und Rentabilitätsaspekte vorerst nicht berücksichtigen.Ein Mittelweg ist die parallele Nutzung von Open Source und Closed Source, was sehr flexibel ist. Unternehmen können nicht nur Benutzer über Open Source gewinnen, sondern auch Einnahmen über Closed Source erzielen. Dies gibt nicht nur Entwicklern Spielraum für Wahlmöglichkeiten, sondern ermöglicht den Unternehmen auch Spielraum für Fehler.Zu den Unternehmen, die sich für diesen Weg entscheiden, gehören Microsoft, Google, Alibaba Cloud, Tencent Cloud sowie KI-Startups wie Mistral Al, Zhipu AI und Baichuan Intelligence. Eine gängige Praxis bei der Parallelisierung von Open Source und Closed Source besteht darin, kostenlose Open-Source-Modelle zu verwenden, um Benutzer anzulocken und Benutzer dazu zu bringen, größere und leistungsstärkere Closed-Source-Modelle zu verwenden. Das wichtigste kommerzielle Modell von Microsoft ist beispielsweise die GPT-4-Serie von OpenAI, aber es hat auch das kleine Modell Phi-3 Mini als Open-Source-Modell bereitgestellt. Alibaba Cloud hat mehr als zehn Modelle mit Parametern zwischen 500 Millionen und 110 Milliarden als Open-Source-Modell bereitgestellt und bietet auch Open-Source-Modelle ein Closed-Source-Modell, ein Industriemodell; Google hat auch die Closed-Source-Modellreihe Gemini für große Start-up-Unternehmen wie Mistral Al mit Open-Source-Modellen bereitgestellt Leistung in der vorherigen Generation und führte Benutzer dazu, für die Verwendung von Modellen mit stärkerer Leistung in dieser Generation zu bezahlen.Das Problem bei Open Source und Closed Source besteht darin, dass die Kommerzialisierung manchmal konkurrierende Anstrengungen erfordert. Einige Kunden haben kostenlose Open-Source-Modelle verwendet und werden keine kostenpflichtigen Closed-Source-Modelle mehr verwenden. Den Modellherstellern wird dadurch ein Teil ihrer Einnahmen entgehen.Ein Techniker eines chinesischen KI-Softwaredienstleisters teilte Caijing im Juli dieses Jahres mit, dass er kürzlich das Open-Source-Modell Tongyi Qianwen (Qwen2) von Alibaba Cloud für sekundäre Schulungen und Feinabstimmungen verwendet habe, um ein lokales Tourismusbüro in der Stadt zu bedienen. Dieser Auftrag übersteigt 10 Millionen Yuan und sie sind die Begünstigten, aber Alibaba Cloud hat kein Einkommen. „Caijing“ erkundigte sich nach der Lizenzvereinbarung von Qwen2 auf Github (der weltweit größten Code-Hosting-Plattform). In der Vereinbarung heißt es: „Kein Antrag auf kommerzielle Nutzung erforderlich.“ Mit anderen Worten: Nach dem Training und der Feinabstimmung von Qwen2 besteht keine Notwendigkeit, für die kommerzielle Nutzung zu bezahlen.Der langfristige Wert von Open Source besteht darin, den Modellmarkt zu vergrößern. Ein Mitarbeiter von Alibaba Cloud erklärte gegenüber Caijing, dass es für Benutzer normal sei, Open-Source-Modelle für die kommerzielle Nutzung zu modifizieren, und dass man darauf vorbereitet sein müsse, wenn man Open Source verwende. Obwohl Alibaba Cloud noch nicht den ganzen Kuchen aufgegessen hat, hat es den Branchenkuchen größer gemacht. Auf lange Sicht wird es letztendlich davon profitieren. Chemische Reaktionen werden nur dann auftreten, wenn große Modelle von verschiedenen Kunden wie Regierungen, großen und mittleren Unternehmen und Entwicklern in großem Umfang genutzt werden. Große Modellindustrien müssen eine Ökologie etablieren und ein Wachstumsschwungrad bilden. Dieser Trend lässt sich in ModelScope beobachten, einer KI-Open-Source-Community im Besitz von Alibaba Cloud. Im Juli dieses Jahres zählt die Moda-Community mehr als 5,6 Millionen Entwickler, mehr als 5.500 hochwertige Modelle und Tausende von Datensätzen und ist damit die größte Open-Source-Modell-Community in China.Eine optimistischere Ansicht ist, dass Open Source und Closed Source sogar eine Upstream- und Downstream-Beziehung eingehen können. Open Source steht im Upstream der Technologie und ist für die Beteiligung der Community, die Technologieiteration, die Gewinnung von Kunden und die Sicherstellung, dass die Technologie ihren Mitbewerbern voraus ist, verantwortlich. Closed Source ist nachgelagert und für die kommerzielle Umsetzung verantwortlich.Lanzhou Technology ist ein großes Modell-Startup-Unternehmen in China. Li Jingmei, Partner und Co-CEO von Lanzhou Technology, sagte gegenüber Caijing, dass Open Source sowohl eine technische Strategie als auch eine Geschäftsstrategie sei. Es kann sich sowohl auf die Entwicklergemeinschaft als auch auf die Psyche des technischen Teams potenzieller Kunden auswirken. Open Source und Closed Source sind kein Widerspruch. Der Kundenfeedbackzyklus für Closed-Source-Modelle ist relativ lang, Community-Entwickler von Open-Source-Modellen werden jedoch schnell Feedback geben. Dies kann Unternehmen dabei helfen, Produkte schnell zu iterieren.Ein strategischer KI-Planer bei einem führenden chinesischen Technologieunternehmen ist davon überzeugt, dass für führende Cloud-Anbieter wie Alibaba Cloud Open Source und Closed Source parallel besser sind als nur Closed Source. Der Umsatz von Alibaba Cloud stammt hauptsächlich aus den vier Hauptkomponenten der Public Cloud (Computing, Speicher, Netzwerk, Datenbank). Das kostenlose Open-Source-Modell wird den Geschäftsdatenverbrauch der Kunden fördern und so den Verkauf der oben genannten Basis-Cloud-Produkte ankurbeln.Nur die Erstellung von Closed-Source-Modellen ist ein einfacher, direkter und logischer Ansatz. Große Unternehmen, die diesen Weg einschlagen, glauben, dass große Modelle, wenn sie kommerzialisiert werden sollen, Closed-Source-Modelle sein müssen, da sonst der kommerzielle Kreislauf nicht geschlossen werden kann.Die KI-Startups OpenAI (seine Modelle der GPT-4-Serie), Amazon (investiert in das KI-Startup Anthropic, zu dem auch die Modelle der Claude 3.5-Serie gehören), Huawei (Modell Pangu), Baidu (Modell Wenxin) und andere Unternehmen haben diesen Weg gewählt. Unternehmen, die große Modelle nutzen, zahlen oft pro API-Aufruf (Application Programming Interface), was so ist, als würde man für Wasser, Strom und Gas nach Verbrauch bezahlen. Das Geschäftsmodell des Closed-Source-Modells ist theoretisch das gesündeste. Die Umsatzwachstumsraten von Microsoft Azure, Amazon AWS und Google Cloud sind im vergangenen Jahr um etwa 5 Prozentpunkte gestiegen, und auch ihre Gewinne sind leicht gestiegen. Es wird angenommen, dass dies auf eine große Modellzugkraft zurückzuführen ist.Doch in China ist es für das Closed-Source-Modell schwierig, kurzfristig wirklich profitabel zu sein. Im Mai dieses Jahres begann auf dem chinesischen Modellmarkt ein Preiskampf. Der Zweck der Preissenkung besteht darin, die Kundennachfrage anzukurbeln und die Marktgröße zu vergrößern. Die Cloud-Dienste Volcano Engine, Alibaba Cloud, Tencent Cloud und Baidu Smart Cloud von ByteDance haben den Preis für große Modellaufrufe sukzessive um mehr als 90 % gesenkt. Die Bruttogewinnmarge großer Modellaufrufe sank von über 60 % auf unter 0 %.Eine Person, die für das große Modellgeschäft eines chinesischen Cloud-Anbieters verantwortlich ist, glaubt, dass große Modellaufrufe in die „Ära des negativen Bruttogewinns“ eingetreten sind. Je mehr Sie es nutzen, desto größer werden Ihre Verluste. Der Unterschied besteht darin, dass große Unternehmen wie Alibaba, ByteDance und Baidu es sich leisten können, Geld zu verlieren, kleine und mittlere Unternehmen und Startups jedoch nicht.Er und ein großer Model-Startup-Manager vertraten eine ähnliche Ansicht – verschiedene Unternehmen hätten unterschiedliche Gene und unterschiedliche Model-Geschäftsstrategien. Cloud ist das Kerngeschäft von Alibaba Cloud, und das ultimative Ziel des Open-Source-Modells besteht darin, mehr Clouds zu verkaufen. Volcano Engine wird von ByteDance unterstützt und das Werbegeschäft der Muttergesellschaft kann übertragen werden. Der Cloud-Computing-Marktanteil von Volcano Engine ist weitaus geringer als der von Alibaba Cloud. „Es ist barfuß und hat keine Angst davor, Schuhe zu tragen“, und das Unternehmen hofft, durch Preiskämpfe weitere Marktanteile zu gewinnen. KI ist das Kerngeschäft von Baidu. Baidu hofft, mit großen Modellen Geld zu verdienen, und betont daher den Wert von Closed-Source-Modellen.
Was ist das Argument? Was ist der Konsens?In Chinas Open-Source- und Closed-Source-Debatte für große Modelle gibt es mehrere Schwerpunkte: Erstens: Gibt es einen Unterschied zwischen Open-Source-Modellen und Open-Source-Software? Zweitens: Welches ist stärker, das Open-Source-Modell oder das Closed-Source-Modell? Drittens: Welches ist teurer, das Open-Source-Modell oder das Closed-Source-Modell?Die erste Debatte ist: Gibt es einen Unterschied zwischen Open-Source-Modellen und Open-Source-Software? Die Antwort ist: Es gibt einen großen Unterschied. Die überwiegende Mehrheit der Open-Source-Modelle ist nicht vollständig Open Source. Sie ähneln eher Blackboxen, die kostenlos genutzt werden können, und nicht einer transparenten Box wie Open-Source-Software.Open-Source-Software veröffentlicht den Quellcode, und Entwickler können die meisten technischen Details der Software über den Quellcode beherrschen. Die Kernlogik kostenloser Open-Source-Software besteht darin, dass Entwickler aus der ganzen Gesellschaft Softwareherstellern helfen können, Produktfehler zu finden und Optimierungsvorschläge zu machen. Soziale Entwicklung kann nicht nur die Forschungs- und Entwicklungskosten für Software senken, sondern auch die Software-Iteration beschleunigen. Sowohl das mobile Betriebssystem Android als auch die Datenbanksoftware MySQL haben auf diese Weise Erfolge erzielt.Die Komplexität von Open-Source-Modellen geht weit über die von Open-Source-Software hinaus. Zu den Open-Source-Projekten gehören Quellcode, Parametergewichte, Modellstruktur, Trainingsdaten, Trainingsprozess usw. Zwei Wissenschaftler der Radboud-Universität in den Niederlanden, Lisenfeld und Dingemans, veröffentlichten im März dieses Jahres einen Artikel, in dem sie den Grad von Open Source in Open-Source-Modellen verglichen. Das Papier zeigt, dass die leistungsstärksten Open-Source-Modelle normalerweise nur Open-Source-Parametergewichte verwenden. Eine Erklärung dafür ist, dass die Modellhersteller nicht alle „Rezepte“ offenlegen können, um eine führende Modellleistung sicherzustellen. Nehmen Sie als Beispiel das weltweit leistungsstärkste Open-Source-Modell Llama3. Die Parametergewichte und die Modellstruktur sind nur teilweise offengelegt. Der Quellcode, die Trainingsdaten und der Trainingsprozess sind nicht offengelegt.
Es besteht kein Zweifel am Wert des Open-Source-Konzepts für die Industrieökologie.Xin Zhou, General Manager von Baidu Smart Cloud AI und der Plattform für große Modelle, sagte Caijing im Juli dieses Jahres, dass Open-Source-Modelle Modellanwendungen und Branchenmodelle reicher machen werden. Er lehnt es jedoch ab, das Open-Source-Modell mit Open-Source-Software zu vermischen.Denn es gibt einen wesentlichen Unterschied zwischen den beiden: Das Open-Source-Modell kann sich nicht wie Open-Source-Software auf die Beteiligung sozialer Entwickler verlassen, um die Produktleistung zu verbessern und die F&E-Kosten zu senken. Das Basismodell kann nur durch die eigene Schulung des Modellherstellers verbessert werden. Die Feinabstimmung und Inferenzoptimierung des Open-Source-Modells ist nicht so gut wie das kommerzielle Modell. Es stellt hohe technische Anforderungen an Entwickler und die tatsächlichen Nutzungskosten sind es nicht niedrig.Die zweite Debatte ist: Welches ist stärker, das Open-Source-Modell oder das Closed-Source-Modell? Tatsache ist, dass Closed-Source-Modelle im Allgemeinen eine bessere Leistung erbringen als Open-Source-Modelle, der Leistungsunterschied zwischen Open-Source- und Closed-Source-Modellen jedoch kleiner wird.
Das Center for Research on Fundamental Models (CRFM) der Stanford University führt seit langem weltweite Rankings für große Modelltests durch. Die am 24. Juli veröffentlichten groß angelegten MMLU-Testrankings (Multi-Task Language Understanding) zeigen, dass unter den zehn besten Leistungsmodellen nur Llama3.1 ein Open-Source-Modell ist, darunter Claude3.5 (von Amazon investiert) und GPT -4o (von Microsoft investiert) und Gemini1 5 Pro (selbst entwickelt von Google) und andere sind Closed-Source-Modelle.Li Jingmei ist der Ansicht, dass das Closed-Source-Modell desselben Unternehmens eine bessere Leistung aufweisen muss als das Open-Source-Modell. Allerdings sind Closed-Source-Modelle im horizontalen Branchenvergleich nicht unbedingt besser als Open-Source-Modelle. Da große Modelle alle 6 bis 12 Monate iteriert werden, entwickeln sich einige Open-Source-Modelle möglicherweise schneller.
Rankings von Bewertungsorganisationen verdeutlichen diesen Trend. Die LMSYS-Organisation (Large Model System Research Organization) wurde von der University of California, Berkeley, ins Leben gerufen. Die Organisation wird seit langem auch die globale Modellleistung bewerten und bewerten. Llama3.1 von Meta und Qwen2 von Alibaba Cloud verbessern sich in den Rankings dieser Bewertung rasant. Llama3.1 übertrifft sogar die meisten Closed-Source-Modelle.Eine Person, die für das große Modellgeschäft eines chinesischen Cloud-Anbieters verantwortlich ist, analysierte, dass es zwei Gründe gibt, warum sich die Leistungslücke zwischen Open-Source-Modellen und Closed-Source-Modellen verringert hat. Im vergangenen Jahr sind grundlegende große Modelle generell in eine Engpassphase geraten Leistungsverbesserung. Das Open-Source-Modell zieht eine große Anzahl von Entwicklern an. Obwohl sie die Modellleistung nicht direkt durch Code-Feedback verbessern können, verbessern sie das Gesamtniveau der Modellforschung, was indirekt dazu beiträgt, dass Open-Source-Modelle die Modellleistung verbessern.Die dritte Debatte ist: Open-Source-Modell oder Closed-Source-Modell, welches ist teurer? Die Schlussfolgerung ist, dass die Leistung der entscheidende Faktor ist. Die Kosten für die Modellnutzung stehen in direktem Zusammenhang mit der Modellleistung. Je höher die Leistung, desto geringer sind die langfristigen Nutzungskosten, da weniger Anrufe zur Erledigung der Aufgabe erforderlich sind.Open-Source-Modelle sind kostenlos und erwecken oft den Eindruck, billiger und kostengünstiger zu sein. Xin Zhou erklärte, dass es sich bei der großen Modellanwendung um eine umfassende Lösung inklusive „Technologie + Service“ handele und das Unternehmen das „Hauptbuch“ berechnen müsse. Neben der Bereitstellung kompletter Modelle und Toolketten bieten Hersteller von Closed-Source-Modellen auch Schulungen und technische Dienstleistungen an, um Unternehmen einen schnellen Einstieg zu ermöglichen. Das Open-Source-Modell scheint kostenlos zu sein, aber um den gleichen Effekt wie Closed-Source zu erzielen, sind große Folgeinvestitionen in Personal, Geld und Zeit erforderlich, und die Gesamtkosten sind höher.Der entscheidende Faktor für die Anwendungskosten von Open-Source- und Closed-Source-Modellen sind auf lange Sicht die Inferenzkosten. Closed-Source-Modelle mit derselben Parametergröße weisen in der Regel eine bessere Leistung als Open-Source-Modelle auf und weisen geringere Gesamtkosten auf. Xin Zhou hat berechnet, dass die Bereitstellung eines Closed-Source-Modells 500.000 Yuan kostet, wenn ein Unternehmen ein Open-Source-Modell kostenlos bereitstellt. In der ersten Investitionsphase ist das Open-Source-Modell günstiger. Wenn in der späteren Nutzungsphase die Gesamtleistung des Closed-Source-Modells um 20 % besser ist als die des Open-Source-Modells, kann das Closed-Source-Modell in einigen Großunternehmen Zehntausende Yuan pro Tag einsparen . Letztendlich müssen die langfristigen Nutzungskosten deutlich niedriger sein als beim Open-Source-Modell.
Wer nutzt das Open-Source-Modell? Wer nutzt das Closed-Source-Modell?Ist das Open-Source-Modell besser oder das Closed-Source-Modell? Über diese Frage entscheiden nicht die angebotsseitigen Modellhersteller, sondern die nachfrageseitigen Unternehmenskunden.In der Öffentlichkeit gehen die Wortgefechte der Unternehmen weiter. Viele technische Mitarbeiter von Cloud-Anbietern sagten Caijing jedoch, dass diese Argumente den Marktwert des anderen nicht leugnen können. Diese beiden Bedürfnisse werden noch lange nebeneinander bestehen. Aus einer anderen Perspektive betrachtet erleichtert ein Wortgefecht die gemeinsame Steigerung der Marktsichtbarkeit.Tatsächlich ist es den meisten Unternehmenskunden egal, ob das Modell Open Source sein muss. Xin Zhou kam zu dem Schluss, dass er nach der Kommunikation mit vielen großen Unternehmenskunden herausfand, dass es von vielen Faktoren abhängt, ob der Leiter der IT-Abteilung ein Modell verwenden sollte. Die Rangfolge in der Reihenfolge der Priorität ist normalerweise: Wirkung, Leistung, Preis und Sicherheit. Open Source oder Closed Source ist kein entscheidender Faktor.Im „Werkzeugkasten“ der meisten Unternehmen ergänzen sich Open-Source-Modelle und Closed-Source-Modelle. Die Implementierung großer Modelle durch große Unternehmen gliedert sich üblicherweise in verschiedene Phasen.In einem frühen Stadium wird die IT-Abteilung die Leistung und Eigenschaften der Open-Source- und Closed-Source-Modelle auf dem Markt klären. Verschiedene Modelle haben unterschiedliche Vorteile. Einige verfügen über starke Sprachaussprachefähigkeiten und andere über starke Datenstatistikfähigkeiten. Kostenlose Frühphasen-POC-Tests (Proof of Concept) für Open-Source-Modelle zur Überprüfung der geschäftlichen Auswirkungen.Mittelfristig beginnen wir mit der ersten Phase von Projekten in Geschäftsszenarien mit geringem Schwierigkeitsgrad und schnellen Ergebnissen, wie z. B. Marketing, Kundenservice und Wissensdatenbank. Sie müssen nicht nur ein Closed-Source-Modell erwerben, sondern auch Ihr eigenes Open-Source-Modell trainieren und optimieren. Lassen Sie interne und externe Modelle gegeneinander antreten, vergleichen Sie die Auswirkungen und Kosten verschiedener Modelle und wechseln Sie jederzeit die Nutzung.In der späteren Phase werden wir basierend auf den Implementierungsergebnissen schrittweise die Projekte der zweiten und dritten Phase in Geschäftsszenarien planen, die schwierig sind und nur langsam Ergebnisse liefern. Derzeit ist es oft sogar notwendig, mehrere zehn Millionen Yuan auszugeben, um eine Reihe unabhängiger und steuerbarer Basis-Großmodelle oder Industrie-Großmodelle zu etablieren.Das Open-Source-Modell ist kostenlos, kann jedoch nicht sofort verwendet werden, erfordert Zeit und Mühe und niemand ist für die Details verantwortlich. Das Closed-Source-Modell kann ausgereifte Produkte direkt beziehen und umfassende Dienstleistungen vor, während und nach dem Verkauf anbieten. Um es einfach zu verstehen: Das Open-Source-Modell ist so, als würde man Lebensmittel kaufen und selbst kochen, während das Closed-Source-Modell so ist, als würde man Geld ausgeben, um in einem Restaurant zu essen.Xin Zhous Standpunkt ist, dass das Open-Source-Modell für die akademische Forschung, für einige kleine und mittlere Unternehmen mit äußerst begrenzten IT-Budgets und für einige große Unternehmen für unabhängige und kontrollierbare interne Selbstforschungsprojekte geeignet ist, dies jedoch nicht Geeignet für große externe kommerzielle Projekte. Bei einigen ernsthaften kommerziellen Projekten, die Millionen oder mehrere zehn Millionen Dollar kosten, ist das Closed-Source-Modell immer noch die beste Wahl.Das Open-Source-Modell ist kein kostenloses Mittagessen. Für große Unternehmen, die das Open-Source-Modell nutzen, gibt es viele versteckte Kosten. Zum Beispiel der Kauf von Rechenleistung, Softwareanpassungen usw. Ein technischer Direktor eines chinesischen Anbieters intelligenter Marketingdienstleistungen im Ausland sagte Caijing im Juli dieses Jahres, dass sein Unternehmen stark auf Cloud-Dienste angewiesen sei und jedes Jahr mehr als 80 Millionen Yuan für Forschung und Entwicklung ausgibt. In den letzten zwei Jahren hat das Unternehmen mehr als zehn Closed-Source-Modelle gleichzeitig verwendet, darunter jedoch kein Open-Source-Modell. Seiner Ansicht nach erfordert das Open-Source-Modell Zeit und Arbeitskraft, um daran zu arbeiten. Die meisten Open-Source-Modelle können nicht sofort verwendet werden, niemand kennt die Details und kann nur als „Spielzeug“ betrachtet werden. Er verwaltet in der Regel mehr als ein Dutzend Closed-Source-Modelle und wechselt diese jederzeit je nach Preis und Leistung. Dies ist am kostengünstigsten.Ein IT-Leiter einer großen Aktienbank meint, dass es kein großes Problem sei, dass das Open-Source-Modell nicht sofort einsetzbar sei. Er teilte Caijing im Dezember 2023 mit, dass sein Team auch Alibaba (Tongyi-Open-Source-Modell), Meta (Llama-Open-Source-Modell), Baidu (Wenxin-Serie) und Zhipu (GLM-Serie) für die eigene Entwicklung von Compliance-Reporting-Audit-Anwendungen nutzte. Für solche kleinen Projekte eignet sich das Open-Source-Modell, da es kostenlose POC-Tests ermöglicht und bei Bedarf modifiziert werden kann. Sein IT-Team besteht aus Dutzenden von Mitarbeitern sowie einem ausgelagerten IT-Dienstleistungsunternehmen, das über genügend Arbeitskräfte verfügt, um diese Probleme zu bewältigen. Er glaubt aber auch, dass bei Großprojekten im Wert von einer Million oder zehn Millionen Yuan das Closed-Source-Modell besser geeignet ist. Da das Closed-Source-Modell stabil und zuverlässig ist, können Sie auch ein Modellunternehmen finden, das sich um die Betreuung kümmert.Es kostet mehrere zehn Millionen Yuan, eine Reihe von Industriemodellen mithilfe von Open-Source-Modellen vollständig zu trainieren, und erfordert außerdem den Kauf von KI-Chips, um einen selbstgebauten Computerraum zu bauen. Die oben genannten Techniker von KI-Softwaredienstleistern kamen zu dem Schluss, dass das Open-Source-Modell für einige zentrale staatliche Unternehmen geeignet ist, die hohe Anforderungen an Datensicherheit, Autonomie und Kontrolle stellen und nicht so kostenempfindlich sind. Sie werden Open-Source-Modelle verwenden, um ihre eigenen Branchenmodelle zu trainieren. Denn „Open-Source-Modell + Private Cloud“ erfüllt die Anforderungen vieler zentraler und staatlicher Unternehmen an Datensicherheit und unabhängige Kontrollierbarkeit.
Die Debatte zwischen offenen und geschlossenen Quellen großer Modelle auf dem chinesischen Markt ist eine rein kommerzielle Frage. Auf dem internationalen Markt geht es jedoch bei der Auseinandersetzung zwischen großen Modellen offener und geschlossener Quellen um weitere Faktoren wie Kartellrecht und nationale Interessen.Nach dem Preiskampf im Mai dieses Jahres sind Chinas große Modellgeschäfte in die „Ära negativer Bruttogewinne“ eingetreten. Sowohl Open-Source- als auch Closed-Source-Modelle stehen vor einem Problem: Große Modelle können keine direkten Gewinne erzielen.„Der Knockout-Wettbewerb auf dem Großmodellmarkt hat begonnen.“ Ein Verantwortlicher für das Großmodellgeschäft eines chinesischen Cloud-Anbieters analysierte, dass der negative Bruttogewinn für Großmodellabrufe dazu führt, dass kurzfristig mehr Abrufe getätigt werden größer sind die Verluste für Cloud-Anbieter. Chinesische Cloud-Anbieter gehen davon aus, dass die Zahl der großen Modellaufrufe in den nächsten ein bis zwei Jahren exponentiell ansteigen wird, nachdem der Preis für große Modellaufrufe um 90 % gesenkt wurde. Langfristig gesehen werden die Rechenleistungskosten der Cloud-Anbieter mit der steigenden Kundennachfrage verwässert und sie können am Ende dennoch positive Gewinne erzielen. Selbst wenn diese Wette nicht wahr wird, wird eine Gruppe von Modellherstellern im Preiskampf sterben und die überlebenden Hersteller werden die Scherben aufsammeln.Viele Brancheninsider äußerten gegenüber Caijing die gleiche Ansicht. Diese Eliminierungsrunde wird ein bis zwei Jahre dauern, und nur drei bis fünf grundlegende Modellunternehmen können weiterhin überleben.An Xiaopeng, Vorstandsmitglied von China Informatization Baihui und Direktor des Alibaba Cloud Intelligent Technology Research Center, sagte Caijing im Juli dieses Jahres, dass es in China keinen Krieg mit Hunderten von Modellen oder gar einen Krieg mit zehn Modellen gäbe. Große Modelle erfordern kontinuierliche Investitionen, haben eine Kapazität von 10.000 oder sogar 100.000 Karten und erfordern kommerzielle Renditen. Viele Unternehmen verfügen nicht über solche Fähigkeiten. Künftig wird es auf dem chinesischen Markt nur noch drei bis fünf Basismodellhersteller geben.Wer profitiert vom Preiskampf? Wer wird zuletzt lachen? Die oben genannten KI-Strategieplaner von Chinas führenden Technologieunternehmen glauben, dass in dieser Runde des Preiskampfs die Volcano Engine von Alibaba Cloud und ByteDance am meisten Blut hat. Alibaba Cloud kann mit der Cloud Geld verdienen und Volcano Engine verfügt über das Werbegeschäft von Bytedance. Im Preiskampf ist Baidu nicht so gut wie Alibaba und ByteDance. Das große Wenxin-Modell von Baidu verfügt jedoch über eine starke Technologie und wird eine Gruppe von Kunden haben, die bereit sind, für die Technologie zu zahlen. Dies wird Baidu helfen, den Preiskampf zu überstehen. Er erklärte weiter, dass diese großen Modell-Startups auf dem chinesischen Markt in den nächsten ein bis zwei Jahren vor harten Prüfungen stehen werden. Große Modell-Startups können sich entweder dafür entscheiden, projektbasierte Modellentwicklungsunternehmen zu werden oder auf vertikale Branchenmodelle umzusteigen.Der Gesamtwettbewerb auf Chinas großem Modellmarkt ist weitaus wichtiger als der lokale Wettbewerb zwischen Open-Source- und Closed-Source-Modellen. Die Richtung des globalen Wettbewerbs bestimmt direkt das Ergebnis des lokalen Wettbewerbs.Ein Mitarbeiter von Alibaba Cloud sagte unverblümt, dass sowohl Open-Source- als auch Closed-Source-Modelle ihre eigenen Vorteile haben und Alibaba Cloud hofft, KI integrativer zu machen. Unabhängig von Open Source oder Closed Source besteht der Hauptzweck darin, Entwicklern mehr Auswahlmöglichkeiten zu bieten. Alibaba Cloud hat sich dafür entschieden, auf zwei Beinen zu gehen: Open Source und Closed Source. Es verfügt sowohl über vollwertige, vollmodale Open-Source-Modelle als auch über Closed-Source-Modelle. Ein anderer Verantwortlicher des großen Modellgeschäfts eines chinesischen Cloud-Anbieters ist der Ansicht, dass Open Source kein Geschäftsmodell habe. Auf dem chinesischen Modellmarkt können nur führende Unternehmen oder eine sehr kleine Anzahl von Startups, die nachhaltig Gelder beschaffen können, auf Open Source bestehen. Am Ende gibt es möglicherweise nur noch 1-2 Open-Source-Modelle auf dem chinesischen Markt.Modellhersteller bilden fast alle 6–12 Monate eine neue Generation von Modellen aus. Da auf dem chinesischen Modellmarkt der Druck, Gewinne zu erzielen, zunimmt, werden Open-Source-Modelle möglicherweise immer „strategischer“ – Unternehmen tendieren dazu, Open-Source-Modelle mit rückständiger Technologie und kleineren Parametern in der vorherigen Generation zu verwenden, und leiten Benutzer dazu an, darauf zu zahlen Verwenden Sie Technologie-Updates und Parameter.Der Wettbewerb zwischen Open-Source- und Closed-Source-Modellen wird so schnell nicht enden. Einige Unternehmen können sogar gleichzeitig Open Source und Closed Source betreiben.In der IT-Branche ist dies nicht ohne Beispiel. Es ist mehr als 60 Jahre her, dass die Datenbank geboren wurde, und es ist mehr als 50 Jahre her, seit die erste Open-Source-Datenbank geboren wurde. Der Datenbankmarkt ist derzeit mit verschiedenen Closed-Source- und Open-Source-Datenbanken aktiv, und es entstehen immer wieder neue Datenbankmarken. Der Datenbankriese Oracle verfügt sogar sowohl über eine Closed-Source-RDBMS-Datenbank als auch über eine Open-Source-MySQL-Datenbank.Viele Techniker von Cloud-Anbietern glauben, dass Open-Source-Modelle und Closed-Source-Modelle noch lange nebeneinander existieren werden. Der große Modellmarkt wird angesichts der Konkurrenz verschiedener technischer Routen schrittweise wachsen.