nachricht

wie kann baidu im kampf um die einführung großer modelle durchbrechen?

2024-09-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

sind große modelle nach mehr als einem jahr forschung wirklich „populär“?

in bezug auf große modelle scheint es endlose streitigkeiten zu geben: „große parameter“ verfolgen oder „skalierungsgesetz“ in betracht ziehen? welches framework ist besser, „dicht“ oder „sparse“? „sprache“ oder „multimodalität“: wer ist die wahre zukunft großer modelle? die spieler haben eine klare haltung und ihre eigene meinung, aber diese popularität scheint sich nie auf den etablierteren markt übertragen zu haben.

unter den großen herstellern ist baidu einer der wenigen, die den modellbau im großen maßstab umgesetzt haben – laut dem heute veröffentlichten finanzbericht von baidu für das zweite quartal 2024 wies das unternehmen einen gesamtquartalsumsatz von 33,9 milliarden yuan aus, der kernumsatz von baidu belief sich auf 26,7 milliarden yuan. der betriebsgewinn von baidu core belief sich auf 5,6 milliarden yuan, was einer steigerung von 23 % gegenüber dem vorjahr entspricht.

wenxins großes modell hat mehr als 600 millionen tägliche anrufe und ki hat zu einem cloud-umsatz von 5,1 milliarden yuan geführt, was einer steigerung von 14 % gegenüber dem vorjahr entspricht. das wachstum ist erfreulich.

wenn man die ki „am himmel schwebend“ zurück auf den boden bringt, kann man solche ergebnisse erzielen. was hat baidu richtig gemacht?

die zahl der anrufe nimmt weiter zu, wobei auf preissenkungen und mehr auf stärke zurückgegriffen wird

beginnen wir mit den auffälligsten daten im q2-finanzbericht von baidu – dem anstieg der anrufe beim großen modell von wenxin.

die anzahl der täglichen anrufe übersteigt 600 millionen und die durchschnittliche anzahl der pro tag verarbeiteten token übersteigt eine billion. hinter der rasant steigenden zahl an anrufen wird immer auch an den massiven „großen modellpreiskampf“ im mai dieses jahres erinnert, der die aufmerksamkeit der gesamten branche auf sich gezogen hat.

in diesem kampf können baidus preissenkungsbemühungen als „wild“ bezeichnet werden:

der kampf begann schnell und baidu kündigte direkt an, dass die modellvoreinstellungsdienste der serien ernie-speed, ernie-lite und ernie-tiny kostenlos sein würden;

im juli dieses jahres kündigte baidu smart cloud während der waic weitere preissenkungen an, wodurch die preise der beiden flaggschiffmodelle ernie 4.0 und ernie 3.5 deutlich gesenkt wurden, mit input und output von nur 0,03 yuan/tausend token bzw. 0,06 yuan/tausend token .

entfernen sie einfach die preisschwelle, und natürlich werden viele benutzer einsteigen. insbesondere viele große, mittlere und kleine unternehmen und institutionen machen sich keine gedanken mehr über die kosten und haben den enthusiasmus, große modelle auszuprobieren.

der preisverfall hat tatsächlich den „drang“ der kunden, anzurufen, verringert;und der wettbewerb um große modelle ist so hart, auch wenn der preis niedriger ist, insbesondere wenn der preis bereits extrem niedrig ist, warum kann sich wenxin von der masse abheben?

in einem artikel wurde seit langem analysiert, dass baidus fähigkeit, eine so fast entscheidende gewinnübertragung durchzuführen, im wesentlichen auf der fortschrittlicheren full-stack-ki-technologie von baidu beruht, die ihm das vertrauen gibt, es kostenlos zu machen und die preise zu senken.

seit der geburt von wenxin big model ist es genau dem trend der zeit gefolgt. die durchschnittliche wöchentliche trainingseffizienz von wenxin yiyan hat 98,8 % erreicht die inferenz beträgt das 105-fache. die inferenzkosten sinken auf das ursprüngliche 1 %. im juni brachte baidu außerdem flying paddle 3.0 auf den markt. dieses upgrade verbesserte die kompatibilität des flying paddle-frameworks mit der baidu-ki-infrastruktur und den großen wenxin-modellen erheblich und dürfte die modellinferenzkosten in zukunft weiter senken.

baidu hat eine sehr gründliche analyse der aktuellen schwachstellen großer modellbenutzer durchgeführt. die erste art von schwachstellen für benutzer ist die relativ hohe schwelle für die anwendungsimplementierung und die frage, wie schnell geeignete anwendungen basierend auf szenarien entwickelt werden können der schmerzpunkt besteht darin, in bestimmten szenarien spezielle modelle zu verwenden, um die anforderungen ihrer eigenen branche zu erfüllen.

damit ein technologieprodukt benutzer dazu bringt, es zu kaufen, ist die „verfügbarkeit“ und die „benutzerfreundlichkeit“ des technologieprodukts immer noch die erste priorität.

nur einen tag vor der veröffentlichung des finanzberichts kündigte baidu unterstützung für die feinabstimmung seines flaggschiff-großmodells ernie 4.0 turbo an. zuvor unterstützte die baidu qianfan-plattform für große modelle ernie 3.5, ernie speed, ernie lite, ernie tiny und ernie character für die feinabstimmung von modellen. bisher können insgesamt 6 wenxin-großmodelle auf der qianfan-plattform feinabgestimmt werden die kumulative feinabstimmung hat 21.000 modelle hervorgebracht, die die kerngeschäftsszenarien von mehr als tausend unternehmen bedienen, und es gibt viele erfolgreiche fälle.

im bereich regierungsangelegenheiten haben der allchinesische gewerkschaftsbund und baidu smart cloud ki-funktionen in der rechtsberatung eingesetzt, die es arbeitnehmern ermöglichen, rechtliche fragen genauer zu verstehen, arbeitsentschädigungsbeträge schneller zu berechnen und durch große modelle personalisiertere lösungen bereitzustellen . vollständige fallbewertung.

im vergleich zu herkömmlichen entwicklungsmethoden wurde dieses system, das eine extrem hohe genauigkeit und rückmeldungsgeschwindigkeit erfordert, in nur einem monat geliefert, was eine deutliche effizienzsteigerung im vergleich zum herkömmlichen 3-6-monatigen lieferzyklus darstellt.

wenn die produktivität so verbessert werden kann und mehr benutzer diesen wert erkennen können, wird es schwierig sein, die anzahl der anrufe beim großen modell von wenxin nicht zu erhöhen.

das cloud-geschäft wächst schnell und setzt auf maas und tools

die rasante entwicklung der ki hat für baidu direkte ergebnisse gebracht, nämlich das kontinuierliche wachstum des cloud-geschäfts des unternehmens.

aus dem finanzbericht ging hervor, dass der baidu smart cloud-umsatz im zweiten quartal 5,1 milliarden yuan betrug, was einem anstieg von 14 % gegenüber dem vorjahr entspricht, und dass der ki-umsatz 9 % ausmachte, mehr als die 6,9 ​​% im vorquartal.

betrachten sie ein hervorragendes großes modell als visitenkarte, und das eng damit verbundene cloud-geschäft wird natürlich entsprechend vorangetrieben. der große wohlstand von ki-anwendungen hat dazu geführt, dass die gpu-cloud nach und nach zur „standardkonfiguration“ in der unternehmensbeschaffung geworden ist.

infolgedessen kommt das model-as-a-service-modell (maas) nach und nach auf die bühne und wird zu einer neuen ergänzung des wachstums von baidu cloud.

laut dem neuesten idc-bericht wird baidu intelligent cloud im jahr 2023 den ersten platz bei chinas marktanteil für große modellplattformen einnehmen und 19,9 % erreichen. auch unter den fast 260 großen modellprojekten, die dieses jahr in china als erfolgreiche bieter bekannt gegeben wurden, führt baidu die rangliste der erfolgreichen bieter an. unter den mainstream-großmodellherstellern hat baidu die meisten gewinnerprojekte, deckt die meisten branchen ab und hat mehr als 64 millionen yuan an ausschreibungen gewonnen, womit es den ersten platz unter den dreien einnimmt.

in der zeit, als das große modell auf den markt kam, hat die qianfan-plattform „ein vermögen gemacht“ und insgesamt 150.000 kunden bedient. sie hat in vielen branchen wie regierungsangelegenheiten, elektrizität, bildung usw. große anstrengungen unternommen die anerkennung erlangte nicht nur marktanerkennung für seine technischen produkte, sondern brachte auch feedback in form von produktivitätssteigerungen.

in ländlichen gebieten in henan, chongqing und anderen orten fördert qianfan die „großen modelle, die aufs land gehen“ und ermöglicht es den dorfbewohnern, die trivialsten und zeitaufwändigsten probleme wie die bezahlung der krankenversicherung und die bearbeitung der haushaltsregistrierung sicher der hilfe zu übergeben von großen modellen.

wenn probleme auftreten, die in der wissensdatenbank der kommunalverwaltung nur schwer genau abgedeckt werden können, kann das große modell auch die baidu-suche kombinieren, um antworten zu geben, und automatisch @antworten an die person, die die frage gestellt hat, wodurch rund um die uhr praktische dienste auf dem land bereitgestellt werden.

derzeit sind ansässige assistenten in mehr als 6.000 dörfer eingedrungen, um den einfachen menschen ein intelligenteres leben zu ermöglichen.

um den kunden das gefühl zu geben, „verfügbar“ und „benutzerfreundlich“ zu sein, basiert die kommerzialisierung großer modelle durch baidu stärker auf der aktualisierung der werkzeugkette großer modelle.

die intensive pflege von tool-chain-upgrades ist eines der hauptthemen der technologieentwicklung von baidu in diesem jahr.

aus sicht der modellfeinabstimmung hat modelbuilder die hochwertige datenfunktion hybrider wenxin-großmodelle eingeführt.benutzer können einen allgemeinen gemischten korpus und einen vertikalen domänenkorpus mit geschäftsdaten integrieren, um branchenspezifische große modelle zu optimieren, die stabiler und effektiver sind.

aus der perspektive der entwicklung nativer ki-anwendungen löst appbuilder viele der probleme, mit denen kunden bei der entwicklung nativer ki-anwendungen konfrontiert sind: der umfassende wissensabruf, benutzerdefinierte strategien, sicherheit auf unternehmensebene und andere aspekte wurden verbessert, wodurch große modelle benutzerfreundlicher werden ebene. derzeit wurden auf der plattform mehr als hunderttausende anwendungen erstellt, die online-bildung, e-commerce, regierungsangelegenheiten und andere branchen abdecken.

das große modellsystem von baidu hat tatsächlich die kundenproduktivität verbessert, was für alle in der branche offensichtlich ist.

rückblickend verfügt baidu selbst auch über ein riesiges technologieprodukt-ökosystem. wenn die fähigkeiten großer modelle wirklich so leistungsstark sind, kann baidu, ein 24 jahre alter „alter baum“, wieder „neue triebe“ wachsen lassen?

rekonstruieren sie das produktmodell, sehen sie die welt und sehen sie sich selbst

im internet gibt es eine weit verbreitete geschichte: mitten im zweiten weltkrieg war der krieg eine schwierige zeit, aber die qualität der fallschirme des us-militärs war besorgniserregend. um eine 100-prozentige erfolgsquote bei fallschirmen zu erreichen, kam das militär finden sie eine lösung: lassen sie den verkäufer den fallschirm selbst testen. wenn sie nicht springen, können sie nicht bestehen. infolgedessen näherte sich die erfolgsquote des fallschirms schließlich 100 %.

„wenn sie ein produkt nicht selbst verwenden, wie können sie dann dafür sorgen, dass sich andere wohl fühlen?“

das gleiche prinzip gilt für baidu. bereits im letzten jahr machte robin li eine mutige aussage, dass er das wenxin-modell zur rekonstruktion aller baidu-produkte verwenden würde. die erste, die die hauptlast zu tragen hat, ist baidus heimatbasis – die suche.

derzeit werden 18 % der suchergebnisse durch ki generiert, wodurch nutzer genauere und direktere ergebnisse erhalten können. dies bestätigt lediglich das von baidu vor einem jahr vorgeschlagene konzept der „neuen suche“ mit den drei merkmalen „extreme zufriedenheit“, „empfehlungsanregung“ und „mehrere interaktionsrunden“, um die suchergebnisse der benutzer genauer, organisierter und übersichtlicher zu gestalten effizienter. intuitiv.

agenten spielen dabei eine schlüsselrolle. baidu beschleunigt die verteilung von agenten in den suchergebnissen. derzeit liegt die durchschnittliche tägliche verteilung von agenten bei über 800 millionen, was doppelt so viele ist wie im mai.

robin li hat wiederholt betont, dass agenten wie ki-websites seien, mit niedrigen schwellenwerten, aber hohen obergrenzen.

aus entwicklungstechnischer sicht ist es einfacher, einen agenten zu entwickeln als eine website. robin li sagte: „wie wurde die website damals erstellt? es war sehr einfach, den quellcode über den browser durchzugehen. ich konnte es mit einem erstellen.“ ich werde es heute tun. der intelligente agent ist diesem sehr ähnlich ... geben sie ihm einen namen, sagen sie ihm, was er antworten soll und was nicht, und schon ist ein intelligenter agent erstellt.“

als einer der ersten großen hersteller der branche hat baidu ein ökosystem aufgebaut, das auf dem weg der intelligenten agenten allmählich gestalt annimmt. baidu wenxin intelligence platform agentbuilder hat 200.000 entwickler und 63.000 unternehmen angesammelt. wenn entwickler agenten auf der wenxin intelligence platform erstellen, können sie flexibel zwischen den versionen wenxin model 3.5 oder 4.0 wählen, was als „leveled“ bezeichnet werden kann die schwelle“ der nutzung.

mit der eröffnung der olympischen spiele in paris in diesem sommer sind fans vieler sportler spontan auf der baidu wenxin smart platform zusammengekommen und haben viele fan-support-smart-challenges entwickelt. fans der chinesischen tischtennisspielerin sun yingsha haben für sie „sun yingshas kleines fan-mädchen“ entwickelt; fans, die die tennisspielerin wang manyu unterstützen, haben „manyus kleinen taro-ball“ entwickelt wurde von ihren fans „chanchans kleine schultasche“ genannt. der austausch war einzigartig und sehr interessant.

im landwirtschaftlichen bereich unterstützte der akademiker zhu youyong von der chinesischen akademie für ingenieurwissenschaften baidu auch bei der schaffung der „farmer academician intelligence“. dieser intelligente agent, ausgestattet mit den forschungsergebnissen von zhu youyong und seinem team, kann eine vielzahl von fragen für landwirte beantworten, darunter den anbau von hochwertigem trockenreis, winterkartoffeln und anderen nutzpflanzen, und so die technologie zum nutzen der landwirte auf ein neues niveau heben.

die schwelle ist niedrig und die wirkung ist gut. wie können intelligente agenten nicht populär werden? es ist nicht schwer zu erkennen, dass die größe zukünftiger intelligenter agenten mit der großen anzahl heutiger websites verglichen werden kann, die ein riesiges ökosystem bilden.

baidus ziel ist es, die suche als größten zugang zur verbreitung intelligenter agenten zu nutzen und an der spitze des großen wohlstands intelligenter agenten zu stehen.

unter den vielen traditionellen produkten von baidu ist baidu wenku dafür bekannt, „zweimal zu punkten“.

baidu wenku wurde vom großen modell in eine „one-stop-plattform für die erfassung und erstellung von ki-inhalten“ umgebaut und ist auf dem weg der ki mit hunderten von intelligenten ppts, intelligenten dokumenten, intelligenten mindmaps, intelligenten forschungsberichten usw. weiter vorne die modale ki-funktion verbessert das dokumenterlebnis und die nutzungseffizienz der benutzer erheblich.

bisher hat die kumulierte zahl der ki-benutzer von baidu wenku 180 millionen überschritten, und die zahl der genutzten ki-funktionen hat 2,2 milliarden überschritten, sodass mehr menschen in den genuss der produktivitätsvorteile großer modelle kommen können, was diesem 15 jahre alten produkt einen mehrwert verleiht „zweiter frühling““.

abschluss

in diesem jahr machte robin li einmal eine vielbeachtete aussage, dass der fokus großer modelle immer noch auf „volumenanwendungen“ liege: „ohne anwendungen sind nur basismodelle, egal ob open source oder closed source, wertlos.“

tatsächlich ist jedoch zu erkennen, dass baidu sowohl grundlegende modelle als auch anwendungen beherrschen muss und beide hände stark sein müssen.

in den letzten zehn jahren hat baidus arbeit an großen modellen und grundlegender ki-forschung endlich einen hektar fruchtbaren bodens genährt, aber der boden allein reicht nicht aus. baidu ist in die zweite phase seiner großen modellentwicklung eingetreten und hat sich auf die entwicklung nativer ki-anwendungen konzentriert. auf diesem „fruchtbaren boden“ reichlich „ernte“ anzubauen.

die tiefe integration generativer ki in das geschäft und der konsequente einsatz großer modelle zur rekonstruktion der suche haben auch das vertrauen vieler wertpapierfirmen in baidu gestärkt.

jp morgan sagte: „aus geschäftlicher sicht wird eine solche änderung die rolle von baidu in der wertschöpfungskette von der reinen verkehrsberatung zur pre-sales-beratung erweitern. wir glauben, dass letzteres den fluss von transaktionsgesprächen erhöhen wird, wenn es erfolgreich durchgeführt wird.“ mittel- bis langfristig positive auswirkungen auf das ergebnis haben.“

wenn andere große unternehmen große modelle implementieren möchten, müssen sie möglicherweise wirklich von baidu lernen: senken sie die nutzungs- und kostenschwellen auf ein minimum, verlassen sie sich auf cloud-stärke und toolketten, um ein gut funktionierendes ökosystem aufzubauen, und verlassen sie sich auf große modelle und agenten zur rekonstruktion bestehender geschäftsmodelle.

bei diesen drei schritten handelt es sich allesamt um schlüsseloperationen, um große modelle dazu zu bringen, wirklich „in die häuser der einfachen leute zu fliegen“.