2024-09-25
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
text |. zhao yanqiu und zhou xiangyue
herausgeber |. niu hui
das von zentralen staatsunternehmen umgesetzte großmodell tritt in eine neue phase ein. auf einer konferenz im september sagte ein hochrangiger branchenvertreter gegenüber digital intelligence frontier, dass die implementierung großer modelle nicht mehr auf eine bestimmte branche beschränkt sei, sondern sich in allen lebensbereichen ausgeweitet habe auch einen großen schritt nach vorne gemacht.
branchenbeobachtungen zufolge haben einige führende staatliche unternehmen die führung bei der fertigstellung der ersten pilotimplementierung großer modelle übernommen und begonnen, schrittweise auf kernszenarien umzusteigen. "da der preiskampf bei großen modellen seit mai dieses jahres weiter schwelt, hat sich die umsetzung großer modelle weiter beschleunigt. eine reihe von szenarien wurden in großem maßstab untersucht und reproduziert, und auf finanzieller ebene wurde der roi verbessert positiv geworden.„xie guangjun, vizepräsident von baidu, sagte gegenüber digital intelligence frontline.
in der zweiten jahreshälfte wird die umsetzung großer modelle wieder voranschreiten.in nur zweieinhalb monaten hat die zahl der öffentlich zugänglichen zuschlagsgebote für großmodelle auf dem markt die gesamtzahl der zuschlagsgebote in den ersten sechs monaten des jahres übertroffen.. die erfolgreichen ausschreibungsprojekte in einem einzigen monat haben ebenfalls hunderte von phasen durchlaufen. große models beschleunigen in allen lebensbereichen ihre volle blüte. unter ihnen sind die branchen energie, finanzen, bildung, internet und andere besonders aktiv.
im zuge der sich schnell verändernden technologien beschleunigt sich der branchenaustausch. in den letzten monaten sind an verschiedenen orten verschiedene große und kleine ki-konferenzen entstanden, und baidu soll berichten zufolge am 25. september die baidu cloud intelligence-konferenz 2024 abhalten. es kommt zu weiteren technologischen austauschen und kollisionen.
01
die zentralen staatsunternehmen haben einen weiteren großen schritt nach vorne gemacht
2024,china southern power grid hat die rekrutierung und beschaffung mehrerer großer modellbezogener projekte abgeschlossen, wie zum beispiel „schlüsseltechnologieprojekt der ki-grundausbildungseinrichtung des china southern power grid main distribution system – forschung und anwendung der nlp-großmodelltechnologie des energiesystems“, „forschung und entwicklung des sicherheitstrainings- und inferenzfunktionssatzes 2024 des china southern grid research institute“. design für große modelle der elektrizitätswirtschaft, komponentenentwicklung usw. relevante teams arbeiten mit baidu intelligent cloud für gemeinsame innovationen.
in der finanzbranche startete eine große staatliche bank im vergangenen jahr lediglich ein kleines pilotprojekt mit tausenden von mitarbeitern in den szenarien kundendienstassistent und schalterassistent. in diesem jahr wurden diese funktionen in mehreren großen kundendienstzentren offiziell eingeführt im ganzen land und werden zu mitarbeitern an vorderster front im ganzen land befördert. die tägliche aktivität großer models erreicht zehntausende.
im automobilbereich sagte eine person vom geely research institute kürzlich auf einer konferenz ganz offen: „jetzt, wo autofirmen autos verkaufen, ist es ihnen peinlich, ihre produkte zu verkaufen, weil sie keine großen modelle an den autos haben.“ große modelle führen intelligente cockpits und autonomes fahren ein und stärken das digitale marketing, den benutzerbetrieb und andere szenarien. vor kurzem haben sie damit begonnen, alle unternehmen unter geely zu stärken.
auf dem markt für regierungsangelegenheiten haben kommunalverwaltungen groß angelegte modellpläne erstellt, die auf lokalen branchen basieren. „bauen sie zuerst das intelligente rechenzentrum,von ende dieses jahres bis zum ersten quartal nächsten jahres wird das intelligente rechenzentrum in großem maßstab implementiert, und dann beginnt die kombination großer modelle und lokaler industrien.. „ein regierungsbeamter sprach über den fortschritt des marktes. wissenschaft, bildung, kultur und gesundheit haben mit der umsetzung der anwendung begonnen.“ einige tertiäre krankenhäuser haben sogar zig millionen in versuchsszenarien investiert. „eine medizinische quelle sagte, dass sich dekane auf szenarien wie fallgenerierung, management von personen, eigentum und wissenschaftliche forschung konzentrieren, die eng mit serviceniveaus, management und wissenschaftlichen forschungsniveaus verbunden sind.
der hafen, ein wichtiger kanal für den import- und exporthandel, wurde ebenfalls erkundet und angelegt. „wir haben gesehen, dass viele kunden große modelle in ihre it-pläne für die nächsten drei jahre geschrieben haben.“ „es gibt weniger leute, die warten und zuschauen, aber mehr leute, die es ausprobieren.“
beispielsweise hat der hafen shandong, der in bezug auf den frachtumschlag weltweit an erster stelle steht, die piloterkundung groß angelegter modelle in intelligenter frage und antwort sowie intelligenter frage und antwort abgeschlossen und diese beiden funktionen für alle mitarbeiter eingeführt.
in der chemischen industrie arbeiten sinochem information und baidu smart cloud zusammen, um den einsatz großer modelle für die forschung und entwicklung neuer materialien zu erforschen. der wissensassistent „hua xiaoyi“ kann fragen über natürliche sprache stellen und fachwissen abrufen und beantworten wie molekulare eigenschaften und molekulare synthesewege. derzeit wurde die sucheffizienz nach bestimmten molekülen um mehr als das fünffache gesteigert und die effizienz der forschungs- und entwicklungsarbeit erheblich verbessert.
diese begeisterung spiegelt sich auch auf dem bietermarkt wider. öffentliche daten zeigen dasvon januar bis august dieses jahres hat die zahl der inländischen großmodell-siegerprojekte das fünffache der zahl im gesamten jahr 2023 erreicht, und die gewinnersumme hat sich gegenüber dem vorjahr verdoppelt.. unter ihnen dominieren nach wie vor die hersteller großer kopfmodelle bei der auftragsannahme. bei vier schlüsselindikatoren belegt baidu den ersten platz: die anzahl der erfolgreichen großprojekte, die anzahl der erfolgreichen ausschreibungen, die abgedeckten branchen und die anzahl der erfassten zentralen staatsunternehmen.
laut unvollständigen statistiken von data intelligence frontlinevom 1. juli bis zum 15. september, in nur zweieinhalb monaten, betrug die gesamtzahl der erfolgreichen gebote für große modelle mindestens 286damit konnte die gesamtzahl der projekte in den ersten sechs monaten des jahres erfolgreich aufgeholt werden.
bei den einkäufern erteilen betreiber, energie, bildung, regierungsangelegenheiten, finanzen usw. nach wie vor die meisten bestellungen. ein klares zeichen ist, dass einige unternehmen immer segmentiertere anforderungen gestellt haben und die beschaffung wie datenerfassung und -verwaltung, sicherheit großer modelle und talentförderung deutlich zugenommen hat.
beispielsweise hat china southern power grid die ausschreibung für mindestens 15 große modellbezogene projekte innerhalb von zweieinhalb monaten von juli bis mitte september abgeschlossen. auch state grid hat im dritten quartal die ausschreibung für mehrere große modellbezogene projekte abgeschlossen.
li chao, general manager von baidu intelligent cloud energy power industry, sagte gegenüber digital intelligence frontline, dass china southern power grid bereits im september letzten jahres ein unabhängiges und steuerbares großmodell veröffentlicht habe – „big watt“. unter anderem bietet die große modellplattform baidu intelligent cloud qianfan technischen support für stromverteilungsszenarien. im dritten quartal dieses jahres schloss china southern network die auswahl großer sprachmodelle für die kerngeschäftsabteilung von china southern network ab und baidu wurde erfolgreich als technischer dienstleister ausgewählt.
02
große unternehmen legen wert auf „mit dem strom schwimmen“
fast alle unternehmen, die in dieser runde als erste den sprung zu großen modellen wagten, hatten einen hintergrund in kleinen modellen. beispielsweise hat icbc etwa im jahr 2021 ein projekt ins leben gerufen und möchte ein „größeres modell“ verwenden, um geschäftsanwendungen wie ocr zu erstellen. „nachdem chatgpt kam, nutzten sie die situation und gründeten ein großes modellprojekt“, sagte ein finanzexperte gegenüber digital intelligence frontline.
der markt für produktionssicherheit unterliegt der politischen aufsicht und ist für zentrale staatliche unternehmen nahezu von entscheidender bedeutung. zuvor hatte longyuan electric power, das größte sekundäre windkraftunternehmen der national energy group, eine traditionelle kleine sicherheitslösung zur verwaltung von mehr als 200 windparks und mehr als 10.000 windturbinen eingeführt und so einen kompletten produktionsstandort aus sicherheitsüberwachung, analyse, alarme zur verarbeitung. im zweiten quartal dieses jahres gewann baidu die ausschreibung für eine aktualisierte version des projekts, die die verallgemeinerung des großen cv-modells, eine genauere merkmalserkennung und die fähigkeit des großen sprachmodells, die zuvor gesammelten informationen zu verarbeiten, kombinieren wird wirklich nützlich.
was konnten kleine modelle früher nicht, wofür große modelle jetzt einen mehrwert bieten können? hu wei gab ein beispiel. die planung im hafen, die personalplanung, die liegeplätze, die lagerplätze usw. wurden in der vergangenheit alle separat anhand kleiner modelle durchgeführt, und die ergebnisse waren gut. zum beispiel der lagerplatzplan.tatsächlich handelt es sich um ein mathematisches algorithmusproblem, und das kleine modell ist sehr gut geeignet.. wenn diese jedoch für eine „integrierte planung“ kombiniert werden, können kleine modelle kein groß angelegtes kollaboratives computing und keine koordinierte planung über datensätze und geräte hinweg erreichen. „wir hoffen insbesondere, dass große modelle gelöst werden können. die herausforderung ist die aggregation der daten im hafen, die zeit braucht.“
in der industriebranche ist die erkennungsrate herkömmlicher cv-kleinmodelle bei kleinen stichproben relativ gering. mit hilfe von cv-großmodellen kann die erkennungsrate kleiner stichprobendaten verbessert werden.
vielen unternehmen mangelt es zudem an wissensmanagement-, niederschlags- und anwendungsplattformen. mit hilfe großer modelle und wissensabruf können unternehmen nun wissensmanagement-plattformfunktionen aufbauen, um die aufgaben der expliziten darstellung von implizitem wissen, der strukturierung von explizitem wissen, der korrelation von strukturellem wissen und der fluidisierung von zugehörigem wissen zu erfüllen.
viele unternehmen halten regelmäßig produktions- und betriebsbesprechungen ab und es ist sehr schwierig, daten abzugleichen. mithilfe großer sprachmodelle können wir ergebnisse schneller und genauer zusammenfassen und extrahieren sowie vorläufige analysen durchführen, was für benutzer von sehr hohem wert ist.
03
um in das kerngeschäft einzusteigen, müssen sie die „hände und füße“ finden.
li chao stellte fest, dass die anwendung großer modelle in den letzten zwei jahren noch in den kinderschuhen steckte und sich auf assistenzszenarien wie büro und kundendienst konzentrierte. dies steht in völligem widerspruch zu den erwartungen an die führung zentralstaatlicher unternehmen mit investitionen in zweistelliger, hunderter oder gar zweistelliger milliardenhöhe. jetzt müssen große models tief in das kerngeschäft des unternehmens vordringen.
„in der energiewirtschaftwir investieren in eine richtung – simulationsoptimierung. „sagte li chao. in der branche gibt es eine große anzahl von arbeitsaufgaben im zusammenhang mit mechanismen und wissenschaftlichen berechnungen, die nicht mit großen sprachmodellen oder großen cv-modellen erledigt werden können.“ „wenn diese probleme nicht gelöst werden, wird die zukunft, die wir uns vorstellen, gelöst.“ es ist unmöglich, das modell als fähigkeitszentrum zu implementieren, um einen vollständigen agentendienst bereitzustellen. „li chao sagte, dass in zukunft große modelle mit kleinen modellen in berufsfeldern kombiniert werden müssen, um tief in die kerngeschäftsszenarien der kunden einzudringen.
„in den letzten jahren haben wir einige grundlagen in diese richtung gelegt.“ baidu bietet eine simulationsoptimierungs-engine und arbeitet mit industriepartnern zusammen, um szenarien für die stromnetzverteilung, die erdöl- und petrochemische raffinierung sowie die öl- und gasexploration zu entwickeln erkunden sie die stromnetzverteilung und die stromnetzstabilität. aktuelle projekte im zusammenhang mit dem mechanismusmodell, wie z. b. zustandsanalyse, optimierung des betriebs von erdöl- und petrochemischen luftenergieinseln, entschwefelung und denitrifizierung usw., wurden umgesetzt. im september dieses jahres beteiligte sich baidu auch an der ausschreibung für die intelligente steuerung des nationalen pipelinenetzes.
„das sind kernproduktionsrichtungen, die den kunden sehr am herzen liegen. und wir denkendiese richtungen sind die „hände und füße“, die unverzichtbar sind, wenn in zukunft große modelle als planungszentrum zum aufbau einiger intelligenter agentendienste als ganzes verwendet werden.. li chao sagte, dass sie besondere anstrengungen unternehmen werden, um diese „hände und füße“ zu planen. das große modell ist das gehirn. nur mit diesen „händen und füßen (professionelle api)“ können kernszenendienste wirklich realisiert werden.
„im hafen nutzen wir zunächst fragen und antworten, um den kunden zu zeigen, dass das ursprüngliche große modell zuverlässig ist, und greifen dann schrittweise in das kerngeschäftssystem ein“, sagte hu wei: „wir bei der shandong port group planen bereits die nächste phase.“ . wird sich eingehender mit geschäftsszenarien befassen.“der hafen ist ein komplexer verkehrsknotenpunkt. im mittelpunkt steht der versand von gütern, personen, lkws, portalkränen usw.. zuvor wurden in das vom hafen eingeführte tos-system (terminal operating system) nach und nach ki-algorithmen integriert. große modelle können das problem eines stärkeren zugriffs auf metadaten weiter lösen.
während sich große modelle in richtung produktionskernsysteme bewegen,eine der kernkompetenzen des globalen großmodellwettbewerbs ist das logische denken. „bei tests bei kunden vor ort haben wir festgestellt, dass die logische begründung komplexer probleme zwischen verschiedenen großen modellen sehr unterschiedlich ist. darüber hinaus wurden die von einer großen anzahl der im hafen eingesetzten kameras erzeugten videoressourcen nicht tatsächlich genutzt.“ eine möglichkeit besteht nun darin, diese original-hardware- und image-ressourcen zu verwenden.nutzen sie multimodale große modelle zur integration, um eine bessere globale zusammenarbeit zu erreichen. „das ist eine richtung, die wir erkunden.“
04
74 % der ki-workloads befinden sich in der cloud
die implementierung großer modelle ist eine komplexe systemtechnik. während unternehmen in den tiefwasserbereich vordringen, tauchen immer mehr türen und wege für die implementierung auf.
„wenn wir mit kunden in kontakt treten, helfen wir ihnen zunächst, die grenzen des großen modells herauszufinden“, sagte hu wei gegenüber digital intelligence frontline, um inkonsistente erkenntnisse zu vermeiden, die zu problemen oder problemen mit der verspäteten lieferung führen könnten die zu weit von den kundenerwartungen entfernt sind, sie haben jetzt im grunde jedes projekt,alle durchlaufen einen kompletten prozess aus „leichter beratung + umsetzung“.
vom aufbau intelligenter rechenleistung, idc-daten zeigen,74 % der ki-workloads befinden sich in der cloud. aber das heutige technologische paradigma des intelligenten computing hat sich geändert. im zeitalter der cpu-cloud geht es allen vor allem um flexibilität und ultimative kosteneffizienz, während es bei der gpu-cloud darum geht, ob sie die rechenleistung eines großen clusters nutzen kann. solche cluster sind nicht nur teuer, sondern weisen auch bestimmte technische hürden auf. daher sind cloud-anbieter immer noch ein wichtiger akteur.
neben der rechenleistung nimmt die bedeutung von daten immer mehr zu. laut unvollständigen statistiken von data intelligence frontier nehmen im dritten quartal 2024 der kauf, die sammlung, die verwaltung und andere damit verbundene käufe von daten deutlich zu.
auf datenebene werden beispielsweise hafenkundendaten auf den servern jedes terminalunternehmens gespeichert. huwei empfiehlt den kunden, ein eigenes datenteam einzurichten.
wenn es um daten geht, gibt es tiefere probleme. "heutzutage, wenn die branche über große modelle spricht, ist es notwendig, über daten zu sprechen, aber ehrlich gesagt sind viele davon leeres gerede.„das sagte ein brancheninsider ganz offen.
„die ära der großen modelle,wie bereitet man daten vor, wie verwaltet man sie und wie wendet man unterschiedliche daten auf verschiedene phasen des trainings großer modelle an? die meisten menschen versuchen immer noch, den elefanten blind herauszufinden.. „li chao sagte, dass baidu in diesem prozess auch auf viele fallstricke gestoßen sei.
wenn sie beispielsweise ein branchenmodell auf der grundlage eines allgemeinen modells trainieren, gibt es einen technischen leitfaden, wie die daten abgeglichen werden sollten. wenn sie ein großes modell zu wenig füttern, ist der effekt nicht offensichtlich. wenn sie es zu stark füttern, lässt sich das modell nicht leicht konvergieren und es kann sogar zu einer verschlechterung der allgemeinen fähigkeiten des modells kommen ... diese fallstricke wurden später behoben und eine reihe von werkzeugen gebildet. die methodik wird über die qianfan-plattform und ein engagiertes technisches serviceteam nach außen exportiert.
außerdem kann es leicht zu lücken zwischen technik und anwendungen großer modelle kommenviele „benutzereinheiten verstehen ki nicht, und ki-einheiten verstehen die branche nicht.“ li chao sagte, dass sie sich zur schließung dieser lücke neben der ausstattung von lösungsarchitekten mit branchenhintergrund auch auf die partnerauswahl konzentrieren werden. „wir wählen grundsätzlich nur zwei arten von partnern in der energiebranche aus: der eine ist die industrieeinheit des kunden und der andere ist das unternehmen, das human-outsourcing-dienstleistungen im industrieunternehmen des kunden erbringt, dass sie gemeinsame merkmale haben.“ dass sie sowohl tief in das geschäft des kunden als auch in die it-branche eingebunden sind und es verstehen.
darüber hinaus werden bei der umsetzung großer modelle in bestimmten szenenes muss noch viel technische arbeit geleistet werden. beispielsweise sind große modelle daran gewöhnt, antworten in form von „gesamtpunktzahl und gesamtpunktzahl“ auszugeben, und die antworten sind jedes mal unterschiedlich. einige kunden sind jedoch eher an die methode „erstpunktzahl und dann gesamtpunktzahl“ gewöhnt und hoffen, dass dies der fall ist die antwort kann „reproduziert“ werden. „selbst geringfügige änderungen in der wortreihenfolge und der grammatik sind für einige hafenbetreiber inakzeptabel“, sagte hu wei. dies erfordert eine menge technischer arbeit, um sicherzustellen, dass die ausgabe des großen modells den kundenerwartungen entspricht.
aus der gesamtsituation der unternehmensimplementierung ergibt sich eine kundennachfragedimension von 360 grad. interessanterweise wandeln sich derzeit alle cloud-unternehmen von cloud-partnern zu strategischen partnern für die ki-transformation um und verbessern ihre gesamten technischen fähigkeiten rund um ki-infrastruktur, algorithmusmodelle, daten, bereitstellungsoptimierung und anpassung.
05
menschlicher faktor
ein cio eines technologieunternehmens stieß bei der konstruktion und anwendungsförderung großer modelle auf großen widerstand: mitarbeiter und abteilungen an vorderster front kooperierten nicht, selbst wenn der leiter dies sagte, war es nutzlos.nachdem das unternehmen den code-assistenten installiert hatte, stieg die gesamteffizienz um 1/3. „obwohl wir selten über eine reduzierung der mitarbeiterzahl sprechen, bedeutet dies, dass leute, die code schreiben, in das front-end oder back-end der entwicklung versetzt werden, und einige geschäftsabteilungen haben territorialbeschränkungen.“ bewusstsein. das sind echte probleme.
in vielen großen unternehmen traditioneller branchender größte widerstand entsteht durch die arbeitsträgheit. viele mitarbeiter an vorderster front sind alte meister. wenn sie nun die möglichkeit bekommen, gerätewartungsassistenten einzusetzen, werden sie sagen: „wenn etwas passiert, kann ich es genauso gut selbst ausprobieren, oder ich kann lao zhang und die drei anrufen.“ von uns werden für den rest unseres lebens zusammenarbeiten.“
“das große modell ist ein leitprojekt. „eine person aus der finanzbranche bemerkte, dass es von oben bis unten gefördert werden muss. hochrangige führungskräfte unterstützen benchmark-projekte in der öffentlichkeit.“ manchmal ist es auch eine art unterstützung, sich nicht zu widersetzen. "
„beziehen sie die geschäftsabteilung frühzeitig ein und beteiligen sie sich am aufbau sowie an der endgültigen einführung und förderung“, sagte jin jianhua, gründer und ceo von ianalysis. wie wartungsassistenten kann die gruppe die ideen der gruppe haben, die tochtergesellschaften können die ideen der tochtergesellschaften haben und die mitarbeiter an vorderster front haben möglicherweise die ideen der mitarbeiter an vorderster front. wie können die umsatzerwartungen aller in einklang gebracht werden?es ist eine frage der balance. beispielsweise wird die erstellung einiger wissenskarten von erfahrenen experten aus sekundärunternehmen durchgeführt, sodass alle auf ein gemeinsames ziel hinarbeiten können.
unternehmen müssen außerdem regelmäßig den betriebsstatus und die geschäftseinnahmen von benchmark-projekten offenlegen und öffentliche anreize bieten. „geben sie den mitarbeitern beispielsweise einige punkte, verknüpfen sie sie mit einigen systemen und tauschen sie sie gegen einige geschenke ein“, bemerkte hu wei. „wir werden es direkt mit leistung und boni verknüpfen“, sagte ein cio eines technologieunternehmens. „obwohl es etwas einfach und grob ist, erfordert es die zusammenarbeit des managements und die mobilisierung von hr-ressourcen.“
wichtig ist auch die erstmalige bindung. es müssen möglichkeiten gefunden werden, das erste login-erlebnis für mitarbeiter nach der überarbeitung und iteration zu verbessern. wenn beispielsweise der zugang klar genug ist und das, was zuvor nicht erlaubt war, nun korrekt ist, werden die mitarbeiter des unternehmens ihn weiterhin verwenden.
aus sicht der geschäftsabteilung können wir ansteckende und anschauliche geschichten entwerfen und einige alte meister aus ihrer eigenen erfahrung sprechen lassen, die ansteckend sein kann. die tägliche aktivität, die monatliche aktivität und andere daten des projekts sind gleichermaßen wichtig. diese sindpflegen sie die ki-kultur eines unternehmens。
die welle der landung großer modelle nimmt weiter zu. aufgrund der rasanten strömung erhöhen akteure aus allen bereichen der industriekette ihre investitionen weiter und drängen immer mehr unternehmen dazu, den sprung in die digitale intelligenz zu wagen.
auch baidu wird in naher zukunft große schritte einleiten, die am 25. september stattfinden werden2024 baidu cloud intelligence-konferenz. bis dahin wird die baidu intelligent cloud qianfan-plattform neue upgrades bei anwendungsentwicklungstools, großen modellen und toolketten einleiten. die drei wichtigsten ki-anwendungsprodukte – baidu intelligent cloud keyue, wenxin quick code·baidu comate und baidu xiling digital people außerdem wird es komplett aktualisiert und mehrere unterforen wie smart finance, smart industry, smart transportation, smart government affairs, smart cars und embodied intelligence werden gleichzeitig abgehalten, um mehr technischen austausch und kollisionen zu erreichen.