Nachricht

Wenn große Modelle in die Branche eindringen, sind Szenarien der Schlüssel zur Umsetzung | ToB Industry Observation

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


„Als Technologie müssen große Modelle wirklich von der Industrie genutzt werden und praktische Probleme in der Branche lösen, bevor sie ihren wahren Wert entfalten kann.“ Die Edge and Channel Data Center Division hat mit gesprochen. Darauf wurde in der Kommunikation mit der TMTpost Media APP mehrfach hingewiesen.

Es ist fast zwei Jahre her, dass ChatGPT herauskam. In weniger als zwei Jahren dringen große KI-Modelle mit beispielloser Geschwindigkeit in alle Lebensbereiche ein. Insbesondere seit diesem Jahr haben sowohl große Modellhersteller als auch Party-A-Unternehmen ihren Fokus von der Größe der Modellparameter auf die Art und Weise verlagert, wie große Modelle die Schwachstellen der Branche lösen, und versuchen, ein oder mehrere große Modelle zu finden, die ihre eigenen Branchenimplementierungsszenarien lösen können .

Von allgemein bis industriell sind Szenarien der Schlüssel zur Implementierung großer Modelle

Wenn die Konkurrenz großer Modelle großer Hersteller in zwei Hälften geteilt ist, bringen große Hersteller in der ersten Hälfte nacheinander allgemeine große Modelle auf den Markt und demonstrieren in der zweiten Hälfte ihre Stärke, indem sie die Parameter der Modelle kontinuierlich verbessern Modelle werden von mehr Branchen akzeptiert. Wenn Nebenunternehmen darauf achten, entstehen immer mehr Modelle mit kleinen Parametern, und Industrieanwendungsszenarien sind natürlich in den Fokus der Unternehmen von Partei A und der großen Modelllieferanten von Partei B gerückt Eine Frage, ob große Modelle zum jetzigen Zeitpunkt wirklich realisierbar sind. Der Schlüssel zur „Monetarisierung“ auf Seiten der Industrie.

In diesem Zusammenhang sagte Guo Wei gegenüber TMTpost Media APP, dass Intel davon ausgeht, dass sich die Modelle schrittweise von allgemeinen Großmodellen zu branchenspezifischen Großmodellen ändern werden, wenn die KI-Großmodelltechnologie allmählich in die Branche eindringt „Gleichzeitig wird sich das Branchenmodell mehr branchenspezifisches Wissen bündeln und sich auf ein oder mehrere spezifische Szenarien konzentrieren.“

Zufälligerweise erklärte Cao Peng, Vorsitzender des technischen Komitees der JD Group und Präsident der JD Cloud Division, kürzlich auch öffentlich auf dem JD Cloud Summit, dass „große Modelle im Allgemeinen auf Rechenleistung angewiesen sind, um sich aufzubauen, während große Industriemodelle auf Geschäft angewiesen sind.“ Wan Jingdong verfügt bereits über ein eigenes Lieferpersonal, über 200.000 Händler, über 30.000 Ärzte, über 20.000 Beschaffungs- und Vertriebsmitarbeiter sowie über 10.000 F&E-Mitarbeiter. Es nutzt große modellgesteuerte Anwendungen in mehr als 100 KI-Szenarien.

Das „2024 Global Digital Economy White Paper“ zeigt, dass die Zahl der großen Modelle für künstliche Intelligenz weltweit 1.328 erreicht hat, wovon 36 % auf China entfallen. Andererseits zeigen IDC-Daten, dass Chinas generative KI im Jahr 2022 4,6 % der gesamten KI-Marktinvestitionen ausmachen wird. Mit der rasanten Entwicklung der generativen KI-Technologie wird der Anteil der generativen KI-Investitionen im Jahr 2027 33,0 % erreichen, der Investitionsumfang wird 13 Milliarden US-Dollar übersteigen und die durchschnittliche Wachstumsrate (CAGR) über fünf Jahre wird 86,2 % betragen.

Offensichtlich ähnelt das große Modell der vorherigen Ära des Cloud Computing. Allein in Bezug auf die Technologie liegt China möglicherweise immer noch leicht hinter dem erstklassigen Niveau der Welt zurück, aber wenn wir uns auf die Szenarien konzentrieren, verfügt China über umfangreiche Anwendungsszenarien, und zwar diese Szenarien Dies ist der Schlüssel, um mit großen KI-Modellen wirklich „in die Häuser gewöhnlicher Menschen zu fliegen“.

Wie können große Modelle von der Cloud bis zum Edge besser genutzt werden?

Während sich große Modelle allmählich von den großen Parametern allgemeiner großer Modelle zu den kleinen Parametern branchenspezifischer Modelle bewegen, zeigen große Modelle auch einen Trend von der Cloud zur Geräteseite. IDC-Daten zeigen, dass bis 2026 80 % der globalen Unternehmen generative KI nutzen werden und 50 % der weltweiten Edge-Implementierungen KI umfassen werden.

In diesem Zusammenhang sagte Sachin Katti, Senior Vice President und General Manager der Network and Edge Division von Intel, einmal, dass die Zukunft der künstlichen Intelligenz auf einem offenen Ökosystem basieren werde und sich die Anwendung künstlicher Intelligenz von Rechenzentren auf Edge Computing verlagere.

Darüber hinaus sagte Chen Wei, Vizepräsident der Intel Corporation und General Manager der Network and Edge Division China, gegenüber TMTpost Media APP, dass den diesjährigen Entwicklungstrends zufolge allein Intels Kunden in diesem Jahr die Implementierung groß angelegter Edge-Modelle prüfen werden . Es gibt mehr Kunden für die Lösung. Dieses Jahr kann man grundsätzlich sagen, dass mehr als die Hälfte der Kunden Implementierungslösungen auf Basis großer Edge-Modelle erforscht, und es gibt viele praktische Fälle.“ weiter darauf hingewiesen.

Da sich große Modelle in Richtung Edge bewegen, müssen Unternehmen bei der Bereitstellung viele Faktoren berücksichtigen, wie z. B. Latenzanforderungen, Praktikabilität, anpassbare Optimierung von Mikrodaten und Anforderungen an die Informationssicherheit.

Der Edge-Side-Einsatz von groß angelegten Modellen befindet sich jedoch noch in einem frühen Entwicklungsstadium, und es sind derzeit viele Bereitstellungsmodelle auf dem Markt sichtbar. „Durch die Beobachtung von Intel sehen wir, dass viele Kunden darauf basierende Hardware- und Softwarelösungen entwickeln „Die Leistungsoptimierung ist ein sich schnell entwickelndes Modell“, sagte Chen Wei, als er mit der von Titanium Media APP aufgeworfenen Frage konfrontiert wurde, wie man große Modelle auf der Kundenseite besser anwenden kann.

Als er über die Trends und Aussichten für die Implementierung von Chinas großen Modellen in der Branche sprach, sagte Guo Wei gegenüber TMTpost Media APP, dass seit diesem Jahr immer mehr Branchenanwender viele branchenweite Modelle implementiert haben: „Letztes Jahr ging es wahrscheinlich mehr ums Erzählen „In diesem Jahr haben wir immer mehr Implementierungsfälle in der Branche gesehen, und es sind alles Szenarien, die die Schwachstellen der Branche effektiv lösen können“, sagte Guo Wei.

Ausgehend von der aktuellen Anwendung sind die Modellparameter auf der Endseite viel kleiner als die Parameter des allgemeinen großen Modells. Derzeit liegen die Modellparameter auf der Endseite meist zwischen 7B und 10B schwierige Aufgabe. Etwas Wichtiges und Schwieriges. Das aktuelle Mainstream-Modell besteht darin, branchenspezifisches Wissen in die Daten einzubringen und diese gleichzeitig zu komprimieren, was allgemein als progressive Beschneidungslösung bekannt ist.

In diesem Zusammenhang sagte der zuständige technische Direktor von JD Cloud gegenüber Titanium Media APP, dass es am Beispiel des unbemannten Logistikfahrzeugszenarios durch Größenreduzierung und neuronale Netzwerksuche möglich sei, etwa die doppelte Anzahl von Parametern zu komprimieren, ohne das Modell selbst zu reduzieren . Leistung, es kann auch die Latenz um etwa das Doppelte reduzieren.

Gleichzeitig teilte Guo Wei Titanium Media APP seine Analyse und Einschätzung der Aussichten für die Entwicklung großer Industriemodelle in China mit. Er wies darauf hin, dass sich China in dreierlei Hinsicht schneller entwickeln könnte.

Erstens die Entwicklung des Modells selbst in Industrieanwendungen. Wie oben erwähnt: „Allein in Bezug auf die Technologie liegt China möglicherweise immer noch weit hinter dem erstklassigen Niveau der Welt zurück, aber in Bezug auf die Branchenumsetzung, insbesondere im Hinblick auf die Integration mit Anwendungen, ist Guo Wei der Ansicht, dass es viele Anwendungsszenarien gibt.“ , China kann schneller vorankommen: „Eines der besonderen Merkmale des chinesischen Marktes ist die schnelle Entwicklung von Anwendungen und die Fähigkeit, schnell wirksame Wege zu finden, um die Schwachstellen der Branche zu lösen.“

Zweitens wird die Fähigkeit zum Modellschluss verbessert. Wenn große Modelle in der Branche wirklich angewendet werden, reicht es nicht aus, sich nur auf das Modelltraining zu verlassen. Um die Schwachstellen der Branche wirklich zu lösen, ist es nach Ansicht von Guo Wei besonders wichtig, die Argumentationsfähigkeiten des Modells zu verbessern Auch in diesem Jahr werden deutliche Verbesserungen erzielt.

Drittens ist es nach Ansicht von Guo Wei bei der Implementierung großer Modelle in der Branche notwendig, die Verteilung der Rechenleistung zwischen der Cloud, der Geräteseite und dem Edge zu koordinieren, „wenn es sich nur um einige Standardanwendungen vertikaler großer Modelle handelt.“ „Die großen Modelle werden möglicherweise hauptsächlich in der Cloud bereitgestellt. Aufgrund der Notwendigkeit einer industriellen Implementierung wird die KI-Rechenleistung jedoch zwangsläufig auf die Edge- und Terminalseite verteilt“, sagte Guo Wei gegenüber TMTpost Media APP.

Viele Szenen wurden umgesetzt

Wie Guo Wei sagte, wurden seit diesem Jahr viele Anwendungsszenarien großer Branchenmodelle auf der Geräteseite umgesetzt.

Im Bildungsbereich hat Seewo gemeinsam eine „AI + Education“-Lösung auf den Markt gebracht, die auf Intel® Core™ Ultra-Prozessoren basiert. Mit Hilfe von Intel® Core™ Ultra-Prozessoren kann Seewo den Betrieb großer KI-Lehrmodelle lokal abwickeln, ohne auf Cloud-Computing-Ressourcen angewiesen zu sein. Dadurch wird die Reaktionsgeschwindigkeit und Stabilität des Systems verbessert und ein reibungsloses Erlebnis während des Unterrichtsprozesses gewährleistet.

Im Einzelhandel hat Tous Les Jours mithilfe von Edge-Computing-Technologie intelligente Ladenlösungen geschaffen. Diese Lösung kann die vorhandenen Audio- und Video-Sammelgeräte im Geschäft nutzen und über die Datenintegrations- und Optimierungsmanagementplattform entsprechend den Anforderungen und Merkmalen verschiedener Geschäfte eine Reihe exklusiver digitaler intelligenter Geschäftsmodelle für diese erstellen und eine Produktpräsentation ermöglichen und Filialdienstleistungen, Filialhygiene, Mitarbeiternormen, Einblicke in Menschenmengen und Kundenströme, die die differenzierten Managementfähigkeiten des Filialbetriebs von Tous Les Jours verbessert, die Managementeffizienz verbessert, die Kosten für manuelle Filialinspektionen gesenkt und die Umsetzung von verbessert haben Mitarbeiternormen, die die intelligente Entwicklung der Backindustrie beschleunigen.

Im Hinblick auf die medizinische Gesundheit hat JD Health das medizinische Großmodell „Jingyi Qianxun“ eingeführt, das auf dem Großmodell JD Yanxi basiert, das eine große Anzahl klinischer Praxisrichtlinien, medizinischer Literatur und Expertenwissen integriert und die Migration verschiedener schnell abschließen kann Szenarien im Medizin- und Gesundheitsbereich sowie im Lernen. Basierend auf dem groß angelegten Modell „Beijing Medical Qianxun“ hat das Unternehmen eine Reihe von Lösungen für praktizierende Ärzte auf den Markt gebracht, darunter Cloud-Kliniken, Nachsorge nach der Diagnose, gemeinsame Beratung durch Experten, klinisch-wissenschaftliche Forschung, Inkubation von IP-Marken für Ärzte und „ „Intelligent Doctor Assistant“-Tools, die nicht nur die Effizienz und Qualität der Online-Diagnose und -Behandlung von Ärzten optimieren, sondern auch die Praxissicherheit verbessern.

Im Hinblick auf die Sicherheit haben viele Sicherheitsanbieter, darunter 360, Qi'anxin, Tencent Cloud, Sangfor usw., große Modellprodukte in der Sicherheitsbranche auf den Markt gebracht, die auf großen Modellfunktionen basieren, oder die Fähigkeiten großer KI-Modelle in Originale integriert Bei den Sicherheitssystemen haben wir angesichts der immer schwerwiegenderen Sicherheitsherausforderungen, die KI im KI-Zeitalter mit sich bringt, das Ziel erreicht, „KI mit KI zu besiegen“.

Im Hinblick auf die Büroarbeit haben viele Hersteller das Konzept von AIPC vorgeschlagen und konzentrieren sich auf Büro-KI-Assistenten. Im AI-Chatbot-Szenario können große Modelle schnell auf Intel Core Ultra AI-PCs bereitgestellt werden, und Benutzer können die leistungsstarken Funktionen problemlos nutzen Texterstellung, Programmierung, mathematische Berechnung und logisches Denken sowie ein praktisches und sicheres, lokalisiertes, intelligentes interaktives Erlebnis.

In Bezug auf die Dokumentenverarbeitung können Benutzer mithilfe von AI PC E-Mails effizient verarbeiten, Daten erstellen, Arbeitsdokumente automatisch erstellen und die Arbeitseffizienz verbessern. Außerdem können sie Vertragsdokumente schnell entwerfen und mithilfe von AI Rechtsstreitigkeiten intelligent analysieren und so professionelle Dokumente erstellen Fähigkeiten.

Dies sind nur einige Szenarien, in denen KI-Großmodellanwendungen derzeit beliebt sind. Darüber hinaus werden große Industriemodelle auch in vielen Bereichen wie Finanzen, Fertigung und Exploration häufig eingesetzt. Die Ära, in der verschiedene Branchen die Fähigkeiten großer KI-Modelle nutzen, um Unternehmen zu stärken, hat begonnen.

Daten sind immer noch ein unausweichliches Thema

Wie wir alle wissen, sind Daten der „Nährstoff“ für die schnelle Entwicklung großer Modelle. Ob es sich um ein allgemeines großes Modell oder ein branchenweites großes Modell handelt, wenn Sie echten Wert realisieren und „Illusionen“ reduzieren möchten, sind Daten ein Muss. Gesprächsthema.

Was die Branche betrifft, erfordern große Branchenmodelle umfangreiche und umfangreiche branchenspezifische Daten. Für Unternehmen, die große Branchenmodelle nutzen möchten, um Kosten zu senken, die Effizienz zu steigern und von der Digitalisierung auf digitale Intelligenz umzusteigen, ist dieser Teil sehr wichtig An die Governance-Fähigkeiten werden höhere Anforderungen gestellt. Aus Sicht aktueller Branchenanwendungen reichen die Originaldaten des Unternehmens nicht aus, um ein vollständiges Branchenmodell auf Unternehmensebene zu trainieren. Die derzeitige Hauptlösung besteht in der Verwendung synthetischer Daten. Als nächstes müssen Unternehmen einerseits die Qualität ihrer eigenen Daten verbessern. Andererseits ist auch die Auswahl exzellenter synthetischer Daten zu einem heiklen Thema geworden, mit dem sich Unternehmen auseinandersetzen müssen.

Andererseits besteht der Unterschied zwischen großen Industriemodellen und allgemeinen großen Modellen darin, dass die meisten großen Industriemodelle auf der Geräteseite oder der Kantenseite bereitgestellt werden müssen. Gartner prognostiziert, dass bis 2025 mehr als 50 % der von Unternehmen verwalteten Daten außerhalb des Rechenzentrums oder der Cloud erstellt und verarbeitet werden.

Mit anderen Worten: Bis 2025 wird die Datenmenge auf der Geräteseite 50 % überschreiten. Da die Menge an Edge-Side-Daten zunimmt, stellt auch die Bandbreite der Datenübertragung eine große Herausforderung dar, der sich Unternehmen stellen müssen „Wenn Daten am Rande generiert werden, kann es immer noch zu Netzwerkstürmen kommen, und wir müssen die Netzwerkverwaltung und die Datenübertragungsstrategien noch weiter optimieren“, sagte Guo Wei gegenüber Titanium Media APP.

Mit Blick auf die Zukunft sagte Sachin Katti gegenüber TMTpost Media APP, dass KI zwar Daten vorantreibe, um die Qualität zu verbessern, diese Daten wiederum die KI dabei unterstützen werden, besser zu werden und letztendlich einen positiven Kreislauf zu erreichen.

Offensichtlich sind große Modelle in der Branche in eine Phase rasanter Entwicklung eingetreten. Dabei müssen Unternehmen dem Prinzip „Datengesteuert, Szenario ist König“ folgen, um eine bessere Implementierung großer Modelle in der Branche zu ermöglichen.(Dieser Artikel wurde zuerst auf Titanium Media APP veröffentlicht, Autor | Zhang Shenyu, Herausgeber | Gai Hongda)