Nachricht

Zhang Jian, CTO von Communication Brain: Beschleunigen Sie die letzte Meile der groß angelegten Modellimplementierung für die Medien

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Chao News-Kundenreporter Huang Yunling

In den letzten zehn Jahren, seit die Medienkonvergenz als allgemeine nationale Strategie gefördert wurde, haben neue Technologien die Entwicklung der Medienkonvergenz weiter vorangetrieben, insbesondere die generative künstliche Intelligenz, die im Medienbereich eine immer wichtigere Rolle gespielt hat. Am 23. August fand in Peking die „BIRTV2024AIGC Generative Artificial Intelligence Innovation and Application Technology Exchange Conference“ statt. Zhang Jian, stellvertretender General Manager und Chief Technology Officer von Communication Brain, wurde eingeladen, eine Grundsatzrede zum Thema „Accelerating the Application of Large“ zu halten Medienmodelle".

Die Fähigkeiten der generativen künstlichen Intelligenz stehen natürlich im Einklang mit den Anforderungen der Medienbranche. Medienorganisationen müssen die Anwendung großer Modelle beschleunigen, und die letzte Meile der Implementierung besteht darin, die zahlreichen komplexen Multitasking-Anforderungen der Medien in Serien oder parallele Einzelaufgaben zu übersetzen Einfache Anweisungen und die Möglichkeit, szenariobasierte große Modellbefehlssätze nahtlos in das Bearbeitungssystem zu integrieren.

Welche Informationen teilte Zhang Jian auf dieser Konferenz mit?

Zhang Jian, stellvertretender General Manager und Chief Technology Officer von Communication Brain, hielt eine Live-Rede. Foto mit freundlicher Genehmigung von Spread the Brain

Die „exklusive Präsenz“ großer Models in der Medienbranche

Von der Entstehung der Microsoft Xiaoice AI Poetry Collection im Jahr 2017 bis hin zur kontinuierlichen Entstehung multimodaler großer Modelle wie GPT4 und Sora wurde eine große Anzahl von Deep-Learning-Methoden vorgeschlagen und iterativ aktualisiert, was einen Entwicklungsboom bei AIGC auslöste. Generative künstliche Intelligenz konzentriert sich auf die Produktion von Bildern, Texten, Videos und anderen Inhalten, die perfekt zu den täglichen Inhaltsproduktionsanforderungen der Medien passen. Die Medienbranche steht vor Veränderungen.

Mit der weit verbreiteten Anwendung großer Modelle in der Medienbranche sind jedoch nach und nach einige Fragen aufgetaucht, z. B. ob wir das zugrunde liegende allgemeine große Modell selbst entwickeln sollen. Möchten Sie ein großes Modell für den privatisierten Einsatz aufbauen, um Datenlecks zu verhindern? Wie integriert sich das große Modell in das Erfassungs- und Bearbeitungssystem der Medienproduktion?

Als Reaktion auf diese Probleme glaubt Zhang Jian, dass die Medienbranche das zugrunde liegende große Modell nicht „rollen“ muss und es wichtiger ist, es gut anzuwenden: „Der Einsatz großer Modelle stellt kein Problem dar, ebenso wenig wie die Rechenleistung.“ und Daten schwierig. Der Schlüssel liegt darin, die Fähigkeiten nach der Bereitstellung kontinuierlich zu verbessern.

Zhang Jian sagte bei dem Treffen, dass viele große Modelle Anwendungen nicht vollständig auf der Grundlage der Anforderungen bestimmter Szenarien entwickeln und keine personalisierten Designs für die Anforderungen verschiedener Benutzergruppen durchführen, was zu unpraktischen Diensten führt. Derzeit dient die Anwendung großer Modelle hauptsächlich der Lösung einer einzelnen einfachen Aufgabe, während die Medien komplexe Mehrfachaufgaben in Reihe oder parallel benötigen. Die Spezialisierung auf Prompt Word Engineering kann die aktuelle Situation der Trennung von Inhalt, Prozess und großem Modell nicht lösen System. Der zukünftige Trend großer Medienmodelle besteht darin, die komplexen Multitasking-Anforderungen der Medien in einfache Single-Task-Prozesse zu übersetzen und szenariobasierte Befehlssätze nahtlos in das Erfassungs- und Bearbeitungssystem zu integrieren.

Übergang vom allgemeinen Modell zum Medienmodell

In Medienerstellungsszenarien können allgemeine Großmodelle nur einen einzelnen Text produzieren und keine Bilder und Texte kombinieren. Die generierten Videos bergen auch Urheberrechtsrisiken. Offensichtlich weisen allgemeine große Modellanwendungen immer noch Probleme auf, z. B. mangelnde Tiefe der Mediengeschäftsprozesse, mangelnde szenenbasierte Anpassung und Personalisierung.

In dieser Hinsicht kombiniert Communication Brain die Nachrichtendaten-Medienbibliothek mit einem allgemeinen großen Modell. Nach der Feinabstimmung erstellt es ein großes Kommunikationsmodell, das die vertikalen Medienkategorien lokalisiert und den Medien intelligente Erstellung, intelligente Überprüfung, kreatives Design und Multifunktionalität bietet. Modal Retrieval, Fünf Hauptdienste für intelligente Konversation. Berichten zufolge wurde das groß angelegte Kommunikationsmodell im Februar 2024 mithilfe generativer künstlicher Intelligenz (großes Sprachmodell) online registriert und war damit das erste von einem Medientechnologieunternehmen entwickelte groß angelegte Medienmodell, das den Registrierungsprozess bestanden hat. Im August wurde der Inhaltsgenerierungsalgorithmus von Spread Brain bei der National Cyberspace Administration of China registriert.

Foto mit freundlicher Genehmigung von Spread the Brain

Zhang Jian sagte, dass das groß angelegte Kommunikationsmodell drei Hauptmerkmale aufweist: „Erstens kann es hochwertige Nachrichtendaten für das Training verwenden, was die zufällige Herstellung von groß angelegten Modellinhalten effektiv lindern und sicherstellen kann, dass der Inhalt authentisch ist.“ , sicher und kontrollierbar; zweitens kann es eine private Domänenbibliothek für Medienressourcen eröffnen und mithilfe großer Modelle einen schnellen und genauen Abruf urheberrechtlich geschützter Inhalte ermöglichen, um ein zuverlässiges Urheberrecht an Inhaltsmaterialien sicherzustellen. Drittens kann es den professionellsten Supermarkt für große Modellanwendungen erstellen Die Medienbranche basiert auf Benutzerrollen, Geschäftsszenarien und Inhaltsmodalitäten und gewährleistet eine einfache und bequeme Nutzung.

Genau auf der Grundlage der oben genannten drei Merkmale hat das große Kommunikationsmodell auch seine eigenen vier einzigartigen Vorteile geschaffen: „professionelle Medienwissensbasis“, „vollständige Abdeckung von Geschäftsszenarien“, „vollständiger Zugriff auf kreative Prozesse“ und „multimodaler Inhalt“. Unterstützung". Beschleunigen Sie die letzte Meile der großen Modellimplementierung für die Medien.

Derzeit konzentriert sich das groß angelegte Kommunikationsmodell hauptsächlich auf zwei Hauptanwendungsszenarien: Medienkonvergenz-Client und Content-Produktionsplattform. Im integrierten Medien-Client-Szenario kann das Kommunikationsmodell personalisierte und intelligente Sprachkommunikations- und Kommentardienste bereitstellen. Im Inhaltsproduktionsszenario verfügt das Kommunikationsmodell über umfangreichere Funktionen und kann das Schreiben von Nachrichten, die Erstellung von Videos, den multimodalen Abruf und die Erstellung von KI-Postern ermöglichen , Bildmaterialgenerierung, intelligente Inhaltsüberprüfung und andere Funktionen.

Der Entwicklungstrend großer Modelle in der Medienbranche

Angesichts der kontinuierlichen Weiterentwicklung der Großmodelltechnologie und der Integration der Medienbranche analysierte Zhang Jian den zukünftigen Trend von Großmodellen in der Medienbranche. Er kam zu dem Schluss, dass die Verwendung großer Modelle als zentrale treibende Kraft für die Entwicklung des Mediengeschäfts der Trend sein wird Die zukünftige Medienbranche. Für die Medienbranche muss sie benutzerzentriert sein, auf den Anforderungen des Geschäftsszenarios basieren und große Modelltechnologien nutzen, um digitale Technologiedienste zu transformieren.

Das Entwicklungsziel von Communication Brain ist es, die letzte Meile der KI-Anwendung zu erschließen. Communication Brain wird einen Anwendungssupermarkt für die nächste Generation von Medien aufbauen, der auf Benutzerrollen, Geschäftsszenarien und Inhaltsmodalitäten basiert und sicherstellt, dass jedes unabhängige Anwendungsszenario eng mit dem Produktionsendgeschäft integriert ist, wodurch der gesamte Medienworkflow nahtlos integriert und optimiert wird. Dadurch werden Effizienz und Qualität der Medienarbeit verbessert.

Die kontinuierliche Weiterentwicklung der Großmodelltechnologie und die Erweiterung der Anwendungsszenarien werden eine neue Ära effizienterer und intelligenterer Entwicklung für die Medienbranche einläuten. Communication Brain ist bestrebt, ein wichtiger Förderer und Wegbereiter in diesem Prozess zu werden.

„Bitte geben Sie beim Nachdruck die Quelle an“

Bericht/Feedback