nouvelles

Zhang Jian, CTO de Communication Brain : Accélérer le dernier kilomètre de la mise en œuvre d'un modèle à grande échelle pour les médias

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Huang Yunling, journaliste client de Chao News

Au cours des dix dernières années, depuis que la convergence des médias a été promue en tant que stratégie nationale globale, les technologies émergentes ont continué à favoriser le développement de la convergence des médias, en particulier l'intelligence artificielle générative, qui a joué un rôle de plus en plus important dans le domaine des médias. Le 23 août, la « Conférence BIRTV2024AIGC sur l'innovation et l'échange de technologies d'application et d'intelligence artificielle générative » s'est tenue à Pékin. Zhang Jian, directeur général adjoint et directeur de la technologie de Communication Brain, a été invité à prononcer un discours sur « Accélérer l'application des grandes technologies. Modèles de médias".

Les capacités de l'intelligence artificielle générative correspondent naturellement aux besoins de l'industrie des médias. Les organisations médiatiques doivent accélérer l'application de grands modèles, et la dernière étape de la mise en œuvre consiste à traduire les nombreuses exigences multitâches complexes des médias en séries ou en parallèles. tâches. Des instructions simples et la possibilité d’intégrer de manière transparente des ensembles d’instructions de grands modèles basés sur des scénarios dans le système d’édition.

Alors, quelles informations Zhang Jian a-t-il partagées lors de cette conférence ?

Zhang Jian, directeur général adjoint et directeur de la technologie de Communication Brain, a prononcé un discours en direct. Photo gracieuseté de Spread the Brain

La « présence exclusive » de grands mannequins dans l’industrie des médias

De l'émergence de Microsoft Xiaoice AI Poetry Collection en 2017 à l'émergence continue de grands modèles multimodaux tels que GPT4 et Sora, un grand nombre de méthodes d'apprentissage profond ont été proposées et mises à jour de manière itérative, déclenchant un boom de développement dans l'AIGC. L'intelligence artificielle générative se concentre sur la production d'images, de textes, de vidéos et d'autres contenus, qui correspondent parfaitement aux besoins quotidiens de production de contenu des médias. L'industrie des médias est confrontée à des opportunités de changement.

Cependant, avec l'application généralisée des grands modèles dans l'industrie des médias, certaines questions sont progressivement apparues, par exemple : faut-il développer nous-mêmes le grand modèle général sous-jacent ? Souhaitez-vous créer un grand modèle de déploiement privatisé pour éviter les fuites de données ? Comment le grand modèle s’intègre-t-il au système d’acquisition et d’édition de la production médiatique ?

En réponse à ces problèmes, Zhang Jian estime que l'industrie des médias n'a pas besoin de « faire rouler » le grand modèle sous-jacent, et qu'il est plus important de bien l'appliquer : « Le déploiement de grands modèles n'est pas un problème, pas plus que la puissance de calcul. et les données difficiles. La clé est de savoir comment améliorer continuellement les capacités après le déploiement.

Zhang Jian a déclaré lors de la réunion que de nombreux grands modèles ne développaient pas entièrement des applications basées sur les besoins de scénarios spécifiques et ne réalisaient pas de conceptions personnalisées pour les besoins des différents groupes d'utilisateurs, ce qui aboutissait à des services peu pratiques. À l'heure actuelle, l'application des grands modèles vise principalement à résoudre une seule tâche simple, tandis que les médias ont besoin de tâches multiples complexes en série ou en parallèle. La spécialisation de l'ingénierie des mots rapides ne peut pas résoudre la situation actuelle de séparation du contenu, du processus et du grand modèle. système. La tendance future des grands modèles médiatiques est de traduire les exigences multitâches complexes des médias en processus simples à tâche unique et d'intégrer de manière transparente des ensembles d'instructions basés sur des scénarios dans le système d'acquisition et d'édition.

Transition du modèle général au modèle médiatique

Dans les scénarios de création multimédia, les grands modèles à usage général ne peuvent produire qu'un seul texte et ne peuvent pas combiner des images et des textes. Les vidéos générées comportent également des risques de droits d'auteur. De toute évidence, les applications générales de grands modèles rencontrent encore des problèmes tels que le manque de profondeur dans les processus métier des médias, le manque d'adaptation basée sur la scène et de personnalisation.

À cet égard, Communication Brain combine la bibliothèque multimédia de données d'actualité avec un grand modèle général, après un réglage fin, il crée un grand modèle de communication qui localise les catégories verticales des médias, offrant aux médias une création intelligente, une révision intelligente, une conception créative et multi-. récupération modale, cinq services majeurs de conversation intelligente. Selon certaines informations, en février 2024, le modèle de communication à grande échelle a été enregistré en ligne grâce à l'intelligence artificielle générative (grand modèle de langage), devenant ainsi le premier modèle médiatique à grande échelle développé par une entreprise de technologie médiatique à passer le processus d'enregistrement. En août, l’algorithme de génération de contenu de Spread Brain a été enregistré auprès de l’Administration nationale du cyberespace de Chine.

Photo gracieuseté de Spread the Brain

Zhang Jian a déclaré que le modèle de communication à grande échelle présente trois caractéristiques majeures : « Premièrement, il peut utiliser des données d'actualité de haute qualité pour la formation, ce qui peut efficacement atténuer la fabrication aléatoire de la génération de contenu de modèle à grande échelle et garantir que le contenu est authentique. , sûr et contrôlable ; deuxièmement, il peut ouvrir une bibliothèque de ressources multimédias du domaine privé, en utilisant de grands modèles pour obtenir une récupération rapide et précise du contenu protégé par le droit d'auteur afin de garantir des droits d'auteur fiables sur le contenu. Troisièmement, il peut créer le supermarché d'applications de grands modèles le plus professionnel du monde ; l'industrie des médias en fonction des rôles des utilisateurs, des scénarios commerciaux et des modalités de contenu, garantissant une utilisation simple et pratique »

C'est précisément sur la base des trois caractéristiques ci-dessus que le grand modèle de communication a également formé ses quatre avantages uniques : « base de connaissances professionnelles sur les médias », « couverture complète des scénarios commerciaux », « accès complet au processus de création » et « contenu multimodal ». support". Accélérez le dernier kilomètre de la mise en œuvre d'un modèle à grande échelle pour les médias.

À l'heure actuelle, le modèle de communication à grande échelle se concentre principalement sur deux scénarios d'application majeurs : le client de convergence multimédia et la plateforme de production de contenu. Dans le scénario de client multimédia intégré, le modèle de communication peut fournir des services de communication vocale et de commentaires personnalisés et intelligents ; dans le scénario de production de contenu, le modèle de communication a des capacités plus riches et peut fournir la rédaction de nouvelles, la génération de vidéos, la récupération multimodale et la génération d'affiches IA. , génération de matériel d'image, examen intelligent du contenu et autres fonctions.

La tendance au développement des grands modèles dans l'industrie des médias

Avec l'avancement continu de la technologie des grands modèles et l'intégration de l'industrie des médias, Zhang Jian a analysé la tendance future des grands modèles dans l'industrie des médias. Il a estimé que l'utilisation des grands modèles comme force motrice principale pour le développement des activités médiatiques serait la tendance. la future industrie des médias. Pour l’industrie des médias, elle doit être centrée sur l’utilisateur, basée sur les exigences des scénarios commerciaux, et utiliser une technologie à grande échelle pour transformer les services technologiques numériques.

L’objectif de développement de Communication Brain est d’ouvrir le dernier kilomètre des applications d’IA. Communication Brain construira un supermarché d'applications pour la prochaine génération de médias en fonction des rôles des utilisateurs, des scénarios commerciaux et des modalités de contenu, et veillera à ce que chaque scénario d'application indépendant soit étroitement intégré à l'activité de production, intégrant et optimisant de manière transparente l'ensemble du flux de travail multimédia. améliorant ainsi l’efficacité et la qualité du travail médiatique.

La maturation continue de la technologie des grands modèles et l'expansion des scénarios d'application ouvriront la voie à une nouvelle ère de développement plus efficace et plus intelligent pour l'industrie des médias. Communication Brain s'engage à devenir un promoteur et un catalyseur important dans ce processus.

"Veuillez indiquer la source lors de la réimpression"

Rapport/Commentaires