nouvelles

Afin de fournir un corpus de haute qualité pour les grands modèles d’IA, la construction de cette infrastructure a commencé !

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Le 19 août, lors de la Conférence sur l'écosystème de l'intelligence artificielle de Pékin 2024, la construction d'une infrastructure de circulation fiable pour les corpus de grande valeur a été officiellement lancée. Sous l’escorte des technologies de l’information de pointe telles que la blockchain et l’informatique privée, les corpus de données qui soutiennent la croissance de haute qualité des grands modèles d’intelligence artificielle feront leurs adieux à la circulation désordonnée et se transformeront en une « autoroute » de fonctionnement standardisé. Cela est d'une grande importance pour accélérer la formation d'un grand modèle de formation en intelligence artificielle et pour promouvoir le dépassement et le développement de l'intelligence artificielle de mon pays.

Ces dernières années, la technologie de l’intelligence artificielle s’est développée rapidement et a joué un rôle de plus en plus important dans des domaines clés de l’économie nationale. Les données de corpus de grande valeur utilisées dans la formation de grands modèles sont comme un « carburant » important dans le développement de grands modèles d'intelligence artificielle. Cependant, les données de corpus de grande valeur sont réparties entre les unités, les secteurs et les régions, et ne disposent pas d'une sécurité de confidentialité suffisante ni de mécanismes efficaces d'incitation à la circulation. En conséquence, les propriétaires de données de corpus de grande valeur « n'osent pas partager » ou « ne veulent pas ». à partager." . Une grande quantité de données de corpus de grande valeur est « difficile à fournir, à circuler et à utiliser » et est devenue un goulot d'étranglement pour le développement ultérieur de l'intelligence artificielle en Chine.

Il est rapporté que l'infrastructure de circulation fiable des corpus de grande valeur est dirigée par le Centre national d'innovation technologique Blockchain et le Beijing Energy Group, et coopère avec plus de 10 sociétés chinoises de corpus, dont le Laboratoire national clé de l'agence de presse Xinhua, le Quotidien du Peuple en ligne, Higher Education Press et mon pays General Technology Group Créés conjointement par des unités de données clés. La nouvelle génération de technologies de l'information représentée par la blockchain et l'informatique confidentielle peut garantir une circulation, une utilisation et une gestion fiables et sûres des données du corpus grâce à ses caractéristiques de stockage de certificats fiable, de non-falsification, de vérification facile des droits et de protection complète des données. confidentialité et sécurité, résolvent efficacement les problèmes ci-dessus.

Selon la personne concernée en charge du Centre national d'innovation technologique de la blockchain, l'infrastructure de circulation fiable des corpus de grande valeur utilisera la technologie logicielle et matérielle blockchain contrôlable de manière indépendante et de pointe pour construire un pont d'interconnexion de données de corpus distribué à l'échelle nationale. les fournisseurs, les processeurs et les demandeurs de corpus pour obtenir un accès fiable aux données de corpus distribuées à l'échelle nationale, les rendant découvrables et accessibles dans toutes les régions, formant en même temps un ensemble de données de corpus de haute qualité, en utilisant une technologie informatique innovante de confidentialité, grâce à « les données ne sont pas ; L'approche de fuite « Domaine, disponible et invisible » garantit que les données de corpus de grande valeur à grande échelle ne peuvent pas être diffusées sans autorisation pendant le traitement et la formation du modèle. De plus, cette infrastructure mettra également en œuvre des incitations en chaîne via des contrats intelligents pour fournir ; Les ressources du corpus et la circulation fournissent un pouvoir endogène durable.

Avec le soutien d'une infrastructure de circulation fiable de données de corpus de grande valeur, les principales unités nationales de données de corpus développeront également des spécifications de circulation fiables et sécurisées pour les données de corpus basées sur la blockchain et l'informatique confidentielle afin de former un système durable pour la circulation et la valeur ajoutée des données de corpus. données de corpus de grande valeur.

Source : Client quotidien de Pékin

Journaliste : Sun Qiru

Rapport/Commentaires