teleai a terminé la formation du premier modèle à grande échelle wanka wangan produit au niveau national et open source telechat2-115b

teleai a terminé la première formation sur les grands modèles wanka wangan de production nationale, open source telechat2-115b

2024-09-29

récemment, l'institut de recherche sur l'intelligence artificielle de china telecom (appelé : teleai) a achevé avec succès le premier grand modèle de mille milliards de paramètres en chine basé sur la formation du cluster wanka produite au niveau national (appelé : wanka wancan), et a officiellement lancé en open source le premier au niveau national. le modèle produit basé sur le cluster wanka produit au niveau national, un grand modèle avec des centaines de milliards de paramètres formés par le cluster huawanka et un cadre d'apprentissage profond national, est un grand modèle de star semantics.

il s'agit d'une autre étape importante et d'une réalisation importante en matière de recherche scientifique dirigée par le professeur li xuelong, directeur technique, scientifique en chef du groupe china telecom et doyen de l'institut de recherche sur l'intelligence artificielle de china telecom. cela montre que la formation nationale sur modèles à grande échelle a véritablement réalisé le remplacement de la nationalisation. et est officiellement entré sur le marché. une nouvelle étape d'innovation indépendante, de sécurité et de contrôlabilité pour la production nationale.

telechat2-115b a été formé sur la base de la « plateforme de services informatiques intelligents intégrés » tianyi cloud auto-développée par china telecom et de la « plateforme d'ia xinghai » de la société d'intelligence artificielle. il utilise une variété de méthodes d'optimisation pour améliorer l'efficacité et la précision de la formation des modèles tout en garantissant la formation. précision. stabilité, atteignant plus de 93 % de l’efficacité de calcul du gpu avec la même puissance de calcul, tandis que le temps de formation effectif du modèle représente plus de 98 %.

l'open source de telechat2-115b marque un autre nouveau voyage pour la localisation de grands modèles. en tant que première entreprise publique à concevoir et à ouvrir des grands modèles, teleai promeut activement le progrès continu de la technologie des grands modèles grâce à l'open source, et continue de promouvoir et de diriger la transition rapide de l'innovation technologique vers la mise en œuvre industrielle.

dans la liste de tests opencampass de mai de cette année, les capacités de raisonnement logique des modèles de la série telechat se sont classées au premier rang dans la liste des grands modèles open source. en tant que version de nouvelle génération, telechat2-115b s'est classée première avec un score de 86,9 points dans la dernière liste complète des modèles d'évaluation open access c-eval publiée en septembre. ses capacités générales sont près de 30 % supérieures à celles des modèles de la série telechat, notamment en termes d'utilisation d'outils, de raisonnement logique, de calculs mathématiques, de génération de code et d'écriture longue.

telechat2-115b se classe premier dans la liste complète des modèles open access de c-eval

il est entendu que le grand modèle sémantique développé par teleai a remporté la première place dans de nombreux concours faisant autorité. parmi eux, il a remporté la première place dans l’évaluation de la compréhension sémantique spatiale chinoise et dans l’évaluation de l’extraction des types d’événements historiques chinois anciens lors de la conférence ccl2024. de plus, il a remporté le championnat du défi nlpcc2024 chinese argumentative paper mining (shared task5).

(information)

rapport/commentaires

nouvelles

teleai a terminé la première formation sur les grands modèles wanka wangan de production nationale, open source telechat2-115b

introduction

mes coordonnées