noticias

teleai completó la primera capacitación de modelo grande wanka wangan de producción nacional, telechat2-115b de código abierto

2024-09-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

recientemente, el instituto de investigación de inteligencia artificial de china telecom (denominado: teleai) completó con éxito el primer modelo grande de un billón de parámetros en china basado en la capacitación en clúster wanka producida a nivel nacional (denominado: wanka wancan), y abrió oficialmente el primer modelo nacional. el modelo producido basado en el grupo wanka producido a nivel nacional telechat2-115b, un modelo grande con cientos de miles de millones de parámetros entrenados por el grupo huawanka y el marco de aprendizaje profundo nacional, es un modelo grande de star semantics.

este es otro hito y un logro importante de la investigación científica dirigido por el profesor li xuelong, cto, científico jefe del china telecom group y director del instituto de investigación de inteligencia artificial de china telecom. marca que la capacitación en modelos nacionales a gran escala realmente ha logrado la sustitución de la nacionalización. y entró oficialmente en el mercado. una nueva etapa de innovación independiente, seguridad y controlabilidad para la producción nacional.

telechat2-115b ha sido capacitado en base a la "plataforma de servicios de computación inteligente integrada" de tianyi cloud, de desarrollo propio de china telecom, y la "plataforma de ia xinghai" de la compañía de inteligencia artificial. utiliza una variedad de métodos de optimización para mejorar la eficiencia y precisión del entrenamiento del modelo al tiempo que garantiza el entrenamiento. estabilidad, logrando más del 93% de la eficiencia informática de la gpu con la misma potencia informática, mientras que el tiempo de entrenamiento efectivo del modelo representa más del 98%.

el código abierto de telechat2-115b marca otro nuevo viaje para la localización de modelos grandes. como la primera empresa estatal en diseñar y abrir modelos grandes de código abierto, teleai promueve activamente el progreso continuo de la tecnología de modelos grandes a través del código abierto y continúa promoviendo y liderando la rápida transición de la innovación tecnológica a la implementación industrial.

en la lista de pruebas de opencampass de mayo de este año, las capacidades de razonamiento lógico de los modelos de la serie telechat ocuparon el primer lugar en la lista de modelos grandes de código abierto. como versión de nueva generación, telechat2-115b ocupó el primer lugar con una puntuación de 86,9 puntos en la última lista completa del modelo de acceso abierto de evaluación c-eval publicada en septiembre. sus capacidades generales son casi un 30% superiores a las de los modelos de la serie telechat, especialmente en términos de uso de herramientas, razonamiento lógico, cálculos matemáticos, generación de código y escritura de formato largo.

telechat2-115b ocupa el primer lugar en la lista completa de modelos de acceso abierto de c-eval

se entiende que el gran modelo semántico desarrollado por teleai ha ganado el primer lugar en muchas competiciones autorizadas. entre ellos, ganó el primer lugar en la evaluación de comprensión semántica espacial china y en la evaluación de extracción de tipos de eventos históricos chinos antiguos en la conferencia ccl2024. además, ganó el campeonato en el desafío nlpcc2024 chinese argumentative paper mining (shared task5).

(información)

informe/comentarios