teleai завершила обучение первой крупномасштабной модели wanka wangan национального производства и открыла исходный код telechat2-115b

teleai завершила первое национальное обучение большой модели wanka wangan, telechat2-115b с открытым исходным кодом.

2024-09-29

недавно исследовательский институт искусственного интеллекта china telecom (именуемый: teleai) успешно завершил первую в китае большую модель с триллионом параметров на основе национального кластерного обучения wanka (именуемого: wanka wancan) и официально открыл исходный код первой внутри страны. созданная модель на основе кластера wanka telechat2-115b национального производства, большой модели с сотнями миллиардов параметров, обученных кластером huawanka и отечественной структурой глубокого обучения, представляет собой большую модель star semantics.

это еще одна веха и важное научное достижение под руководством профессора ли сюэлуна, технического директора, главного научного сотрудника china telecom group и декана научно-исследовательского института искусственного интеллекта china telecom. это означает, что отечественное крупномасштабное обучение моделям действительно осознало замену национализации. и официально вышел на рынок. новый этап независимых инноваций, безопасности и управляемости для отечественного производства.

telechat2-115b был обучен на основе разработанной china telecom «интегрированной интеллектуальной вычислительной сервисной платформы» и «xinghai ai platform» компании по искусственному интеллекту. он использует различные методы оптимизации для повышения эффективности и точности обучения моделей, обеспечивая при этом обучение. стабильность, достигающая более 93% вычислительной эффективности графического процессора при той же вычислительной мощности, при этом эффективное время обучения модели составляет более 98%.

открытый исходный код telechat2-115b знаменует собой еще один новый путь локализации крупных моделей. будучи первым государственным предприятием, разработавшим и открывшим исходный код больших моделей, teleai активно способствует постоянному развитию технологий больших моделей с помощью открытого исходного кода, а также продолжает продвигать и возглавлять быстрый переход технологических инноваций к промышленному внедрению.

в списке тестов opencampass в мае этого года возможности логических рассуждений моделей серии telechat заняли первое место в списке крупных моделей с открытым исходным кодом. будучи версией нового поколения, telechat2-115b занял первое место с результатом 86,9 балла в последнем комплексном списке моделей открытого доступа c-eval, опубликованном в сентябре. его общие возможности почти на 30% выше, чем у моделей серии telechat, особенно с точки зрения использования инструментов, логических рассуждений, математических вычислений, генерации кода и написания длинных форм.

telechat2-115b занимает первое место в обширном списке моделей открытого доступа c-eval.

понятно, что большая семантическая модель, разработанная teleai, заняла первые места во многих авторитетных конкурсах. среди них он занял первое место в оценке китайского пространственного семантического понимания и оценке извлечения типов древних китайских исторических событий на конференции ccl2024. кроме того, он выиграл чемпионат в конкурсе nlpcc2024 chinese argumentative paper mining (shared task5).

(информация)

отчет/отзыв

новости

teleai завершила первое национальное обучение большой модели wanka wangan, telechat2-115b с открытым исходным кодом.

введение

моя контактная информация