диалог на китайской конференции по вычислительной мощности|академик лю юньцзе: внутренние вычислительные мощности должны компенсировать свои недостатки за счет кластеров графических процессоров
2024-09-29
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
эпоха ии (искусственного интеллекта) — это также эра вычислительной мощности. технологические компании и операторы связи в стране и за рубежом «свернули» 10 000 карт или даже более 10 000 карт, но такие проблемы, как экологичность и гетерогенные вычисления, также стали горами, на которые отрасль должна подняться.
28 сентября во время церемонии открытия китайской конференции по вычислительной мощности 2024 года лю юньцзе, академик китайской инженерной академии, заявил в интервью газете beijing news shell finance и другим сми, что отечественные конечные графические процессоры по-прежнему не смогут конкурировать с ними. с зарубежными странами в короткие сроки. возможный способ восполнить недостатки — построить вычислительную сеть, которая «обучит всю вычислительную мощность» и в полной мере задействует эффект кластеров графических процессоров.
кроме того, он отметил, что невозможно просто судить, какой тип предприятия имеет больше преимуществ в построении вычислительной сети, а главным образом посредством технической оценки. «это зависит от того, можно ли использовать и развивать вашу технологию, и соответствуют ли ваши инновации и выбранный вами путь потребностям». что касается проблемы стоимости вычислительной мощности, он все же подчеркнул, что «ее необходимо решать с помощью новых технологий».
в настоящее время детерминированная сетевая технология, изученная лю юньцзе, может сэкономить от 60% до 70% затрат. проект планирования вычислительной сети, запущенный им совместно с другими учреждениями, может обеспечить многократное дистанционное обучение и достичь 80% эффективности одиночного обучения. точечное обучение.
лю юньцзе, академик китайской инженерной академии. фото предоставлено собеседниками.
рекомендуется использовать крупную отраслевую модель для решения проблем циркуляции данных и использования вычислительной мощности.
«китай должен встать на путь крупномасштабных промышленных моделей», — подчеркнула в своей программной речи лю юньцзе. он считает, что отечественные крупные модели общего назначения в краткосрочной перспективе могут сильно отстать от сша, и догнать их будет сложно.
он предположил, что если отечественные модельные компании смогут хорошо обучать отраслевые данные и создавать крупные отраслевые модели на основе общих крупных моделей, они «определенно смогут пойти по китайскому пути». он с оптимизмом смотрит на это техническое направление, поскольку считает, что «отраслевые данные китая являются наиболее полными и исчерпывающими».
при этом он заявил, что развитие крупномасштабных отраслевых моделей требует совместных усилий правительства, предприятий и капитала. он сообщил репортеру shell finance, что в настоящее время обмен и распространение внутренних данных все еще необходимо усилить, что оказало влияние на большую модель индустрии обучения, и «все еще изучают», какой тип трека является более перспективный.
данные, опубликованные на китайской конференции по вычислительной мощности 2024 года, показывают, что общий масштаб национальной вычислительной мощности достигает 246 eflops. по наблюдению лю юньцзе, отечественная вычислительная мощность достигла определенного масштаба, но уровень использования не очень идеален.
«если вычислительная мощность хочет служить реальной экономике, несколько сторон должны согласиться». лю юньцзе считает, что, прежде всего, поставщики вычислительной мощности и сети должны хорошо работать, «(потому что) они получили выгоду от этих услуг». кроме того, правительство должно говорить хорошие вещи, «(потому что) правительство решило проблему». наконец, компании должны сказать хорошо: «(потому что) компании повысили свою эффективность за счет использования вычислительных мощностей и интернета».
он подчеркнул, что эффект «соглашения одной стороны» не является продолжительным, а это означает, что в отрасли не создана экосистема вычислительных мощностей. «если мы не решим экологическую проблему, мы не сможем использовать ее (вычислительную мощность)».
детерминированная сеть — одна из базовых технологий будущей вычислительной сети, которая позволит сэкономить 60–70% затрат.
«обучение больших моделей требует передачи данных без потерь и предъявляет требования к сетевым показателям, таким как потеря пакетов, дрожание и задержка», — сказал лю юньцзе. приведя в качестве примера международные стандарты передачи данных, он пояснил, что если скорость потери пакетов достигнет пятитысячных, эффективность передачи упадет на 50%.
далее он объяснил, что это похоже на использование всей полосы пропускания 100g для передачи данных, и полезна только полоса пропускания 50g. «когда он падает до 1%, его эффективность примерно равна 0, что делает невозможным обучение и рассуждение».
протокол rdma (remote direct memory access) необходим сети, чтобы избежать потери пакетов. эта технология позволяет компьютеру напрямую обращаться к памяти удаленного компьютера, передавать данные на уровне памяти без частого вмешательства цп, а также уменьшать задержку обработки и потребление ресурсов отправляющей и принимающей стороны в процессе передачи данных.
как соблюсти стандарты передачи данных для обучения и вывода больших моделей? лю юньцзе считает, что детерминированная сетевая технология относительно отвечает требованиям, и считает ее «базовой технологией для будущих вычислительных сетей». лю юньцзе рассказал, что в 2022 году он возглавил команду по открытию детерминированных сетей в 35 городах. сейчас количество городов увеличилось до 39. они могут обеспечить сквозную задержку и джиттер менее 50 микросекунд и нулевую потерю пакетов. .
лю юньцзе считает, что в процессе разработки детерминированной сетевой технологии наиболее важным технологическим прорывом является фотоэлектрическая интеграция, которая приносит прорывы в использовании полосы пропускания, стоимости сети и энергопотреблении.
что касается затрат, он взял в качестве примера одну компанию по автономному вождению и объяснил, что данные по автономному вождению, генерируемые 20 транспортными средствами в 4 местах по всей стране каждый день, сначала отправляются обратно в шанхай, а затем в гуйян для обучения, что требует около две цепи 10g и a 1g стоят около 10 миллионов юаней в год.
что мне делать, если я не могу себе этого позволить? переход на использование жестких дисков для сбора данных и их транспортировку между двумя городами с учетом потери данных, повреждения жесткого диска и т. д. обойдется примерно в 1,9 млн юаней в год. а при использовании детерминированной сети для предоставления услуг посредством нарезки «достаточно 120 000 юаней в год».
лю юньцзе подчеркнул, что такой уровень снижения затрат достигается за счет совместного использования сети. данные, которые он представил в своей программной речи, показали, что он работает в тестовой сети более трех месяцев, при этом эффективность параметров достигает более 95%, а экономия средств составляет от 60% до 70%.
в полной мере использовать эффект кластера графических процессоров, чтобы компенсировать недостатки отечественных вычислительных мощностей.
станет ли сеть вычислительных мощностей тем направлением, в котором отечественные вычислительные мощности превзойдут зарубежные вычислительные мощности в будущем? лю юньцзе сказал, что более точное понимание состоит в том, чтобы «восполнить недостатки». он считает, что через короткий промежуток времени наши конечные gpu все равно не смогут конкурировать с зарубежными странами. «возможно, я не смогу сравниться с вами ни в одном аспекте, но я могу победить вас, используя мощь группы». далее он подчеркнул, что для оказания эффекта кластеров графических процессоров необходимо построить сеть для «обучения». всю вычислительную мощность».
он считает, что крупные модели могут пойти по пути совместного обучения и распределенного обучения. «если обучать 100 000 карточек в одном месте, мощности будет слишком много». он сообщил, что его команда запустила программу совместно с китайской академией наук. национальный суперкомпьютерный центр уси и другие учреждения. проект планирования национальной вычислительной сети может достичь эффекта решения проблем очередей на минутном уровне, а многократное дистанционное обучение может достичь 80% эффективности одноточечного обучения. «в принципе, распределенное обучение и совместное обучение возможны».
говоря о том, как координировать взаимоотношения между разработкой компьютерного оборудования и программного обеспечения, лю юньцзе предложил объединить и интегрировать программное и аппаратное обеспечение для разработки.
производство оборудования потребляет геофизические ресурсы, сказал он. «(каждый раз) оно потребляет немного меньше ресурсов». программное обеспечение относительно гибкое, его можно модифицировать и потреблять меньше физических ресурсов. «это очень важная концепция социального развития». кроме того, лю юньцзе считает, что разработка программного обеспечения требует определенного количества человеческих ресурсов, но после применения ии эффективность разработки возросла. затем он предложил, чтобы все части, которые могут быть заменены программным обеспечением, были максимально развиты.
«но программное обеспечение не всемогуще и должно соответствовать аппаратным условиям, необходимым для вычислительной мощности». он считает, что части, которые программное обеспечение не может выдержать, должны разрабатываться совместно с аппаратным обеспечением.
как создать экосистему общей вычислительной сети? лю юньцзе предположил, что соответствующие правительственные ведомства должны координировать и управлять этим, а предприятия и научно-исследовательские учреждения должны тесно сотрудничать. «это общий проект, но в настоящее время каждый работает самостоятельно».
репортер beijing news shell finance вэй инцзы
редактор линь цзы
корректура лю цзюня