новости

природа: исследование дня самого быстрого в мире суперкомпьютера

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



  новый отчет мудрости

монтажер: цяо ян
[введение в новую мудрость]в горах восточного теннесси установлен рекордный суперкомпьютер frontier, который дает ученым беспрецедентные возможности для изучения всего: от атомов до галактик.

строительство суперкомпьютеров идет полным ходом, и суверенные ии-гиганты и технологические гиганты постоянно обеспечивают nvidia переливание крови и строят центры обработки данных.

до этого, по состоянию на декабрь 2023 года, самым быстрым суперкомпьютером в мире был frontier, также известный как olcf-5, расположенный в ок-ридже, штат теннесси, сша.

frontier оснащен центральными и графическими процессорами amd с 50 000 процессорами (включая 38 000 графических процессоров) и скоростью вычислений 1,102 эксафлопс, или 1,102 эксафлопс в секунду (1018) операции с плавающей запятой.

эта скорость даже выше, чем у 100 000 ноутбуков, работающих одновременно, и когда frontier дебютировал в 2022 году, он также впервые побил рекорд скорости вычислений в экзафлопсном масштабе.

суперкомпьютер frontier покрывает территорию, превышающую две баскетбольные площадки

причина стремления к такой превосходной скорости и масштабу заключается в удовлетворении потребностей симуляционных расчетов в передовых научных исследованиях в различных областях.

frontier очень хорош в создании симуляций, которые отражают как крупномасштабные закономерности, так и мелкие детали, например, как крошечные капельки облаков влияют на скорость потепления климата.

сегодня исследователи со всего мира заходят в frontier, чтобы создавать передовые модели всего, от субатомных частиц до галактик, включая моделирование белков для открытия и разработки лекарств, моделирование турбулентности для улучшения авиационных двигателей и обучение llm с открытым исходным кодом, которые конкурируют с google и опенаи.

однако однажды в апреле этого года с деятельностью frontier произошло нечто неожиданное.

бронсон мессер, научный директор ок-риджской национальной лаборатории в теннесси, где находится frontier, рассказал, что для того, чтобы идти в ногу с требованиями ученых всего мира, энергопотребление frontier резко возросло, достигнув пика около 27 мегаватт. для обеспечения электроэнергией около 10 000 домов.

это также создает проблемы для системы охлаждения суперкомпьютера. по словам мессера, «машина работает как ошпаренная собака».

согласно статистике на 2023 год, у frontier в общей сложности 1744 пользователя из 18 стран, а расчеты и данные подтверждают не менее 500 публично опубликованных статей.

исследование внутренней части «мозга» frontier

подобно сцене, которую мы себе представляли, компьютерный зал, где находится frontier, похож на склад, а электронный гул, создаваемый во время работы, ровный и тихий.

в компьютерном зале 74 стойки, каждый узел содержит 4 графических процессора и 1 процессор. причина такой высокой скорости вычислений связана с огромным количеством графических процессоров.

мессер, директор лаборатории, описал: «эти графические процессоры очень быстрые, но они также чрезвычайно глупы. они могут делать одно и то же снова и снова».

эта способность выполнять несколько операций одновременно очень полезна для быстрой работы на суперкомпьютерах, но кроме этого больше особо ничего и нет.

за этой «крайней глупостью» стоит своего рода универсальность. ученые в различных областях могут запускать графические процессоры с помощью специального кода.

frontier работает круглосуточно, а также инженерная группа, отвечающая за эксплуатацию и техническое обслуживание.

команда инженеров, ответственная за создание этого суперкомпьютера, принадлежит компании hewlett-packard. один из технических специалистов, кори эдмондс, сказал, что у них есть команда инженеров, которая будет постоянно контролировать frontier, чтобы определить наличие признаков сбоя.

например, один из сотрудников ночной смены, коннер каннингем, работает с 19:00 до 7 утра. он отвечает за использование более десяти мониторов, чтобы следить за безопасностью сети и зданий, а также следить за местной погодой для обеспечения безопасности. нормальная работа frontier.

фактически, большинство ночей приходится на «сочельник». каннингему обычно достаточно провести лишь несколько проверок, а остальное время он может провести за учебой на своем рабочем месте.

«эта работа немного похожа на работу пожарного. если что-то случится, кто-то должен быть на дежурстве и следить за этим».

поддержка большой науки

хотя frontier работает круглосуточно, исследователям нелегко подать заявку на использование возможностей.

научный директор мессер и трое других коллег отвечают за оценку и утверждение предложений по использованию. в прошлом году они одобрили в общей сложности 131 проект с процентом успешных попыток около 1/4.

чтобы получить одобрение, кандидаты должны продемонстрировать, что их проекты будут использовать всю суперкомпьютерную систему, обычно используемую для моделирования различных временных и пространственных масштабов.

в общей сложности frontier имеет около 65 миллионов узловых часов в год, а наиболее распространенное распределение, полученное исследователями, составляет 500 000 узловых часов, что эквивалентно трем дням непрерывной работы всей системы.

мессер сказал, что исследователи получают в frontier примерно в десять раз больше вычислительных ресурсов, чем в других центрах обработки данных.

frontier имеет более 50 000 процессоров и имеет жидкостное охлаждение.

благодаря более высокой скорости вычислений и большему количеству вычислительных ресурсов исследователи могут заниматься более амбициозной «большой наукой».

например, точное моделирование биологических процессов с точностью на атомном уровне, например, как белки или нуклеиновые кислоты в растворе взаимодействуют с другими частями клетки.

в мае этого года некоторые ученые использовали frontier для моделирования капли воды кубической формы, содержащей более 155 миллиардов молекул воды, что составляет примерно одну десятую ширины человеческого волоса. это одно из крупнейших симуляций на атомном уровне в мире. история.

в краткосрочной перспективе исследователи надеются смоделировать органеллы, чтобы проинформировать лабораторию; они также надеются объединить эти симуляции с высоким разрешением со сверхбыстрой визуализацией с помощью рентгеновских лазеров на свободных электронах, чтобы ускорить открытие.

эти работы открывают путь к более крупной цели в будущем — моделированию всей клетки, начиная с атомов.

благодаря frontier климатические модели также становятся более точными.

в прошлом году ученый-климатолог мэтт норман и другие исследователи использовали frontier для запуска глобальной климатической модели с разрешением 3,25 километра, которая также включала сложные движения облаков в более высоком разрешении.

для создания моделей прогнозирования на десятилетия вперед необходима вычислительная мощность frontier, а для этого требуется вычислительная мощность всей системы.

чтобы модель была пригодна для прогнозирования погоды и климата, требуется как минимум один год ежедневных запусков моделирования.

frontier может моделировать 1,26 года в день — скорость, которая позволяет исследователям создавать более точные прогнозы на 50 лет, чем это было возможно ранее.

если его запустить на другом компьютере, скорость вычислений будет намного медленнее для достижения того же разрешения и учета влияния облака.

в большем космическом масштабе frontier также может обеспечить более высокое разрешение.

эван шнайдер, астрофизик из питтсбургского университета, также использует frontier для изучения того, как галактики размером с млечный путь развиваются по мере старения.

созданные ими модели галактик охватывали четыре порядка величины с максимальным размером около 100 000 световых лет. до frontier крупнейшими структурами, моделировавшимися с аналогичным разрешением, были карликовые галактики с массой около одной пятидесятой.

что frontier означает для ии

будучи бывшим номером один в мире, статус frontier еще более уникален, поскольку этот суперкомпьютер является одним из немногих единиц оборудования, принадлежащих государственному сектору, а не доминируемому промышленностью.

поскольку исследования в области искусственного интеллекта часто требуют огромных вычислительных мощностей, существует огромный разрыв между результатами научных кругов и промышленности.

по статистике некоторых ученых, в 2021 году 96% крупнейших моделей ии будут произведены в отрасли. в среднем промышленные модели почти в 30 раз крупнее академических моделей.

разница также очевидна в сумме инвестиций. в 2021 году государственные учреждения сша, не являющиеся оборонными, выделили 1,5 миллиарда долларов на поддержку исследований в области искусственного интеллекта. в том же году глобальные расходы промышленности превысили 340 миллиардов долларов сша.

с момента выпуска коммерческих llm, таких как gpt-4 и gemini ultra, предыдущий разрыв между ними еще больше увеличился. этот инвестиционный разрыв привел к явной асимметрии вычислительных ресурсов, доступных в промышленности и научных кругах.

поскольку разработка моделей в отрасли направлена ​​на получение прибыли, многие важные проблемы, с которыми приходится сталкиваться при технологическом развитии, часто игнорируются, такие как фундаментальные исследования, потребности групп с низкими доходами, оценка рисков модели, исправление предвзятости модели и т. д.

если академические круги хотят взять на себя эти обязанности, им нужны вычислительные мощности, соответствующие масштабам отрасли, и именно здесь на помощь приходит frontier.

наиболее типичным примером является то, что llm, прошедшие обучение в технологических компаниях, часто сохраняют разную степень собственности, но исследователи часто делают модели, которые они разрабатывают, бесплатными для использования всеми желающими.

это поможет университетским исследователям конкурировать с компаниями, говорит абхинав бхателе, ученый-компьютерщик из университета мэриленда в колледж-парке. «единственный способ для ученых в обучении моделей аналогичного размера — это иметь доступ к таким ресурсам, как frontier».

бхателе считает, что такие учреждения, как frontier, играют жизненно важную роль в области искусственного интеллекта, позволяя большему количеству людей участвовать в разработке технологий и делиться результатами.

однако стоит отметить, что конкуренция за вычислительную инфраструктуру между странами, технологическими компаниями и некоммерческими организациями все еще продолжается, и даже такая мощная компания, как frontier, в конечном итоге падет.

лаборатория ок-ридж уже планирует создать преемника frontier под названием discovery, который увеличит скорость вычислений в 3–5 раз.

для справки, frontier в 35 раз быстрее, чем tianhe-2a, самый быстрый суперкомпьютер 2014 года, и в 33 000 раз быстрее, чем earth simulator, самый быстрый суперкомпьютер 2004 года.

исследователи по-прежнему жаждут более высоких скоростей, но инженеры сталкиваются с постоянными проблемами, одна из которых — энергетика.

энергоэффективность frontier более чем в четыре раза выше, чем у summit, во многом благодаря другим решениям в области охлаждения.

frontier использует для охлаждения воду комнатной температуры, в отличие от summit, который использует холодную воду. на охлаждение уходит от 3% до 4% общего энергопотребления frontier по сравнению с 10% у summit.

в отличие от summit, который использует охлажденную воду. около 3-4% общего энергопотребления frontier используется на охлаждение, по сравнению с 10% у summit.

энергоэффективность была ключевым узким местом в создании более совершенных суперкомпьютеров на протяжении многих лет и, как ожидается, останется таковой в обозримом будущем.

мессер, директор лаборатории, сказал: «мы могли бы построить экзафлопсный суперкомпьютер в 2012 году, но стоимость обеспечения энергией была слишком высока и требовала на один или два порядка больше мощности».