Американские исследователи из Ливерморской национальной лаборатории в ходе разработки технологии моделирования ядерных взрывов нашли способ радикально увеличить вычислительную мощь суперкомпьютеров.
Поскольку международные договоры запрещают испытания ядерного оружия, его совершенствуют с помощью высокоточных компьютерных моделей. Однако данное моделирование, выполняемое на молекулярном уровне, требует огромных вычислительных мощностей. Расчеты приходится выполнять на суперкомпьютерах, содержащих тысячи процессоров, но при этом неизбежно возникают ошибки, связанные с параллельным обсчетом множества процессов, протекающих за считанные миллисекунды ядерного взрыва.
В связи с неизбежными ошибками, возникающими в аппаратуре, программном обеспечении, коммуникационных узлах и т.д., в расчеты закрадываются неточности, которые влияют на результат моделирования. Часто эти ошибки приводят к остановке дорогостоящего и трудоемкого процесса моделирования или, что еще хуже, – к неверным данным в финале моделирования.
Американские ученые впервые разработали совершенные автоматизированные методики обнаружения ошибок вскоре после их возникновения. В частности, решена одна из основных проблем, связанная со сбоями центрального сервера, принимающего данные с сотен компьютеров.
«Потоковые данные хорошо идут на центральный сервер, когда с ним работает сто машин, однако при подключении тысячи компьютеров начинаются сбои, - объясняет один из авторов исследования докторант Игнасио Лагуна. - Мы ликвидировали этот центральный «мозг» и таким образом избавились от самого слабого звена в вычислительной цепи».
Суть методики заключается в следующем: обычно каждая машина в суперкомпьютерном кластере содержит несколько ядер или процессоров, каждое из которых во время моделирования обрабатывает один процесс. Исследователи создали автоматизированный метод «кластеризации» или группировки большого количества процессов в меньшем количестве групп процессов с аналогичными признаками. Группировка процессов позволяет быстро обнаружить и устранить ошибки.
Данная технология, по словам ученых, - это настоящий «Святой Грааль» суперкомпьютеров. Она позволит радикально повысить вычислительную мощь компьютерных кластеров и создать «монстров», способных выполнять до 1000 квадриллионов операций в секунду. Благодаря отсутствию «файлового болота», на обработку которого уходит львиная доля мощности современных суперкомпьютеров, перед учеными открываются совершенно новые возможности по моделированию не только ядерных взрывов, но и глобального климата, динамических изменений формы белков, масштабных космических явлений и других сложнейших процессов.