Что включает курс
Теоретическая часть:
- Введение в HPC-кластеры: назначение, компоненты, принципы работы
- Обзор аппаратной архитектуры кластера: вычислительные узлы, сети, хранилище
- Файловые системы для HPC: локальные и распределенные решения (NFS)
- Планировщик задач SLURM: концепция, настройки, распределение вычислительных ресурсов
- Основы производительности HPC: LINPACK и другие тестовые утилиты
Практическая часть:
- Установка и базовая настройка HPC-кластера
- Развертывание системы хранения на базе NFS
- Настройка и работа с SLURM для управления задачами в HPC
- Запуск тестов производительности (LINPACK) и анализ результатов
- Поиск узких мест в кластере и способы их устранения
- Мониторинг работы кластера, диагностика и устранение неисправностей
Программа обучения (онлайн/оффлайн)
Этот курс поможет участникам получить практические навыки работы с HPC-кластерами и подготовит их к внедрению вычислительных систем в различных отраслях.
Длительность обучения:
Онлайн: 2 полных дня (с 10:00 до 16:00 по МСК)
Оффлайн: 2 полных дня (с 11:00 до 17:00 по МСК)
День 1 (10:00 – 16:00)
09:30 - 10:00 — Регистрация участников
10:00 - 11:30 — НРС и области его применения
11:30 - 11:45 — Перерыв на кофе
11:45 - 13:15 — Из каких частей состоит HPC
13:15 - 14:15 — Перерыв на обед
14:15 - 15:45 — Лабораторные работы:
Лабораторная 1: Подготовка управляющего узла
Лабораторная 2: Установка и настройка Confluent
Лабораторная 3: Инсталляция вычислительных узлов
15:45 - 16:00 — Подведение итогов первого дня
День 2 (10:00 – 16:00)
09:30 - 10:00 — Регистрация участников
10:00 - 11:30 — Планировщик SLURM. LINPACK
11:30 - 11:45 — Перерыв на кофе
11:45 - 13:15 — Поддержка НРС кластера Lenovo
13:15 - 14:15 — Перерыв на обед
14:15 - 15:45 — Лабораторные работы:
Лабораторная 4: Инсталляция, настройка и тестирование SLURM
Лабораторная 5: Инсталляция, настройка и тестирование LINPACK
15:45 - 16:00 — Подведение итогов обучения
Определение (Что такое HPC?)
HPC (High-Performance Computing) — это метод вычислений, использующий мощные суперкомпьютеры и вычислительные кластеры для решения сложных задач, требующих больших объемов обработки данных. HPC позволяет выполнять миллиарды и триллионы операций в секунду (флопс), что делает его незаменимым в научных и инженерных вычислениях.
Основные характеристики:
- Высокая производительность — HPC-системы используют параллельную обработку данных, позволяя распределять задачи между сотнями или тысячами процессоров.
- Масштабируемость — можно увеличивать вычислительные мощности, добавляя узлы к кластеру.
- Гибкость хранения данных — поддержка различных систем хранения, в том числе сетевых файловых систем.
- Устойчивость к сбоям — продвинутые механизмы резервирования и балансировки нагрузки
Применение
- Наука и исследования: моделирование молекулярных процессов, климатических изменений, физических явлений.
- Инженерия: расчет аэродинамики, моделирование конструкций, создание новых материалов.
- Медицина: обработка геномных данных, разработка лекарств, моделирование биологических процессов.
- Финансы: моделирование рисков, анализ больших массивов данных, предсказание трендов.
- Государственные проекты: защита данных, анализ разведывательной информации, оборонные исследования.