Коммутатор MQM8790-HS2R_ NVIDIA Mellanox Quantum — 40-портовая HDR InfiniBand платформа с пропускной способностью 16 Тбит/с и задержкой менее 90 нс. Технология SHARP in-network computing выполняет коллективные операции MPI непосредственно в коммутаторе, ускоряя распределённое обучение нейросетей. MQM8790-HS2R_ используется в суперкомпьютерных кластерах, AI/ML-инфраструктуре и системах хранения с параллельными файловыми системами.
Применение и сценарии использования
GPU-кластеры для обучения AI/ML моделей
Коммутатор MQM8790-HS2R_ обеспечивает межузловой интерконнект для кластеров NVIDIA DGX A100 и H100. SHARP снижает трафик All-Reduce на 50%, позволяя масштабировать кластер с линейным ростом производительности без насыщения сети при обмене градиентами.
HPC-суперкомпьютеры и CFD/FEA симуляции
Задержка менее 90 нс критична для MPI-задач вычислительной гидродинамики: каждый барьер синхронизации умножается на число итераций симуляции. Adaptive Routing v2 автоматически балансирует потоки между путями fat-tree без ручной настройки.
Параллельные файловые системы (Lustre, GPFS, WEKA)
Non-blocking коммутация 16 Тбит/с гарантирует каждому из 40 узлов полную полосу к NSD-серверам при пиковых checkpoint-операциях — без конкуренции за пропускную способность магистрали.
Технические характеристики
- Артикул: MQM8790-HS2R_
- Производитель: NVIDIA (Mellanox)
- Модель: Quantum QM8790
- Форм-фактор: 1U, 19″
- Тип: HDR InfiniBand Smart Switch
- Портов: 40 × QSFP56 200 Гбит/с (HDR; поддержка 2×100G HDR100)
- Пропускная способность: 16 Тбит/с (non-blocking)
- Задержка: <90 нс (cut-through)
- SHARP: in-network computing (All-Reduce, Broadcast, Scatter/Gather)
- Маршрутизация: Adaptive Routing v2
- Subnet Manager: встроенный OpenSM + NVIDIA UFM
- Питание: 2 × AC БП (1+1 резерв, горячая замена)
- Охлаждение: C2P airflow (задний → передний), горячезаменяемые вентиляторы
- Потребление: 300–450 Вт
- Консоль: Да (RJ-45)
- Порт управления: 1 × 1GbE RJ-45 OOB
- Рабочая температура: 0–45°C
- Температура хранения: −40–70°C
- Габариты: 43,2 × 429,3 × 594,4 мм
- Вес нетто: ~14 кг
- Гарантия: 12 месяцев
Комплектация и установка
Стандартная комплектация: коммутатор MQM8790-HS2R_, 2 × БП AC, Rail Kit, документация. Кабели QSFP56 (DAC, AOC или трансиверы) приобретаются отдельно по топологии кластера.
Рекомендации по размещению
Форм-фактор 1U, глубина 594,4 мм — требуется стойка от 1000 мм глубиной. Воздушный поток C2P: холодный воздух входит сзади, выходит спереди через порты QSFP56. Подключайте оба БП к разным PDU; рекомендуется выделенная линия 16А на каждый блок.
Интеграция с инфраструктурой
Совместимость: NVIDIA Mellanox HDR HCA ConnectX-6; NVIDIA DGX A100/H100; стандарт InfiniBand HDR; SHARP; NVMe-oF over IB; MPI/NCCL; RDMA/GPUDirect; топологии Fat-Tree, SlimFly, Dragonfly+.
Преимущества решения
- 16 Тбит/с non-blocking: каждый из 40 портов получает гарантированную полосу 200 Гбит/с без деградации при полной нагрузке.
- SHARP in-network computing: All-Reduce в коммутаторе снижает нагрузку на GPU/CPU на 50% при распределённом обучении.
- <90 нс задержка: субмикросекундный интерконнект для MPI-барьеров и NVMe-oF over IB.
- Резервируемые БП и вентиляторы: горячая замена без остановки кластерных заданий.
Вопросы и ответы
Что такое NVIDIA SHARP и зачем он нужен в MQM8790-HS2R_?
SHARP выполняет агрегации MPI (All-Reduce, Broadcast) прямо в чипе коммутатора при пересылке данных. Это снижает трафик между GPU-узлами и ускоряет барьеры синхронизации в NCCL — особенно заметно при обучении моделей от 100 GPU.
Совместим ли MQM8790-HS2R_ с адаптерами EDR/FDR?
Да, порты QSFP56 поддерживают HDR (200G), HDR100 (100G) и FDR10 (50G) с автоопределением. Адаптеры ConnectX-4 (FDR) и ConnectX-5 (EDR) работают в одной фабрике с HDR-устройствами.
Какие кабели используются для MQM8790-HS2R_?
QSFP56 DAC (пассивная медь, до 3 м), QSFP56 AOC (активная оптика, до 100 м), оптические трансиверы QSFP56 (одномодовое волокно, до 2 км). Рекомендуются кабели NVIDIA Mellanox серии MCP1600 (DAC) или MFS1S00 (AOC).
Контакты
Отдел продаж:
+7 (499) 288-88-37
info@eddp.ru