Коммутатор MQM8790-HS2R_ NVIDIA Mellanox Quantum — 40-портовая HDR InfiniBand платформа с пропускной способностью 16 Тбит/с и задержкой менее 90 нс. Технология SHARP in-network computing выполняет коллективные операции MPI непосредственно в коммутаторе, ускоряя распределённое обучение нейросетей. MQM8790-HS2R_ используется в суперкомпьютерных кластерах, AI/ML-инфраструктуре и системах хранения с параллельными файловыми системами.

Применение и сценарии использования

GPU-кластеры для обучения AI/ML моделей

Коммутатор MQM8790-HS2R_ обеспечивает межузловой интерконнект для кластеров NVIDIA DGX A100 и H100. SHARP снижает трафик All-Reduce на 50%, позволяя масштабировать кластер с линейным ростом производительности без насыщения сети при обмене градиентами.

HPC-суперкомпьютеры и CFD/FEA симуляции

Задержка менее 90 нс критична для MPI-задач вычислительной гидродинамики: каждый барьер синхронизации умножается на число итераций симуляции. Adaptive Routing v2 автоматически балансирует потоки между путями fat-tree без ручной настройки.

Параллельные файловые системы (Lustre, GPFS, WEKA)

Non-blocking коммутация 16 Тбит/с гарантирует каждому из 40 узлов полную полосу к NSD-серверам при пиковых checkpoint-операциях — без конкуренции за пропускную способность магистрали.

Технические характеристики

Комплектация и установка

Стандартная комплектация: коммутатор MQM8790-HS2R_, 2 × БП AC, Rail Kit, документация. Кабели QSFP56 (DAC, AOC или трансиверы) приобретаются отдельно по топологии кластера.

Рекомендации по размещению

Форм-фактор 1U, глубина 594,4 мм — требуется стойка от 1000 мм глубиной. Воздушный поток C2P: холодный воздух входит сзади, выходит спереди через порты QSFP56. Подключайте оба БП к разным PDU; рекомендуется выделенная линия 16А на каждый блок.

Интеграция с инфраструктурой

Совместимость: NVIDIA Mellanox HDR HCA ConnectX-6; NVIDIA DGX A100/H100; стандарт InfiniBand HDR; SHARP; NVMe-oF over IB; MPI/NCCL; RDMA/GPUDirect; топологии Fat-Tree, SlimFly, Dragonfly+.

Преимущества решения

Вопросы и ответы

Что такое NVIDIA SHARP и зачем он нужен в MQM8790-HS2R_?

SHARP выполняет агрегации MPI (All-Reduce, Broadcast) прямо в чипе коммутатора при пересылке данных. Это снижает трафик между GPU-узлами и ускоряет барьеры синхронизации в NCCL — особенно заметно при обучении моделей от 100 GPU.

Совместим ли MQM8790-HS2R_ с адаптерами EDR/FDR?

Да, порты QSFP56 поддерживают HDR (200G), HDR100 (100G) и FDR10 (50G) с автоопределением. Адаптеры ConnectX-4 (FDR) и ConnectX-5 (EDR) работают в одной фабрике с HDR-устройствами.

Какие кабели используются для MQM8790-HS2R_?

QSFP56 DAC (пассивная медь, до 3 м), QSFP56 AOC (активная оптика, до 100 м), оптические трансиверы QSFP56 (одномодовое волокно, до 2 км). Рекомендуются кабели NVIDIA Mellanox серии MCP1600 (DAC) или MFS1S00 (AOC).