Норси Транс НТ ПАЛАДИН ML
Графический контроллер: Дискретный 2D на основе AST2500:макс. разрешение 1920 x 1200 @60Hz
Интерфейсы: 1 Gbe Ethernet: 2 на тыльной панели 1Gbe BMC: 1 на тыльной панели USB 3.0: 3 на тыльной панели VGA: 1 на задней панели
Процессор: 2 x Intel Xeon Scalable-2 с TDP до 185 Вт
Чипсет: Intel® C624
Номинальная мощность, Вт: CRPS 1+1 БП, 1200 Вт
Системные вентиляторы: 8 шт. основных системных. 6 шт. малооборотных вспомогательных.
Материнская плата: НИКА.469555.001 Паладин-Х01
ОЗУ: DDR4, до 24 шт.
Максимальный объем: 3 Тб
OCP 3.0: 1 шт. PCIe 16x либо 1 шт. PCIe 8x
Либо OCP 2.0: 1
M.2 SSD на материнской плате: 2
M.2 PCIe 4x NVMe на объединительных платах: 2
Напряжение: 220/48В
Габариты, мм: 43,5 х 438 х 917
Вычислительный узел Норси Транс НТ ПАЛАДИН ML представляет собой высокопроизводительную систему для обработки больших объемов данных. Он оснащен 2мя процессорами Intel Xeon и 24 модулями памяти DDR4, что обеспечивает быструю работу с данными. Узел также имеет несколько отсеков для дисков, что позволяет хранить большое количество данных. Встроенное программное обеспечение обеспечивает автоматическую настройку и управление системой. Система имеет резервирование питания 1+1 и может использоваться в различных приложениях, требующих высокой производительности.
Блейд сервер Норси Транс НТ ПАЛАДИН ML может использоваться в различных областях, таких как научные исследования, анализ данных и разработка программного обеспечения.
Назначение и применение AI-сервера гетерогенного вычислительнного НТ Паладин ML:
- Задачи выполнения (инференс) нейросетевых моделей;
- Высокопроизводительные векторно-матричные вычисления, требующиех операций двойной точности (FP64).
Платформа построена на базе материнской платы НИКА.469555.001 Паладин-Х01.
Архитектура гетерогенного вычислителя:
В качестве векторно-матричных сопроцессоров используются процессоры NM6408 NeuroMatrix, в общей сложности вычислитель поддерживает 12 таких сопроцессоров. Каждый сопроцессор подключается к основным процессорам через линии PCIe 4x. Сопроцессоры обеспечивают производительность около 1,53 TFLOPS в режиме FP64.

Операционная система устанавливается на два объединенных в RAID SSD-накопителя M.2 SATA. Для кеширования промежуточных данных используются два диска NVME PCIe 4x. Возможна загрузка операционной системы по сети (PXE), в этом случае установка системных накопителей M.2 SATA не требуется или они могут использоваться как дополнительные дисковые кеши.
Интерфейсы взаимодействия с вычислительными ядрами
Модели нейросетей, прошедшие обучение, запускаются после предварительного преобразования в формат ONNX. Этот формат используется библиотекой NMDL для преобразования в форму, необходимую для запуска на сопроцессорах, установленных в вычислителе. Затем полученный формат используется кодом на C/C++ для запуска моделей на сопроцессорах.