Серверное оборудование для инференса GigaChat 3.1 — купить в СервакМастер

Серверы для инференса GigaChat 3.1

«СервакМастер» предлагает готовые серверные решения и высокопроизводительные AI-системы, оптимизированные под развёртывание и эксплуатацию языковой модели GigaChat 3.1. Оборудование подобрано с учётом требований к вычислительной мощности, пропускной способности памяти и надёжности работы в режиме 24/7.

Для чего предназначены эти серверы

Инференс крупных языковых моделей класса GigaChat 3.1 требует существенно больших вычислительных ресурсов, чем обычные серверные задачи. Здесь критически важны:

высокая пропускная способность GPU-памяти (HBM2e / HBM3);
низкая задержка передачи данных между ускорителями (NVLink, InfiniBand);
достаточный объём системной памяти для хранения весов модели и KV-кэша;
надёжная система охлаждения для длительной непрерывной работы под нагрузкой.

Все представленные в этом разделе конфигурации прошли предварительный отбор именно под эти требования.

Типовые конфигурации для GigaChat 3.1

Минимальная конфигурация (одиночный узел)

Подходит для тестирования и небольших нагрузок:

Процессор: AMD EPYC 9354 (32 ядра, 3,25 / 3,8 ГГц) или Intel Xeon Gold 6448Y
GPU: 1–2 × NVIDIA A100 80 GB или H100 80 GB SXM5
ОЗУ: от 512 ГБ DDR5 ECC RDIMM
Хранилище: 2 × NVMe SSD 3,84 ТБ в RAID 1
Сеть: 2 × 25GbE + опциональный порт InfiniBand HDR 200 Gb/s

Оптимальная конфигурация (кластер из 2–4 узлов)

Обеспечивает производственную производительность с запасом масштабирования:

Платформа: Supermicro SYS-420GP-TNR или ASUS ESC N8-E11
Процессор: 2 × AMD EPYC 9554 (64 ядра, 3,1 / 3,75 ГГц)
GPU: 8 × NVIDIA H100 80 GB SXM5 с NVLink 4.0
ОЗУ: 2 ТБ DDR5-4800 ECC RDIMM (32 слота)
Хранилище: 4 × NVMe U.2 7,68 ТБ + внешний Ceph-кластер
Сеть: 2 × 100GbE + 8 × InfiniBand NDR 400 Gb/s (через ConnectX-7)

Флагманская конфигурация (DGX-класс)

Для высоконагруженного продакшна и мультиарендной среды:

Платформа: NVIDIA DGX H100 или Dell PowerEdge XE9680
GPU: 8 × NVIDIA H100 80 GB SXM5, суммарно 640 ГБ HBM3
Процессор: 2 × Intel Xeon Platinum 8480+ (60 ядер, 2,0 / 3,8 ГГц)
ОЗУ: 2 ТБ DDR5-4800 ECC
Хранилище: 8 × NVMe SSD 3,84 ТБ (NVMe RAID)
Сеть: ConnectX-7 InfiniBand NDR 400 Gb/s, 2 × 10GbE управление

Почему GigaChat 3.1 требует специализированного железа

GigaChat 3.1 относится к семейству больших языковых моделей (LLM) с числом параметров в диапазоне десятков миллиардов. Для обеспечения комфортного времени отклика (< 100 мс на токен) в продакшне необходимо:

Разместить всю модель в GPU-памяти. Квантованная версия (INT8) занимает от 40 до 80 ГБ; версия FP16 — вдвое больше. Серверы с несколькими H100/A100 покрывают этот диапазон без page-offload на CPU.
Обеспечить высокую пропускную способность памяти. H100 SXM5 даёт 3,35 ТБ/с; именно этот показатель определяет скорость генерации токенов, а не тактовая частота GPU.
Использовать высокоскоростную межузловую сеть. При тензорном параллелизме между несколькими GPU или узлами InfiniBand NDR снижает задержки в 5–8 раз по сравнению с обычным Ethernet.
Организовать надёжное охлаждение. TDP одной карты H100 SXM5 — 700 Вт. При 8 картах в стойке требуется прямое жидкостное охлаждение или высокоэффективная принудительная вентиляция.

Услуги СервакМастер при покупке AI-сервера

Приобретая оборудование для инференса GigaChat 3.1 в «СервакМастер», вы получаете:

Бесплатную техническую консультацию — поможем определить оптимальную конфигурацию под ваш бюджет и планируемые нагрузки.
Предустановку ПО — развернём необходимый стек: Ubuntu Server LTS, CUDA Toolkit, vLLM или Triton Inference Server по вашему выбору.
Нагрузочное тестирование перед отгрузкой — стресс-тест GPU, тест памяти, burn-in не менее 24 часов.
Доставку и гарантию — доставка по всей России, гарантийное обслуживание от 12 до 36 месяцев в зависимости от производителя.
Постгарантийную поддержку — аппаратный мониторинг, замена компонентов, консультации по масштабированию.

Как выбрать сервер под GigaChat 3.1

При выборе конфигурации ориентируйтесь на следующие параметры:

Параметр	Что оценивать
Суммарный объём GPU-памяти	Должен вмещать веса модели + KV-кэш для целевого batch size
Пропускная способность HBM	Определяет скорость генерации (tokens/s)
Межузловая сеть	InfiniBand NDR при тензорном параллелизме; 100GbE минимум для конвейерного
Системная память	Минимум 512 ГБ на узел; рекомендуется 1–2 ТБ
Питание и охлаждение	Рассчитывайте 800–1000 Вт на GPU-карту с запасом 20%

Если у вас нет технического специалиста для самостоятельного расчёта — свяжитесь с нами через форму на сайте, мы подготовим персональное предложение.

Гарантии и условия покупки

Все серверы и AI-системы, представленные в каталоге «СервакМастер», поставляются с официальной гарантией производителя. На большинство позиций действует расширенная сервисная программа NBD (замена неисправного компонента на следующий рабочий день). Оплата по безналичному расчёту для юридических лиц, НДС включён в стоимость.

Цена указана за базовую конфигурацию. Итоговая стоимость зависит от выбранных компонентов, объёма заказа и условий поставки. Для уточнения актуальной цены и наличия на складе — воспользуйтесь кнопкой «Запросить цену» или свяжитесь с нами.

13 935 600 руб.

Под заказ

Задать вопрос

Гарантия с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Помощь в подборе конфигурации

Характеристики

ПроцессорAMD EPYC

ВидеокартаNVIDIA

СостояниеНовое