Первые независимые тесты NVIDIA Vera CPU: что показали бенчмарки и о чём умолчали


Введение

NVIDIA начала поставки первых ИИ-стоек с новыми Arm-процессорами Vera таким компаниям, как OpenAI, SpaceX, Anthropic и Oracle — для внутреннего тестирования. Ожидаемо, ни один из этих игроков не спешит публиковать собственные бенчмарки: критиковать железо стратегического поставщика никто не станет. Тем не менее первые независимые результаты всё же появились в открытом доступе.

NVIDIA пригласила Майкла Ларабеля, основателя портала Phoronix, в головной офис в Санта-Кларе, чтобы он лично протестировал Vera CPU в реальных рабочих нагрузках. Это не идеальная независимость — но лучшее, что доступно на сегодня. В этой статье специалисты СервакМастер разбирают полученные данные, указывают на ограничения методологии и объясняют, что всё это значит для серверного рынка.


Подробнее об архитектуре NVIDIA Vera CPU

Прежде чем переходить к цифрам, стоит чётко понимать, что представляет собой этот процессор.

Ключевые характеристики NVIDIA Vera CPU:

  • 88 кастомных Arm-ядер Olympus на базе архитектуры Armv9.2, 176 потоков
  • Расчётная тактовая частота — около 3,2 ГГц (официальных данных NVIDIA не раскрывает)
  • Память: до 1,5 ТБ LPDDR5X-9600 МТ/с в передовых модулях SOCAMM2, интегрированных на одной подложке с процессором; пропускная способность до 1,2 ТБ/с
  • Кэш: до 2 МБ L2 на ядро (вдвое больше, чем у Grace) и до 164 МБ общего L3
  • Интерфейсы: PCIe 6.0, CXL 3.1
  • TDP: 450 Вт для CPU + 50 Вт для памяти LPDDR5X = 500 Вт суммарно — сопоставимо с топовыми x86-процессорами

Vera поступит на рынок во второй половине 2026 года. Он будет доступен как в составе стоек Vera Rubin NVL72, так и в виде самостоятельных нод или чистых CPU-стоек.

С точки зрения программной поддержки NVIDIA придерживается своего фирменного стиля: все драйверы включены в ядра Linux 7.1 и выше, доступны актуальные компиляторы и системные инструменты. Тестирование проводилось на Ubuntu 24.04 LTS с патченным ядром Linux 6.18 LTS и GCC 16.1. ОС распознала процессор без проблем, однако ряд функций — в частности, управление питанием — ещё находится в стадии доработки.


Конкуренты в тестовом стенде

NVIDIA выбрала для сравнения топовые (но не флагманские) серверные процессоры AMD и Intel, а также предыдущее поколение собственного чипа Grace CPU.

Процессор Ядра / потоки Частота (база/буст) TDP Конфигурация
AMD EPYC 9455 48 / 96 3,15–4,1 ГГц 300 Вт 2S
AMD EPYC 9475F 48 / 96 3,65–4,8 ГГц 400 Вт 2S
AMD EPYC 9575F 64 / 128 3,3–5,0 ГГц 400 Вт 1S и 2S
AMD EPYC 9755 128 / 256 2,7–4,1 ГГц 500 Вт 1S и 2S
Intel Xeon 6980P 128 / 256 2,0–3,9 ГГц 500 Вт + MRDIMM-8800 1S и 2S
NVIDIA Grace 72 ядра Neoverse-V2 256 ГБ LPDDR5-8533 МТ/с

Важные оговорки методологии

Прежде чем анализировать результаты, необходимо честно обозначить ограничения тестирования.

Во-первых, NVIDIA запросила Ларабеля не фиксировать энергопотребление и тактовую частоту Vera во время нагрузок. Это красноречиво: по всей видимости, реальный TDP при пиковых нагрузках превышает заявленные 500 Вт, а частота ядер может уступать конкурентам AMD и Intel. Функция управления питанием ещё не доведена до финального состояния — это признаётся открыто.

Во-вторых, тестировался строго ограниченный набор нагрузок — только те, в которых Vera выглядит достаточно убедительно. Geekbench, SPEC CPU, производительность на ватт и ряд других ключевых метрик намеренно исключены из первого раунда.

В-третьих, в ряде многопоточных бенчмарков двухсокетные конфигурации могут не давать линейного масштабирования из-за конкуренции за шину памяти или особенностей самого теста. Поэтому в некоторых замерах 1S и 2S системы показывают близкие результаты — это нормально для выбранного набора нагрузок.

Помня об этих нюансах, перейдём к фактическим данным.


Результаты тестирования NVIDIA Vera CPU

Компиляция кода

Timed Gem5 (многопоток): Vera не смог обогнать двухсокетные конфигурации высокочастотных AMD EPYC, однако почти догнал 2S AMD EPYC 9575F. Отрыв от предыдущего поколения Grace и от решений Intel Xeon весьма значителен.

Timed Gem5 (одно ядро): здесь Vera вышел на второе место, уступив только AMD EPYC 9575F. Показатель однопоточной производительности у Arm-ядер Olympus оказался достаточно высоким.

Компиляция игрового движка Godot (многопоток): Vera уступил большинству конфигураций AMD, опередив лишь односокетный EPYC 9575F и Xeon 6980P.

Компиляция Godot (одно ядро): снова третье место, заметно выше Grace и Xeon.

Компиляция Node.js: стабильное третье место в многопотоке и второе — в однопотоке.

Кросс-компиляция ARM64 → x86_64: Vera показал лучшие результаты в обоих режимах. При сборке ядра allmodconfig x86_64 со всеми модулями чип незначительно уступил только 2S AMD EPYC 9575F и 9755.


Производительность памяти

Пожалуй, самый впечатляющий результат всего тестирования. В открытом бенчмарке Stream NVIDIA Vera ушёл далеко вперёд от всех x86-конкурентов по пропускной способности памяти. Причина очевидна: модули SOCAMM2 на базе LPDDR5X обеспечивают до 1,2 ТБ/с — это примерно вдвое быстрее самых современных модулей DDR5.

Именно высокая пропускная способность памяти делает Vera CPU потенциально очень интересным выбором для ИИ-нагрузок, работы с большими моделями и задач, ограниченных именно скоростью доступа к данным.


Архивация и сжатие

7-Zip (многопоток): Vera заметно отстал, обогнав лишь 2x EPYC 9455, 1x EPYC 9575F и Grace.

7-Zip (один поток): Vera занял первое место с заметным отрывом от конкурентов.

7-Zip (многопоточная распаковка): результат немного лучше, чем при сжатии, но всё ещё в середине таблицы.

7-Zip (однопоточная распаковка): снова первое место с существенным отрывом.

Zstandard (стандартные уровни сжатия): Vera практически во всём уступал x86-чипам.

Zstandard (максимальные уровни сжатия): резкое изменение картины — Vera вышел в лидеры. Arm-архитектура демонстрирует нелинейное масштабирование в зависимости от алгоритмической сложности задачи.


Видео и мультимедиа

AV1 (кодирование/декодирование): в большинстве режимов Vera практически не уступал AMD EPYC 9005. В воспроизведении 10-битного видео 4K результат оказался лучшим в тесте.


Python и Java

Python (xdsl-бенчмарк): результаты сильно варьировались в зависимости от конкретного теста, но в среднем Vera соответствовал топовым решениям AMD EPYC 9005.

Java (Eclipse-бенчмарк): стабильный топ-3 в большинстве тестов, в ряде замеров — первое место.


Общий итог по усреднённым результатам

В среднем по выбранному набору нагрузок NVIDIA Vera CPU обогнал большинство протестированных x86-решений. Прирост по сравнению с предыдущим поколением Grace составил около 63%, прирост относительно AMD EPYC 9575F — около 10%.


Выводы

Что можно заключить из первого раунда тестирования?

Называть Vera «убийцей AMD и Intel» преждевременно. NVIDIA намеренно ограничила набор нагрузок теми задачами, в которых чип выглядит достаточно убедительно. Geekbench, SPEC CPU и данные об эффективности на ватт остаются за кадром — без них полная картина недоступна.

Выбор конкурентов неслучаен. В тесте участвовали топовые, но не флагманские процессоры AMD и Intel. Флагманы EPYC 9004/9005 и Xeon 6 с наибольшим числом ядер с высокой вероятностью показали бы иные результаты.

Двухсокетные конфигурации — не полноценная замена. Часть многопоточных бенчмарков плохо масштабируется в 2S-системах, что снижает объективность сравнений.

Сильные стороны реальны. Однопоточная производительность ядер Olympus, пропускная способность памяти и результаты в кодировании видео — это настоящие преимущества, а не маркетинг. Vera действительно является одним из наиболее мощных Arm-процессоров для серверного сегмента: существующие Arm-альтернативы от Ampere, Google и Microsoft заметно уступают современным x86-чипам, тогда как Vera с ними конкурирует.

Конкуренция не стоит на месте. AMD EPYC 9006 Venice выходит в ближайшее время, ARM готовит AGI-ориентированный процессор, который тоже претендует на конкуренцию с флагманами x86. NVIDIA Vera ещё не раз предстоит доказывать свою актуальность.

Команда СервакМастер продолжает следить за развитием серверного рынка и публикует аналитику по новым процессорным платформам. Если вас интересуют подробности по конкретным конфигурациям серверов на базе Arm или x86 для ваших задач — свяжитесь с нами.