Первые независимые тесты NVIDIA Vera CPU: что показали бенчмарки и о чём умолчали
Введение
NVIDIA начала поставки первых ИИ-стоек с новыми Arm-процессорами Vera таким компаниям, как OpenAI, SpaceX, Anthropic и Oracle — для внутреннего тестирования. Ожидаемо, ни один из этих игроков не спешит публиковать собственные бенчмарки: критиковать железо стратегического поставщика никто не станет. Тем не менее первые независимые результаты всё же появились в открытом доступе.
NVIDIA пригласила Майкла Ларабеля, основателя портала Phoronix, в головной офис в Санта-Кларе, чтобы он лично протестировал Vera CPU в реальных рабочих нагрузках. Это не идеальная независимость — но лучшее, что доступно на сегодня. В этой статье специалисты СервакМастер разбирают полученные данные, указывают на ограничения методологии и объясняют, что всё это значит для серверного рынка.
Подробнее об архитектуре NVIDIA Vera CPU
Прежде чем переходить к цифрам, стоит чётко понимать, что представляет собой этот процессор.
Ключевые характеристики NVIDIA Vera CPU:
- 88 кастомных Arm-ядер Olympus на базе архитектуры Armv9.2, 176 потоков
- Расчётная тактовая частота — около 3,2 ГГц (официальных данных NVIDIA не раскрывает)
- Память: до 1,5 ТБ LPDDR5X-9600 МТ/с в передовых модулях SOCAMM2, интегрированных на одной подложке с процессором; пропускная способность до 1,2 ТБ/с
- Кэш: до 2 МБ L2 на ядро (вдвое больше, чем у Grace) и до 164 МБ общего L3
- Интерфейсы: PCIe 6.0, CXL 3.1
- TDP: 450 Вт для CPU + 50 Вт для памяти LPDDR5X = 500 Вт суммарно — сопоставимо с топовыми x86-процессорами
Vera поступит на рынок во второй половине 2026 года. Он будет доступен как в составе стоек Vera Rubin NVL72, так и в виде самостоятельных нод или чистых CPU-стоек.
С точки зрения программной поддержки NVIDIA придерживается своего фирменного стиля: все драйверы включены в ядра Linux 7.1 и выше, доступны актуальные компиляторы и системные инструменты. Тестирование проводилось на Ubuntu 24.04 LTS с патченным ядром Linux 6.18 LTS и GCC 16.1. ОС распознала процессор без проблем, однако ряд функций — в частности, управление питанием — ещё находится в стадии доработки.
Конкуренты в тестовом стенде
NVIDIA выбрала для сравнения топовые (но не флагманские) серверные процессоры AMD и Intel, а также предыдущее поколение собственного чипа Grace CPU.
| Процессор | Ядра / потоки | Частота (база/буст) | TDP | Конфигурация |
|---|---|---|---|---|
| AMD EPYC 9455 | 48 / 96 | 3,15–4,1 ГГц | 300 Вт | 2S |
| AMD EPYC 9475F | 48 / 96 | 3,65–4,8 ГГц | 400 Вт | 2S |
| AMD EPYC 9575F | 64 / 128 | 3,3–5,0 ГГц | 400 Вт | 1S и 2S |
| AMD EPYC 9755 | 128 / 256 | 2,7–4,1 ГГц | 500 Вт | 1S и 2S |
| Intel Xeon 6980P | 128 / 256 | 2,0–3,9 ГГц | 500 Вт + MRDIMM-8800 | 1S и 2S |
| NVIDIA Grace | 72 ядра Neoverse-V2 | — | — | 256 ГБ LPDDR5-8533 МТ/с |
Важные оговорки методологии
Прежде чем анализировать результаты, необходимо честно обозначить ограничения тестирования.
Во-первых, NVIDIA запросила Ларабеля не фиксировать энергопотребление и тактовую частоту Vera во время нагрузок. Это красноречиво: по всей видимости, реальный TDP при пиковых нагрузках превышает заявленные 500 Вт, а частота ядер может уступать конкурентам AMD и Intel. Функция управления питанием ещё не доведена до финального состояния — это признаётся открыто.
Во-вторых, тестировался строго ограниченный набор нагрузок — только те, в которых Vera выглядит достаточно убедительно. Geekbench, SPEC CPU, производительность на ватт и ряд других ключевых метрик намеренно исключены из первого раунда.
В-третьих, в ряде многопоточных бенчмарков двухсокетные конфигурации могут не давать линейного масштабирования из-за конкуренции за шину памяти или особенностей самого теста. Поэтому в некоторых замерах 1S и 2S системы показывают близкие результаты — это нормально для выбранного набора нагрузок.
Помня об этих нюансах, перейдём к фактическим данным.
Результаты тестирования NVIDIA Vera CPU
Компиляция кода
Timed Gem5 (многопоток): Vera не смог обогнать двухсокетные конфигурации высокочастотных AMD EPYC, однако почти догнал 2S AMD EPYC 9575F. Отрыв от предыдущего поколения Grace и от решений Intel Xeon весьма значителен.
Timed Gem5 (одно ядро): здесь Vera вышел на второе место, уступив только AMD EPYC 9575F. Показатель однопоточной производительности у Arm-ядер Olympus оказался достаточно высоким.
Компиляция игрового движка Godot (многопоток): Vera уступил большинству конфигураций AMD, опередив лишь односокетный EPYC 9575F и Xeon 6980P.
Компиляция Godot (одно ядро): снова третье место, заметно выше Grace и Xeon.
Компиляция Node.js: стабильное третье место в многопотоке и второе — в однопотоке.
Кросс-компиляция ARM64 → x86_64: Vera показал лучшие результаты в обоих режимах. При сборке ядра allmodconfig x86_64 со всеми модулями чип незначительно уступил только 2S AMD EPYC 9575F и 9755.
Производительность памяти
Пожалуй, самый впечатляющий результат всего тестирования. В открытом бенчмарке Stream NVIDIA Vera ушёл далеко вперёд от всех x86-конкурентов по пропускной способности памяти. Причина очевидна: модули SOCAMM2 на базе LPDDR5X обеспечивают до 1,2 ТБ/с — это примерно вдвое быстрее самых современных модулей DDR5.
Именно высокая пропускная способность памяти делает Vera CPU потенциально очень интересным выбором для ИИ-нагрузок, работы с большими моделями и задач, ограниченных именно скоростью доступа к данным.
Архивация и сжатие
7-Zip (многопоток): Vera заметно отстал, обогнав лишь 2x EPYC 9455, 1x EPYC 9575F и Grace.
7-Zip (один поток): Vera занял первое место с заметным отрывом от конкурентов.
7-Zip (многопоточная распаковка): результат немного лучше, чем при сжатии, но всё ещё в середине таблицы.
7-Zip (однопоточная распаковка): снова первое место с существенным отрывом.
Zstandard (стандартные уровни сжатия): Vera практически во всём уступал x86-чипам.
Zstandard (максимальные уровни сжатия): резкое изменение картины — Vera вышел в лидеры. Arm-архитектура демонстрирует нелинейное масштабирование в зависимости от алгоритмической сложности задачи.
Видео и мультимедиа
AV1 (кодирование/декодирование): в большинстве режимов Vera практически не уступал AMD EPYC 9005. В воспроизведении 10-битного видео 4K результат оказался лучшим в тесте.
Python и Java
Python (xdsl-бенчмарк): результаты сильно варьировались в зависимости от конкретного теста, но в среднем Vera соответствовал топовым решениям AMD EPYC 9005.
Java (Eclipse-бенчмарк): стабильный топ-3 в большинстве тестов, в ряде замеров — первое место.
Общий итог по усреднённым результатам
В среднем по выбранному набору нагрузок NVIDIA Vera CPU обогнал большинство протестированных x86-решений. Прирост по сравнению с предыдущим поколением Grace составил около 63%, прирост относительно AMD EPYC 9575F — около 10%.
Выводы
Что можно заключить из первого раунда тестирования?
Называть Vera «убийцей AMD и Intel» преждевременно. NVIDIA намеренно ограничила набор нагрузок теми задачами, в которых чип выглядит достаточно убедительно. Geekbench, SPEC CPU и данные об эффективности на ватт остаются за кадром — без них полная картина недоступна.
Выбор конкурентов неслучаен. В тесте участвовали топовые, но не флагманские процессоры AMD и Intel. Флагманы EPYC 9004/9005 и Xeon 6 с наибольшим числом ядер с высокой вероятностью показали бы иные результаты.
Двухсокетные конфигурации — не полноценная замена. Часть многопоточных бенчмарков плохо масштабируется в 2S-системах, что снижает объективность сравнений.
Сильные стороны реальны. Однопоточная производительность ядер Olympus, пропускная способность памяти и результаты в кодировании видео — это настоящие преимущества, а не маркетинг. Vera действительно является одним из наиболее мощных Arm-процессоров для серверного сегмента: существующие Arm-альтернативы от Ampere, Google и Microsoft заметно уступают современным x86-чипам, тогда как Vera с ними конкурирует.
Конкуренция не стоит на месте. AMD EPYC 9006 Venice выходит в ближайшее время, ARM готовит AGI-ориентированный процессор, который тоже претендует на конкуренцию с флагманами x86. NVIDIA Vera ещё не раз предстоит доказывать свою актуальность.
Команда СервакМастер продолжает следить за развитием серверного рынка и публикует аналитику по новым процессорным платформам. Если вас интересуют подробности по конкретным конфигурациям серверов на базе Arm или x86 для ваших задач — свяжитесь с нами.
