DeepSeekMath-V2: как китайские разработчики научили ИИ проверять собственные математические доказательства

Введение

Компания DeepSeek снова поставила под сомнение устоявшиеся подходы к разработке языковых моделей. На этот раз речь идёт не о сокращении затрат на обучение, а о качественно новой парадигме работы с математическими задачами. Модель DeepSeekMath-V2 объёмом 685 миллиардов параметров переосмысляет то, как ИИ должен подходить к решению сложных математических проблем: не просто подбирать правильный ответ по бенчмарку, а выстраивать логически последовательные цепочки рассуждений с внутренней самокоррекцией ошибок.

На сегодняшний день это одна из наиболее обсуждаемых разработок в ИИ-сообществе, и в блоге СервакМастер мы подробно разбираем, что именно делает её особенной.


Архитектура DeepSeekMath-V2: генератор и верификатор

За основу DeepSeekMath-V2 была взята модель DeepSeekV3.2-Exp-Base — мощная базовая архитектура, поверх которой китайские инженеры выстроили принципиально новую систему обучения. Ключевая концепция — самопроверяемые математические рассуждения — реализована через взаимодействие двух отдельных нейросетевых компонентов:

  • Генератор доказательств — формирует пошаговые математические рассуждения, строит цепочки логических шагов и предлагает решения.
  • Верификатор — независимо оценивает полноту и корректность каждого шага рассуждения, выступая в роли внутреннего арбитра.

Взаимодействие двух компонентов организовано по принципу обратной связи: верификатор используется генератором как модель вознаграждения. Это означает, что генератор буквально учится на оценках верификатора — выявляет слабые места в собственных доказательствах и исправляет их ещё до финальной выдачи ответа. При этом по мере усложнения задач верификатор масштабируется, создавая новые обучающие данные и повышая общую производительность системы.

Такой подход позволяет сокращать разрыв между генерацией решения и его проверкой — что принципиально отличает DeepSeekMath-V2 от традиционных LLM, ориентированных исключительно на итоговый ответ без учёта качества промежуточных шагов.


Результаты тестирования: золото на IMO и почти идеальный Putnam

Реальная проверка возможностей модели прошла на площадках трёх крупнейших международных математических соревнований:

Конкурс Результат DeepSeekMath-V2
IMO 2025 (Международная математическая олимпиада) Золотая медаль
CMO 2024 (Китайская математическая олимпиада) Золотая медаль
Putnam 2024 (Американский университетский конкурс) 118 из 120 баллов

Результат на Putnam 2024 особенно показателен: набрать 118/120 баллов не удаётся большинству участников-людей, не говоря об ИИ-системах предыдущих поколений. Это свидетельствует о том, что механизм самопроверяемых рассуждений обеспечивает глубину математического мышления, недостижимую при традиционном подходе «ответ любой ценой».


Сравнение с конкурентами: DeepSeekMath-V2 впереди

В прямом сравнении DeepSeekMath-V2 уверенно обходит другие флагманские языковые модели по совокупности математических задач. В числе моделей, уступающих ей по производительности:

  • Claude Sonnet 4 (Anthropic)
  • Gemini 2.5 Pro (Google)
  • GPT-5 (OpenAI)
  • Grok 4 (xAI)
  • Qwen3-235b (Alibaba)

Это особенно значимо с учётом того, что перечисленные системы представляют передний край разработок крупнейших мировых технологических компаний. Выйти на первое место в таком сравнении — весомое подтверждение правильности выбранного архитектурного подхода.


Почему это важно для индустрии серверных технологий

Прогресс в математических возможностях ИИ напрямую связан с развитием серверной инфраструктуры. Обучение и инференс моделей такого масштаба (685 млрд параметров) требуют:

  • высокопроизводительных GPU-кластеров — для параллельных вычислений при обучении обоих компонентов системы;
  • NVMe-хранилищ с высокой пропускной способностью — для работы с массивами обучающих данных математических доказательств;
  • серверов с большим объёмом оперативной памяти — для загрузки и обслуживания столь масштабных весов модели в продакшне.

Если ваш бизнес или исследовательский проект требует подобной инфраструктуры — СервакМастер готов помочь с подбором серверного оборудования под конкретные задачи. Свяжитесь с нами, чтобы получить консультацию по оснащению вычислительного кластера.


Выводы

DeepSeekMath-V2 задаёт новую точку отсчёта для математических способностей ИИ. Принцип совместного обучения верификатора и генератора доказательств открывает путь к созданию систем, которые не просто угадывают правильные ответы, а выстраивают воспроизводимые цепочки доказательств — со встроенным механизмом контроля качества. Золотые медали IMO 2025 и CMO 2024, а также результат 118/120 на Putnam 2024 наглядно демонстрируют: самопроверяемые рассуждения — это перспективное направление, способное в будущем привести к созданию ИИ, доказывающего теоремы и решающего нерешённые математические проблемы.

Следите за нашим блогом — СервакМастер регулярно публикует обзоры актуальных разработок в сфере ИИ и серверных технологий.