DeepSeekMath-V2: как китайские разработчики научили ИИ проверять собственные математические доказательства
Введение
Компания DeepSeek снова поставила под сомнение устоявшиеся подходы к разработке языковых моделей. На этот раз речь идёт не о сокращении затрат на обучение, а о качественно новой парадигме работы с математическими задачами. Модель DeepSeekMath-V2 объёмом 685 миллиардов параметров переосмысляет то, как ИИ должен подходить к решению сложных математических проблем: не просто подбирать правильный ответ по бенчмарку, а выстраивать логически последовательные цепочки рассуждений с внутренней самокоррекцией ошибок.
На сегодняшний день это одна из наиболее обсуждаемых разработок в ИИ-сообществе, и в блоге СервакМастер мы подробно разбираем, что именно делает её особенной.
Архитектура DeepSeekMath-V2: генератор и верификатор
За основу DeepSeekMath-V2 была взята модель DeepSeekV3.2-Exp-Base — мощная базовая архитектура, поверх которой китайские инженеры выстроили принципиально новую систему обучения. Ключевая концепция — самопроверяемые математические рассуждения — реализована через взаимодействие двух отдельных нейросетевых компонентов:
- Генератор доказательств — формирует пошаговые математические рассуждения, строит цепочки логических шагов и предлагает решения.
- Верификатор — независимо оценивает полноту и корректность каждого шага рассуждения, выступая в роли внутреннего арбитра.
Взаимодействие двух компонентов организовано по принципу обратной связи: верификатор используется генератором как модель вознаграждения. Это означает, что генератор буквально учится на оценках верификатора — выявляет слабые места в собственных доказательствах и исправляет их ещё до финальной выдачи ответа. При этом по мере усложнения задач верификатор масштабируется, создавая новые обучающие данные и повышая общую производительность системы.
Такой подход позволяет сокращать разрыв между генерацией решения и его проверкой — что принципиально отличает DeepSeekMath-V2 от традиционных LLM, ориентированных исключительно на итоговый ответ без учёта качества промежуточных шагов.
Результаты тестирования: золото на IMO и почти идеальный Putnam
Реальная проверка возможностей модели прошла на площадках трёх крупнейших международных математических соревнований:
| Конкурс | Результат DeepSeekMath-V2 |
|---|---|
| IMO 2025 (Международная математическая олимпиада) | Золотая медаль |
| CMO 2024 (Китайская математическая олимпиада) | Золотая медаль |
| Putnam 2024 (Американский университетский конкурс) | 118 из 120 баллов |
Результат на Putnam 2024 особенно показателен: набрать 118/120 баллов не удаётся большинству участников-людей, не говоря об ИИ-системах предыдущих поколений. Это свидетельствует о том, что механизм самопроверяемых рассуждений обеспечивает глубину математического мышления, недостижимую при традиционном подходе «ответ любой ценой».
Сравнение с конкурентами: DeepSeekMath-V2 впереди
В прямом сравнении DeepSeekMath-V2 уверенно обходит другие флагманские языковые модели по совокупности математических задач. В числе моделей, уступающих ей по производительности:
- Claude Sonnet 4 (Anthropic)
- Gemini 2.5 Pro (Google)
- GPT-5 (OpenAI)
- Grok 4 (xAI)
- Qwen3-235b (Alibaba)
Это особенно значимо с учётом того, что перечисленные системы представляют передний край разработок крупнейших мировых технологических компаний. Выйти на первое место в таком сравнении — весомое подтверждение правильности выбранного архитектурного подхода.
Почему это важно для индустрии серверных технологий
Прогресс в математических возможностях ИИ напрямую связан с развитием серверной инфраструктуры. Обучение и инференс моделей такого масштаба (685 млрд параметров) требуют:
- высокопроизводительных GPU-кластеров — для параллельных вычислений при обучении обоих компонентов системы;
- NVMe-хранилищ с высокой пропускной способностью — для работы с массивами обучающих данных математических доказательств;
- серверов с большим объёмом оперативной памяти — для загрузки и обслуживания столь масштабных весов модели в продакшне.
Если ваш бизнес или исследовательский проект требует подобной инфраструктуры — СервакМастер готов помочь с подбором серверного оборудования под конкретные задачи. Свяжитесь с нами, чтобы получить консультацию по оснащению вычислительного кластера.
Выводы
DeepSeekMath-V2 задаёт новую точку отсчёта для математических способностей ИИ. Принцип совместного обучения верификатора и генератора доказательств открывает путь к созданию систем, которые не просто угадывают правильные ответы, а выстраивают воспроизводимые цепочки доказательств — со встроенным механизмом контроля качества. Золотые медали IMO 2025 и CMO 2024, а также результат 118/120 на Putnam 2024 наглядно демонстрируют: самопроверяемые рассуждения — это перспективное направление, способное в будущем привести к созданию ИИ, доказывающего теоремы и решающего нерешённые математические проблемы.
Следите за нашим блогом — СервакМастер регулярно публикует обзоры актуальных разработок в сфере ИИ и серверных технологий.
