Kimi K2.7 Code от Moonshot AI: агентная нейросеть на 1 трлн параметров с экономией токенов 30%

Moonshot AI выпустила Kimi K2.7 Code — специализированная агентная модель для задач программирования

Компания Moonshot AI представила Kimi K2.7 Code — новую специализированную агентную языковую модель, ориентированную на задачи разработки программного обеспечения. Новинка построена на базе предыдущей версии Kimi K2.6 и направлена на улучшение долгосрочного планирования при выполнении практических задач кодинга. Согласно официальным заявлениям Moonshot AI, модель потребляет токены на 30% экономнее по сравнению с ранее выпущенными нейросетями компании. В основе Kimi K2.7 Code лежит архитектура Mixture-of-Experts (MoE) с суммарным числом параметров в 1 триллион, при этом одновременно активными остаются лишь 32 миллиарда. Кроме того, в модели реализован новый режим принудительного сохранения полного контекста рассуждений в ходе агентных итераций.

Архитектура и технические особенности Kimi K2.7 Code

Kimi K2.7 Code унаследовала архитектурные решения от предшественницы K2.6: один плотный нейронный слой и 61 слой MoE, механизм внимания Multi-Head Latent Attention (MLA), а также функцию активации SwiGLU. В рамках архитектуры MoE задействованы 384 эксперта, из которых на каждом токене активируются 8 специализированных плюс 1 общий эксперт.

Разработчики существенно увеличили словарный запас модели, доведя его до 160 000 токенов. Контекстное окно составляет 256 тысяч токенов, что открывает возможности для работы с большими кодовыми базами и многошаговыми агентными сессиями без потери контекста.

Благодаря интеграции визуального кодировщика Moonlight с 400 миллионами параметров, Kimi K2.7 Code поддерживает как текстовые, так и визуальные входные данные, включая видеоматериалы. Это расширяет потенциал модели при построении сложных мультимодальных агентных пайплайнов.

Ключевые улучшения по сравнению с K2.6

Несмотря на то что общее число параметров не изменилось и по-прежнему составляет 1 триллион, команда Moonshot AI провела масштабную работу по оптимизации модели для выполнения длинных последовательностей действий. Вот основные нововведения:

Режим preserve_thinking — принудительно включённый механизм, предотвращающий обрезку или забывание промежуточных рассуждений в ходе многошаговых агентных сессий. Отключить его невозможно, что гарантирует стабильность цепочки мышления.
Квантование INT4 — собственная схема квантования весов, отработанная на Kimi-K2-Thinking, позволяет эффективно развёртывать модель через инференс-фреймворки vLLM, SGLang и KTransformers.
Снижение числа ошибок — пользователи, протестировавшие модель, отмечают значительное сокращение галлюцинаций и зацикленных рассуждений по сравнению с предыдущими версиями.
Экономия токенов на 30% — существенное снижение расхода токенов делает модель особенно привлекательной для длительных автономных сессий, где важна стоимость инференса.

Результаты бенчмарков

В независимых тестах Kimi K2.7 Code демонстрирует значительный прирост по сравнению с предыдущими моделями Moonshot AI, а также конкурирует с проприетарными разработками OpenAI и Anthropic:

Kimi Code Bench v2: 62,0 балла у K2.7 Code против 50,9 у K2.6, 69,0 у GPT-5.5 и 67,4 у Claude Opus 4.8.
Software Bench: улучшение с 48,3 до 53,6, при 69,1 у GPT-5.5 и 63,8 у Claude Opus 4.8.
MLS Light Bench: 35,1 балла у K2.7 Code, 35,5 у GPT-5.5 и 42,8 у Claude Opus 4.8.
Kimi Claw 24/7 Bench (агентный тест): рост с 42,9 до 46,9 (GPT-5.5 — 52,8, Claude Opus 4.8 — 50,4).
MCP Bench: подъём с 69,4 до 76,0 (GPT-5.5 — 79,4, Claude Opus 4.8 — 81,3).

Модель пока не захватывает первые места в большинстве бенчмарков, однако отрыв от предшественницы достигает в отдельных тестах более 8 пунктов. Особенно заметен прогресс в агентных сценариях, где сохранение полного контекста рассуждений напрямую влияет на итоговое качество.

Практическое применение и доступность

Kimi K2.7 Code распространяется под открытой лицензией MIT, что делает её доступной для широкого круга специалистов. Совместимость с тремя основными инференс-фреймворками — vLLM, SGLang и KTransformers — позволяет энтузиастам и компаниям разворачивать модель на собственной локальной инфраструктуре без привязки к облачным сервисам.

Один триллион суммарных параметров при 32 миллиардах активных, поддержка визуального ввода, принудительное сохранение цепочки рассуждений и экономия токенов в 30% — всё это делает Kimi K2.7 Code привлекательным решением для длительных сессий автономной разработки.

Moonshot AI также анонсировала, что в ближайшее время модель получит обновление с новым высокоскоростным режимом, способным ускорить вывод ответов более чем в 6 раз. Это обещает ещё более высокую эффективность для агентного кодинга в реальных условиях.

Следите за новостями мира ИИ и серверных технологий вместе с СервакМастер — свяжитесь с нами, чтобы узнать об актуальных решениях для развёртывания моделей на собственной инфраструктуре.