OpenAI Jalapeño: первый собственный ASIC-чип для инференса ИИ — что это означает для серверного рынка

OpenAI Jalapeño: собственный ИИ-чип компании выходит на арену серверных ускорителей

Введение

Компания OpenAI официально анонсировала первый специализированный ИИ-чип собственной разработки — Jalapeño, созданный в партнёрстве с Broadcom. Этот ASIC-ускоритель спроектирован с нуля для задач инференса больших языковых моделей внутри инфраструктуры OpenAI. Чип оснащён четырьмя банками памяти HBM3E, а его инженерные образцы уже проходят реальные рабочие нагрузки в исследовательских лабораториях компании — в том числе участвуют в работе модели GPT‑5.3‑Codex‑Spark.

Первые коммерческие развёртывания Jalapeño запланированы на конец 2026 года. К 2029 году OpenAI намерена обеспечить чипами собственного производства вычислительные мощности суммарным потреблением до 10 гигаватт.

В СервакМастер внимательно следим за развитием серверного аппаратного рынка — появление такого игрока, как OpenAI, меняет расстановку сил и напрямую влияет на спрос и предложение серверных ускорителей.

Архитектура Jalapeño: что известно на сегодня

Jalapeño — классический ASIC-ускоритель, по концепции близкий к Google TPU или AWS Trainium. Ключевое отличие: чип заточен исключительно под логический вывод (инференс) LLM, а не под обучение нейросетей. Его функциональные блоки оптимизированы под матричные умножения, обработку механизма внимания (attention), операции деквантизации и аналогичные примитивы, характерные для работы языковых моделей.

С архитектурной точки зрения Jalapeño — многокристальный чип с интерпозером:

Центральный вычислительный кристалл — крупный, отвечает за основные матричные операции.
8 стеков памяти HBM3E — окружают центральный кристалл, обеспечивая высокую пропускную способность с минимальными задержками.
Сетевые блоки Broadcom Tomahawk — интегрированы непосредственно на кристалле, что позволяет объединять сотни чипов Jalapeño в кластеры для распределённых ИИ-вычислений.

Визуально архитектура напоминает топовые GPU Nvidia серий H100/H200, хотя функционально это принципиально разные решения. Точные данные по техпроцессу, количеству вычислительных ядер и пиковой производительности в FLOPS OpenAI пока не раскрывает, пообещав технический отчёт в ближайшие месяцы.

Важный момент: по заявлению OpenAI, Jalapeño совместим не только с моделями GPT, но и с другими LLM — это расширяет потенциальный круг пользователей чипа.

Рекордные сроки разработки: девять месяцев от чертежей до кремния

Один из наиболее впечатляющих аспектов проекта — скорость реализации. Путь от первоначальных инженерных эскизов до готовности к производству занял всего девять месяцев — исторически быстрый цикл для полупроводниковой индустрии.

Такой результат стал возможен благодаря нескольким факторам:

Программно-аппаратная интеграция: OpenAI применяла собственные языковые модели для ускорения проектирования и оптимизации архитектуры чипа.
Партнёрство с Broadcom: компания взяла на себя основную нагрузку по разработке аппаратной части.
Участие Celestica: этот производитель отвечает за разработку плат и стоечных систем под новый чип.

Такая модель разделения труда — разработчик ИИ + специализированный производитель чипов + ODM для серверных платформ — становится стандартом в отрасли и прямо конкурирует с традиционными серверными вендорами.

Производительность и экономика: что говорят тесты

Несмотря на закрытость технических спецификаций, OpenAI и её партнёры уже раскрыли ряд производственных показателей:

Эффективность: внутренние тесты демонстрируют значительно лучшую производительность на ватт по сравнению с современными ИИ-ускорителями конкурентов.
Снижение стоимости инференса на 50% — такую цифру озвучил генеральный директор Broadcom Хок Тан, сравнивая Jalapeño с топовыми решениями Nvidia Blackwell и Google TPU в задачах ИИ-инференса.
Ключевая оптимизация: архитектура Jalapeño строится вокруг минимизации перемещения данных внутри системы и балансировки между вычислительными ресурсами, сетевой пропускной способностью и объёмом памяти — именно это обеспечивает высокую утилизацию оборудования и низкие задержки при обработке запросов.

Для операторов дата-центров и компаний, строящих собственную ИИ-инфраструктуру, снижение стоимости инференса вдвое — это принципиально иной экономический расчёт при планировании серверных закупок.

Планы развёртывания и масштабирование

Конец 2026 года: первые платформы на базе Jalapeño появятся в дата-центрах Microsoft и других партнёров OpenAI.
2029 год: OpenAI планирует довести суммарную мощность своих кластеров на чипах собственной разработки до 10 гигаватт потребления.

Таким образом, речь идёт не об экспериментальном проекте, а о полноценной стратегии вертикальной интеграции — от разработки модели до кремния, на котором она работает.

Что это значит для серверного рынка

Выход OpenAI в сегмент специализированных ИИ-ускорителей — событие, которое повлияет на весь рынок серверного оборудования:

Давление на Nvidia: крупнейший потребитель GPU H100/H200 начинает замещать часть закупок собственными решениями, что теоретически высвобождает ёмкость рынка.
Ориентир для других гиперскейлеров: если OpenAI за девять месяцев создала конкурентоспособный ASIC, это ускорит аналогичные проекты у Meta, Apple и других.
Спрос на серверные платформы под новые чипы: производство стоечного оборудования, систем охлаждения и высокоскоростных сетей для кластеров Jalapeño — отдельный рынок, который только формируется.

В СервакМастер мы фиксируем растущий интерес клиентов к серверам с поддержкой HBM-памяти и высокоскоростного межсоединения. Если вас интересует подбор серверного оборудования под ИИ-нагрузки — свяжитесь с нами, и мы поможем сформировать оптимальную конфигурацию под ваши задачи.

Выводы

Jalapeño — это декларация о намерениях. OpenAI перестаёт быть исключительно софтверной компанией и строит собственный аппаратный стек. Девять месяцев от идеи до рабочего кремния в лаборатории, снижение стоимости инференса вдвое и уже запланированные развёртывания в дата-центрах Microsoft — это не прощупывание почвы, а полноценный выход на рынок.

Что важно для конечных пользователей ChatGPT: в ближайшие год-два изменений в пользовательском опыте ждать не стоит. Основной выигрыш — внутри самой OpenAI: снижение операционных затрат, независимость от поставщиков GPU и полный контроль над технологическим стеком. Если следующий чип закроет задачи обучения — ландшафт полупроводникового рынка изменится кардинально.

Материал подготовлен редакцией СервакМастер. По вопросам подбора серверного оборудования и ИИ-ускорителей — свяжитесь с нами через форму на сайте.