Google TPUv9 Triggerfish совместно с MediaTek: следующее поколение ускорителей для агентного ИИ

Google TPUv9 Triggerfish: объединённый ускоритель для агентного ИИ нового поколения

Введение

Google продолжает активно развивать линейку собственных тензорных ускорителей TPU и расширяет стратегическое партнёрство с компанией MediaTek. В рамках этого сотрудничества разрабатывается специализированный ИИ-чип следующего поколения — TPUv9 с кодовым именем Triggerfish. Новинка ориентирована прежде всего на задачи агентного искусственного интеллекта, где требуются многократные итеративные вызовы с минимальными задержками и высокой пропускной способностью памяти.

Принципиальное отличие TPUv9 от предыдущего поколения TPUv8 заключается в архитектурном подходе: ранее функции обучения и логического вывода были разделены между двумя отдельными чипами — Zebrafish (производства MediaTek) и Sunfish (производства Broadcom). В новой линейке TPUv9 оба режима объединены в единый кристалл. Начало массового производства серии запланировано на третий квартал 2027 года. Triggerfish станет вторым чипом в линейке, следующим за базовым Humufish, а полноценный выход на рынок ожидается в начале 2028 года.

Технические особенности Google TPUv9 Triggerfish

Triggerfish — это не просто очередная итерация, а специализированная модификация базового TPUv9 Humufish, созданная для преодоления ключевых узких мест современных ИИ-систем: ограничений центрального процессора и нехватки оперативной памяти. Среди главных технических нововведений выделяются следующие:

Значительный рост объёма встроенной SRAM — по сравнению с Humufish объём статической памяти увеличен в 2–3 раза, что позволяет хранить больше данных непосредственно на кристалле и сократить латентность доступа.
Переход с HBM4 на HBM4E — применение памяти стандарта HBM4E обеспечивает более высокую пропускную способность и эффективность работы с крупными языковыми моделями.
Добавление нового «симуляционного кристалла» — дополнительный функциональный блок, расширяющий возможности чипа при работе со сложными агентными сценариями.

Ключевым архитектурным решением стала интеграция встроенного CPU-модуля непосредственно в корпус основного вычислительного ASIC. Этот CPU-тайл, спроектированный MediaTek, управляет переключением между режимами обучения и инференса, обеспечивая гибкость при обслуживании разнородных рабочих нагрузок. Благодаря такой конфигурации Triggerfish способен:

хранить локально значительно больший объём данных прямо на кристалле TPU;
минимизировать накладные расходы на перемещение данных между компонентами системы;
повысить эффективность на фазе декодирования — критически важном этапе для агентных ИИ-приложений.

Производственная цепочка и экономика чипа

В производственной инфраструктуре TPUv9 Triggerfish также планируются существенные изменения. Основной вычислительный ASIC-кристалл по-прежнему будет изготавливаться на мощностях TSMC, однако для передовой упаковки рассматривается технология Intel EMIB — в качестве альтернативы традиционному, но более дорогостоящему решению TSMC CoWoS.

В части распределения ролей: Google совместно с ближайшими партнёрами отвечает за проектирование и производство основного вычислительного кристалла Humufish, тогда как MediaTek берёт на себя компоненты ввода-вывода и бэкенд-дизайн.

По оценкам аналитика Мин-Чи Куо, Google намерена выпустить от 100 до 200 тысяч экземпляров Triggerfish в дополнение к 400–500 тысячам базовых чипов Humufish. Стоимость одного Triggerfish примерно на 30% выше, чем у Humufish — что отражает его расширенные технические характеристики и более сложный производственный процесс.

Взгляд в будущее: TPUv10 Icefish

Параллельно с разработкой TPUv9 в индустрии появляются первые сведения о следующем поколении — Google TPUv10 с кодовым именем Icefish. Информации о нём пока крайне мало, однако известно, что производство может быть переведено на мощности Samsung с использованием 2-нм техпроцесса. Ориентировочный выход TPUv10 Icefish ожидается в 2029–2030 годах.

Выводы

Стратегия Google чётко читается: компания целенаправленно смещает приоритеты с достижения пиковой теоретической производительности в сторону эффективности агентных сценариев, где решающую роль играют задержки, объём сверхбыстрой SRAM и возможности встроенного CPU. Именно эти параметры определяют реальную производительность при многократных итеративных вызовах, характерных для агентного ИИ.

Выход Broadcom из текущей производственной цепочки в пользу MediaTek не означает окончательного разрыва отношений — по всей видимости, Broadcom переключится на другие продукты Google и вполне может вернуться в следующем поколении TPU. Тенденция же очевидна: индустрия планомерно движется от узкоспециализированных ускорителей к универсальным высокопроизводительным чипам, одинаково эффективным как при обучении моделей, так и при инференсе агентных нагрузок.

Следите за актуальными новостями о серверном оборудовании и ИИ-инфраструктуре на страницах СервакМастер — свяжитесь с нами, если вас интересует подбор оптимального решения для ваших задач.