Ландшафт искусственного интеллекта претерпевает фундаментальный сдвиг. В течение последних трех лет внимание индустрии было почти полностью сосредоточено на обучении — дорогостоящем вычислительном процессе обучения больших языковых моделей (LLM) тому, как «думать». Но на конференции разработчиков GTC 2026 в Сан-Хосе генеральный директор Nvidia Дженсен Хуанг дал понять, что эра доминирования обучения переходит в эру инференса (вывода).
С прогнозируемой выручкой в $1 триллион к 2027 году Nvidia больше не просто создает «двигатели созидания»; она позиционирует себя как основу для каждого взаимодействия в реальном времени в цифровом мире. Центральным элементом этой стратегии является масштабная лицензионная сделка на сумму $17 миллиардов с чип-стартапом Groq, направленная на устранение самого узкого места индустрии: скорости.
Чтобы понять, почему Nvidia меняет курс, необходимо осознать разницу между обучением и инференсом. Если обучение — это процесс написания массивной энциклопедии, то инференс — это действие пользователя, который ищет конкретный факт в этой книге и мгновенно получает ответ.
В то время как обучение требует огромных кластеров GPU, работающих месяцами, инференс происходит каждый раз, когда пользователь делает запрос чат-боту, беспилотный автомобиль принимает мгновенное решение или медицинский ИИ анализирует снимок. По мере того как ИИ перемещается из экспериментальных лабораторий в повсеместные потребительские продукты, ожидается, что объем задач инференса на порядки превысит объем обучения. Именно отсюда берется оценка в $1 триллион. Это переход от создания мозга к эксплуатации мозга в глобальном масштабе.
Одним из самых неожиданных объявлений на GTC 2026 стала глубокая интеграция технологий Groq — стартапа, лицензию у которого Nvidia приобрела за $17 миллиардов в конце прошлого года. Groq прославилась своими процессорами языковой обработки (LPU), которые отдают приоритет «детерминированной» производительности, по сути обеспечивая ответы ИИ с почти нулевой задержкой.
Внедряя архитектурные секреты Groq в свой новый центральный процессор и системы ИИ, Nvidia решает главную проблему корпоративного ИИ: задержку (latency). В мире, где задержка в полсекунды в боте службы поддержки или в алгоритме финансовой торговли может привести к потере выручки, скорость является главной валютой. Новый аппаратный комплекс, представленный Хуангом, обещает запускать самые сложные в мире модели с текучестью, имитирующей человеческое общение, оставляя в прошлом «пословное» заикание, характерное для ранних итераций ИИ.
В своем программном докладе Дженсен Хуанг представил новый класс центральных процессоров, разработанных специально для работы в тандеме с лицензированной технологией Groq. Это не просто более быстрый GPU; это специализированная система на кристалле (SoC), предназначенная для «предприятия реального времени» (Real-Time Enterprise).
| Характеристика | Предыдущее поколение (H200/B200) | Новая система инференса 2026 |
|---|---|---|
| Основной фокус | Обучение моделей и пропускная способность | Инференс в реальном времени и задержка |
| Архитектура | Hopper/Blackwell | Унифицированная архитектура с поддержкой LPU |
| Энергоэффективность | Высокое потребление на токен | Снижение энергопотребления на 40% на инференс |
| Интерконнект | NVLink 4.0 | Сверхнизкая задержка на базе технологий Groq |
Это оборудование представляет собой одновременно оборонительный и наступательный маневр. В обороне оно мешает облачным гигантам, таким как Amazon и Google, захватывать долю рынка с помощью собственных специализированных чипов для инференса (таких как Inferentia или TPU). В наступлении оно устанавливает новый золотой стандарт производительности, который конкурентам будет трудно превзойти.
Для технологической индустрии ставка Nvidia на инференс меняет дорожную карту на ближайшие 24 месяца. Мы уходим от менталитета «чем больше, тем лучше» в отношении размера моделей к эпохе, где «эффективность — это король».
Практические выводы для бизнеса:
Прогноз Nvidia в $1 триллион смел, но он основан на реальности: ИИ становится основным интерфейсом для вычислений. Закрепив за собой технологии, необходимые для доминирования на рынке инференса, Nvidia пытается гарантировать, что она останется незаменимым хребтом экономики ИИ.
Как отметил Дженсен Хуанг в своем заключительном слове, первый триллион долларов в эру ИИ был потрачен на обучение. Следующий триллион будет потрачен на применение этих знаний в реальном времени. Цель Nvidia — сделать так, чтобы каждый раз, когда ИИ «думает», он делал это на их кремнии.



Наше решение для электронной почты и облачного хранения данных со сквозным шифрованием обеспечивает наиболее мощные средства безопасного обмена данными, гарантируя их сохранность и конфиденциальность.
/ Создать бесплатный аккаунт