NVIDIA снижает цену на AI-агентов в 35 раз. Где подвох?

Новые данные показывают, что чипы NVIDIA GB300 NVL72 снижают стоимость токенов в 35 раз. Анализ производительности, цен и влияния на рынок AI.

NVIDIA снижает цену на AI-агентов в 35 раз. Где подвох?

NVIDIA снова взрывает рынок, но на этот раз с особым цинизмом. Новые данные по платформе Blackwell Ultra обещают до 50 раз лучшую производительность на мегаватт и в 35 раз меньшую стоимость токена для так называемого «агентного ИИ». Звучит как очередной маркетинговый залп, от которого уже сводит зубы. Но за этими цифрами кроется нечто большее: попытка сделать экономически целесообразным следующее поколение AI-приложений — автономных агентов. Тех самых, что способны не просто отвечать на вопросы, а выполнять многоступенчатые задачи, например, писать и отлаживать код в режиме реального времени. Если раньше запуск такого «цифрового стажера» обходился как содержание целого IT-отдела, то теперь NVIDIA намекает, что его услуги будут стоить копейки. Или, по крайней мере, не так разорительно дорого.

В центре этого технологического чуда — система GB300 NVL72 на базе GPU Blackwell Ultra. Но фокус не только в «железе», это было бы слишком просто. NVIDIA годами выстраивала свою экосистему, и сейчас пожинает плоды. Компания называет это «экстремальным совместным проектированием» (codesign) — когда софт вроде библиотек TensorRT-LLM и компилятора Dynamo с самого начала затачивается под архитектуру чипа. Это позволяет выжать из кремния все соки. Они докрутили GPU-ядра, ускорили прямой обмен данными между чипами с помощью NVLink Symmetric Memory и внедрили хитрые методы запуска задач, чтобы процессоры не простаивали ни миллисекунды. Это как собрать двигатель и написать для него прошивку в одном гараже — результат предсказуемо лучше, чем пытаться подружить универсальный софт с чужим железом.

В итоге, даже по сравнению с предыдущим хитом, Hopper, который сам по себе казался верхом инженерной мысли, прирост колоссальный. И это не просто абстрактные «попугаи» в бенчмарках. Согласно отчету OpenRouter, доля AI-запросов, связанных с программированием, за год выросла с 11% до почти 50%. Этот рынок растет взрывными темпами, и ему нужна инфраструктура. Крупнейшие облачные провайдеры — Microsoft, CoreWeave, Oracle — уже разворачивают эти системы для своих клиентов, в том числе для нужд OpenAI. Они прекрасно понимают: кто первым предложит дешевый инференс для AI-агентов, тот и заберет себе этот жирный кусок пирога.

Этот анонс — не просто демонстрация мускулов. Это холодный и расчетливый стратегический ход. Пока конкуренты вроде AMD и Intel пытаются догнать NVIDIA в гонке за производительность в стандартных задачах обучения моделей, Дженсен Хуанг уже играет на следующем поле — инференс сложных агентных систем. AI-агенты, анализирующие гигантские кодовые базы или финансовые отчеты, требуют двух вещей, которые раньше были взаимоисключающими: минимальной задержки (low latency) и огромного контекстного окна. До сих пор это было узким местом и стоило целое состояние. Делая такие вычисления в 35 раз дешевле, NVIDIA не просто продает новые видеокарты. Она создает и немедленно монополизирует новый рынок, на котором без ее чипов делать будет практически нечего. Это классический прием из учебника: создать потребность, а затем продать единственное эффективное решение.

Наш вердикт: это блестящий пример того, как маркетинг опирается на реальные инженерные достижения, чтобы укрепить монополию. Конечно, цифры «до 50x» получены в идеальных лабораторных условиях, на специфических моделях (Mixture-of-Experts) и при определенных задержках, выгодных для демонстрации. В реальных, разношерстных задачах прирост будет скромнее. Но даже если это будет «всего лишь» 10-кратное или 15-кратное улучшение — это все равно меняет правила игры. Это делает возможным запуск стартапов и продуктов, которые еще вчера казались фантастикой из-за непомерных затрат на вычисления. NVIDIA не просто продает «лопаты» во время «золотой лихорадки». Она строит единственную в городе железную дорогу, ведущую к приискам, и попутно анонсирует следующее поколение рельсов — Rubin, обещая еще одно 10-кратное удешевление, чтобы конкуренты даже не думали рыпаться. Им остается лишь глотать пыль и надеяться, что однажды этот поезд сойдет с рельсов. Но, судя по всему, не в этой пятилетке.

Read more