NVIDIA Blackwell удешевляет AI в 10 раз. OpenAI, подвинься
Как новая платформа NVIDIA Blackwell и открытые модели снижают стоимость инференса до 10 раз. Анализ технологии и ее влияния на бизнес OpenAI и Google.
Каждый раз, когда вы получаете ответ от чат-бота, видите сгенерированную картинку или слышите голос AI-ассистента, где-то в дата-центре сгорают деньги. Стоимость этих операций, называемая инференсом, измеряется в токенах — базовых единицах интеллекта. И до недавнего времени эта «токеномика» была главным тормозом для широкого внедрения AI. Корпорации вроде OpenAI и Google крепко держали рынок за счет своих закрытых и дорогих API. Но, кажется, NVIDIA решила поджечь этот уютный мирок. Компания утверждает, что ее новая платформа Blackwell в связке с открытыми моделями способна снизить стоимость токена вплоть до 10 раз. А это уже не просто апгрейд — это заявка на передел рынка.
В чем магия? NVIDIA называет это «экстремальным co-design» — когда железо и софт проектируются в неразрывной связке. Платформа Blackwell — это не просто новый, более быстрый чип. Это целая экосистема, заточенная под одну задачу: выплевывать токены с максимальной эффективностью. В ход идет все: от нового формата данных NVFP4, позволяющего сжимать модели без существенной потери точности, до оптимизированных библиотек вроде TensorRT-LLM. Аналогия с печатным станком из блога NVIDIA, хоть и банальна, но верна: если вы можете печатать в 10 раз больше страниц, затратив лишь чуть больше чернил, цена каждого экземпляра падает. Здесь то же самое, только вместо страниц — диалоги с AI, медицинские диагнозы и игровые квесты.
Ключевой момент — фокус на открытых моделях. Еще год назад это звучало бы как компромисс. Сегодня же лучшие open-source LLM, такие как Llama 3 или модели от Mistral, вплотную приблизились по качеству к «флагманам» вроде GPT-4. Проблема была в том, чтобы заставить их работать так же быстро и дешево. Провайдеры облачного инференса — Baseten, DeepInfra, Fireworks AI и Together AI — первыми получили доступ к Blackwell и уже рапортуют о впечатляющих результатах. Например, Sully.ai, разработчик AI-ассистентов для врачей, перешел с закрытой модели на open-source, запущенный на Blackwell, и сократил расходы на 90%, а время ответа — на 65%. Игровой стартап Latitude, создатель AI Dungeon, снизил стоимость генерации миллиона токенов с 20 до 5 центов. Это меняет экономику всего проекта: теперь можно делать AI-игры сложнее и глубже, не опасаясь банкротства от каждого действия игрока.
Это не просто техническое обновление. Это мощный стратегический ход Дженсена Хуанга. Вместо того чтобы конкурировать с OpenAI и Google на поле создания моделей, NVIDIA укрепляет свою позицию главного «оружейного барона» этой войны. Она дает в руки тысячам мелких и средних компаний доступное и мощное оружие — дешевый инференс — для борьбы с гигантами. Зачем платить за API, если можно развернуть сопоставимую по качеству открытую модель у себя и контролировать каждый ее аспект? NVIDIA создает и питает целую экосистему, которая зависит от ее железа. Чем успешнее будет open-source движение, тем больше чипов Blackwell (а за ними и Rubin, и так далее) продаст компания. Это гениальный ход, превращающий потенциальных конкурентов в крупнейших клиентов.
Наш вердикт: Заявления о «десятикратном удешевлении» — это, конечно, маркетинг, достижимый в идеальных условиях на специально подобранных моделях (например, Mixture-of-Experts). В реальной жизни прирост будет скромнее, но даже если это 3-5 раз — это уже революция. NVIDIA не просто продает «железо», она продает независимость от больших AI-корпораций. Blackwell — это катализатор, который может окончательно сместить баланс сил в сторону открытого исходного кода. Это позволит появиться сотням новых AI-продуктов, которые раньше были нерентабельны. Однако не стоит обманываться: это не акт альтруизма. NVIDIA строит еще более глубокую и всеобъемлющую монополию. Теперь от нее зависит не только возможность обучать модели, но и экономическая целесообразность их использования. Добро пожаловать в мир, где все дороги AI ведут в Санта-Клару.