30 миллиардов по цене 3: NVIDIA и AWS сделали мощный ИИ доступнее с Nemotron 3 Nano

NVIDIA и AWS представили Nemotron 3 Nano в SageMaker. Модель с 30 млрд параметров и 3 млрд активных благодаря MoE. Анализ архитектуры, тесты и перспективы.

30 миллиардов по цене 3: NVIDIA и AWS сделали мощный ИИ доступнее с Nemotron 3 Nano

Кажется, гонка за размером моделей сменяется гонкой за эффективностью. NVIDIA, главный бенефициар AI-бума, в партнерстве с облачным гигантом AWS выкатила на платформу SageMaker JumpStart свою новую разработку — Nemotron 3 Nano 30B. И главная фишка тут не в общем количестве параметров, а в том, сколько из них реально работают. Модель на 30 миллиардов параметров в каждый момент времени задействует всего 3 миллиарда «активных» — это как купить V8, который в городском цикле ест топливо как скромный трехцилиндровый моторчик. Такой подход обещает производительность больших моделей при значительно меньших затратах на инференс, что для любого бизнеса звучит как музыка.

В основе этой магии лежит архитектура Mixture-of-Experts (MoE), которую мы уже видели у Mistral и в других проектах. Если упрощать, то вместо одного гигантского мозга, который пытается решить любую задачу, у Nemotron есть команда узких «специалистов»-нейросетей. Когда поступает запрос, специальный роутер решает, кому из экспертов поручить работу. В итоге, общая база знаний огромна (те самые 30B), но для конкретного ответа трудится лишь небольшая часть модели (3B). NVIDIA пошла дальше и скрестила MoE с гибридной архитектурой Transformer-Mamba. Mamba — это более свежий и, по заявлениям, более эффективный подход к обработке последовательностей, чем классический механизм внимания в Трансформерах. Все это упаковано в модель с открытыми весами и рецептами для кастомизации и дополнено внушительным контекстным окном до 1 миллиона токенов.

Размещение Nemotron 3 Nano на Amazon SageMaker JumpStart — это чисто прагматичный ход. Самостоятельное развертывание и поддержка даже такой «экономной» модели — головная боль для большинства компаний. Нужны и специалисты, и железо. AWS предлагает решение «под ключ»: пара кликов в консоли, и у вас есть готовый эндпоинт, к которому можно обращаться через API. Amazon получает еще одну востребованную модель в свой каталог, чтобы удержать клиентов, а NVIDIA — широчайший канал дистрибуции для своего софтверного продукта. Классический симбиоз, где разработчик платит за удобство и избавляется от необходимости администрировать серверы. Все счастливы, особенно бухгалтерия обеих корпораций.

Этот релиз отлично вписывается в общую картину рынка. Эпоха, когда все мерились исключительно количеством параметров, подходит к концу. Теперь в цене «умная» оптимизация. Компании вроде Google с их семейством Gemma, Meta с компактными версиями Llama и европейцы из Mistral уже доказали, что небольшие, но хорошо обученные и архитектурно продуманные модели (SLM) могут решать 90% бизнес-задач не хуже неповоротливых гигантов. NVIDIA, которая долгое время была «продавцом лопат» в этой золотой лихорадке, теперь сама активно добывает золото. Nemotron — это не просто модель, это часть большой стратегии по созданию полноценной экосистемы, от чипов и CUDA до готовых AI-сервисов, плотно подсаживающей разработчиков на зеленый стек.

Заявленные сильные стороны модели — кодинг, научное мышление и математика — подкреплены результатами на специфических бенчмарках вроде SWE Bench и GPQA Diamond. Конечно, к любым тестам от самих создателей стоит относиться со здоровой долей скепсиса, но фокус на сложных, агентных задачах понятен. Именно здесь требуется сочетание широких знаний и точной логики, и именно здесь MoE-архитектура может проявить себя лучше всего. Предоставляя модель с открытыми весами, NVIDIA дает разработчикам возможность дообучить ее на своих данных, что критично для соблюдения приватности и создания узкоспециализированных решений.

Наш вердикт: это не революция, а очень грамотная и своевременная эволюция. Технологический стек (MoE + Mamba) действительно интересен и указывает на вектор развития всей индустрии в сторону большей эффективности. Однако главный прорыв здесь не в технологиях, а в бизнесе. NVIDIA демонстрирует, как можно и нужно монетизировать свое доминирующее положение на рынке железа, выстраивая над ним прибыльную софтверную империю. Nemotron 3 Nano на AWS — это мощный коммерческий продукт, идеально упакованный для корпоративного клиента, который хочет получить «сильный AI» без лишних сложностей и капитальных затрат. Это еще один гвоздь в крышку гроба идеи о том, что для серьезных задач нужен исключительно GPT-4 или его аналоги за все деньги мира.

Read more

Первая ласточка Апокалипсиса: ключевой исследователь OpenAI уволилась из-за рекламы в ChatGPT, предрекая «путь Facebook»

Первая ласточка Апокалипсиса: ключевой исследователь OpenAI уволилась из-за рекламы в ChatGPT, предрекая «путь Facebook»

Ключевой исследователь OpenAI Зои Хитциг уволилась после запуска рекламы в ChatGPT. Она считает, что компания повторяет ошибки Facebook, рискуя данными пользователей.

By Редакция AI News