DeepSeek на AWS: китайский дракон в облаке Amazon

Подробный разбор, как Amazon упростил доступ к мощным AI-моделям DeepSeek Coder и V2 через SageMaker. Анализ технологии, цен и конкуренции с OpenAI.

DeepSeek на AWS: китайский дракон в облаке Amazon

Пока OpenAI и Google с помпой презентуют новые фичи и меряются размерами контекстных окон, Amazon действует как обычно — тихо, прагматично и с максимальной выгодой для своего облачного бизнеса. На днях в маркетплейс Amazon SageMaker без лишнего шума добавили поддержку моделей от DeepSeek. Для тех, кто не следит за ежедневной драмой в лидербордах LLM, поясню: это не просто очередной стартап. Это китайская компания, чья модель DeepSeek Coder V2 буквально влетела в топы рейтингов по генерации кода, оставив позади многих именитых конкурентов. И теперь этот «дракон» доступен для развертывания в пару кликов.

Давайте к деталям, без маркетинговой шелухи. В SageMaker Jumpstart теперь можно найти две ключевые модели: DeepSeek V2 и DeepSeek Coder V2. Обе — монстры на 236 миллиардов параметров, построенные на архитектуре Mixture-of-Experts (MoE). Это позволяет им быть одновременно мощными и относительно экономичными в работе, активируя только нужные «куски» нейросети для конкретной задачи. DeepSeek V2 — это универсальная модель с контекстным окном в 128 тысяч токенов, обученная на 8.1 триллионе токенов. Coder V2, как ясно из названия, заточен под программирование и, по многочисленным тестам, генерирует код чище и точнее, чем многие версии GPT-4. AWS предлагает не просто API-доступ, а полноценное развертывание на выделенных инстансах и, что самое важное, возможность для fine-tuning. Это значит, что любая компания может взять эту мощнейшую основу и дообучить ее на своих внутренних данных, будь то проприетарная кодовая база или архивы клиентской поддержки.

В этом и заключается вся соль. До недавнего времени, чтобы запустить и дообучить модель такого класса, требовалась команда MLOps-инженеров, месяцы подготовки инфраструктуры и серьезные бюджеты «на исследования». Amazon же превратил этот процесс в товар. Они не создают лучшую модель, они создают лучшую платформу для использования любых моделей. Хотите Claude от Anthropic? Пожалуйста. Предпочитаете Llama от Meta? Без проблем. Нужна ультимативная машина для кодинга от китайских разработчиков? Вот, держите. AWS играет роль «Швейцарии» в этой войне искусственных интеллектов, продавая оружие и патроны всем сторонам конфликта. И, разумеется, зарабатывая на каждом вычислении, на каждом гигабайте трафика.

Эта стратегия — прямой выпад в сторону более закрытых экосистем. Google активно продвигает свои модели Gemini через собственную платформу Vertex AI, а Microsoft намертво привязал Azure к моделям OpenAI. Amazon же делает ставку на открытость и выбор. Они понимают, что гегемония одной модели — явление временное. Сегодня на коне OpenAI, завтра — Anthropic, послезавтра — какой-нибудь стартап из гаража (или, как в данном случае, из Пекина). Предоставляя удобную и унифицированную инфраструктуру, Amazon подсаживает на свою иглу компании, которым важнее быстро получить результат, а не клясться в верности одному AI-бренду.

Конечно, есть и нюансы. Модели DeepSeek не являются «открытыми» в классическом понимании Open Source. Их лицензия разрешает коммерческое использование, но с определенными ограничениями, и не одобрена OSI. Это скорее «source-available» подход, ставший популярным в последнее время: «смотрите, как устроен наш код, пользуйтесь, но не забывайте, кто здесь главный». Для большинства компаний это не станет преградой, но фанатикам чистого опенсорса такой прагматизм может не понравиться.

Наш вердикт: это не столько технологический прорыв, сколько важнейший рыночный сигнал. Слой базовых, фундаментальных моделей стремительно коммодитизируется — то есть, превращается в общедоступный товар. Настоящая битва за деньги и умы пользователей будет разворачиваться выше — на уровне приложений, кастомных дообученных моделей и уникальных сценариев использования. Ход Amazon и DeepSeek — это мощный катализатор этого процесса. Он демократизирует доступ к передовым технологиям, позволяя даже небольшим командам бросить вызов гигантам. И пока корпорации меряются миллиардами параметров, Amazon просто строит самую удобную и прибыльную «песочницу» для их игр.

Read more