Anthropic заставила Claude 3 писать код для железа Nvidia

Анализ нового достижения Anthropic: как Claude 3 научился генерировать CUDA-код для Nvidia и почему это важный ход в конкурентной борьбе с OpenAI и Google.

Anthropic заставила Claude 3 писать код для железа Nvidia

Anthropic сделала неожиданный ход, продемонстрировав способность Claude 3 Opus генерировать низкоуровневый код для GPU. Речь идет не о скриптах на Python, а о CUDA-ядрах — программах, которые напрямую управляют параллельными вычислениями на чипах Nvidia. Это демонстрация силы в узкой, но критически важной нише, где производительность решает все. Более того, сгенерированные данные используются для дообучения открытых моделей, что выглядит как попытка перетянуть на свою сторону симпатии open-source сообщества.

Технически задача заключается в генерации кода на C++ со специфичными для CUDA расширениями, который затем компилируется и исполняется на GPU. Это требует от модели глубокого понимания не только синтаксиса, но и архитектуры железа, принципов распараллеливания и оптимизации памяти. По заявлению исследователей, Claude 3 способен не просто писать рабочий код, но и достигать производительности, сравнимой с той, что пишут инженеры-люди. Метод «обучения открытых моделей» по сути является дистилляцией знаний: мощная проприетарная модель создает качественный синтетический датасет, на котором затем «воспитываются» более доступные аналоги.

На фоне постоянной гонки за размером контекстного окна и мультимодальностью, где соревнуются OpenAI и Google со своей Gemini, шаг Anthropic выглядит как асимметричный ответ. Вместо того чтобы впечатлять широкую публику генерацией видео, компания показывает свою ценность для узкого круга высококлассных инженеров и enterprise-клиентов. Это заявка на техническое лидерство в области, которая лежит в основе всего современного AI. Помогая при этом open-source, Anthropic тонко играет на поле идеологической борьбы, позиционируя себя как «сознательного» гиганта в мире закрытых архитектур.