Hugging Face открывает экосистему AMD ROCm для массовой разработки кастомных ядер
Платформа для совместной разработки моделей машинного обучения Hugging Face сделала важный стратегический шаг по расширению аппаратной поддержки, представив инструменты для упрощенного создания и распространения кастомных ядер ROCm. Новая инициатива направлена на снижение барьеров для инженеров, работающих с графическими ускорителями AMD, позволяя им делиться низкоуровневыми оптимизациями так же легко, как это происходит в экосистеме CUDA от NVIDIA.
Суть нововведения заключается в возможности хостинга и автоматизированной сборки специфичного для ROCm кода непосредственно в репозиториях хаба. Ранее адаптация передовых алгоритмов, таких как FlashAttention или кастомные функции активации, под архитектуру AMD требовала сложной настройки среды и ручной компиляции. Теперь разработчики могут публиковать исходный код ядер, который будет доступен сообществу для мгновенного использования и интеграции в популярные библиотеки, что критически важно для эффективного обучения больших языковых моделей на альтернативном железе.
Для AMD углубление партнерства с главным репозиторием ИИ-моделей является ключевым элементом в конкурентной борьбе за рынок дата-центров. Обеспечивая бесшовную интеграцию своего открытого программного стека ROCm с удобными интерфейсами Hugging Face, компания стимулирует исследовательское сообщество переносить рабочие нагрузки на чипы серий Instinct и Radeon. Этот шаг может значительно ускорить появление оптимизированных версий популярных нейросетей, которые будут работать на оборудовании AMD «из коробки», разрушая монополию проприетарных решений конкурентов.