Databricks и Hugging Face обещают ускорить обучение LLM на 40%. Открытый исходный код наносит ответный удар

Новый альянс Databricks и Hugging Face ускоряет тренировку open-source LLM. Анализ партнерства и его влияния на рынок в битве с OpenAI и Google.

Databricks и Hugging Face обещают ускорить обучение LLM на 40%. Открытый исходный код наносит ответный удар

В мире, где стоимость обучения одной приличной языковой модели измеряется в миллионах долларов и тысячах часов работы GPU, новость о 40-процентном ускорении звучит как мантра. Именно с таким обещанием вышли на рынок Databricks и Hugging Face, объявив о глубокой интеграции своих платформ. И хотя ветераны индустрии знают, что к маркетинговым «до 40%» стоит относиться с долей здорового скепсиса, этот союз — событие знаковое. Он говорит не столько о технологическом прорыве, сколько о формировании мощного второго фронта в войне за будущее искусственного интеллекта.

Суть сделки проста, как все гениальное. Databricks, компания, которая построила бизнес-империю на том, чтобы сделать Apache Spark и данные удобными для корпораций, теперь делает то же самое для LLM. Они взяли популярнейшие библиотеки Hugging Face — `transformers`, `accelerate`, `datasets` — и оптимизировали их для работы на своей платформе Data Intelligence Platform. В ход пошли все модные инструменты: от DeepSpeed для распределенного обучения до FlashAttention-2 для эффективной работы с памятью. В итоге, если верить пресс-релизу, запуск скрипта для дообучения какой-нибудь Llama 3 на платформе Databricks теперь требует минимума усилий и выполняется ощутимо быстрее. Это прямой выпад в сторону более громоздких и дорогих решений от облачных гигантов и специализированных MLOps-платформ.

Но чтобы понять истинный масштаб происходящего, нужно отвлечься от процентов и терафлопсов. Последние пару лет AI-рынок стремительно делился на два лагеря. С одной стороны — «соборы»: закрытые, монолитные экосистемы OpenAI, Google и Anthropic. Они предлагают мощные модели через API, но держат исходный код и веса под семью замками. Это удобно, но дорого и создает зависимость от одного поставщика. С другой стороны — «базар»: шумный, хаотичный, но невероятно живой мир open-source, где Hugging Face выступает главной площадью и библиотекой. Модели от Mistral, Llama, Cohere и сотен других команд доступны всем, их можно дообучать на своих данных и запускать где угодно.

Именно в этом контексте альянс Databricks и Hugging Face выглядит как стратегический шедевр. Databricks дает миру open-source то, чего ему всегда не хватало: отполированную, быструю и безопасную корпоративную «песочницу». А Hugging Face дает Databricks доступ к самой большой и активной армии AI-разработчиков. Вместе они предлагают рынку соблазнительную альтернативу: «Зачем платить OpenAI за каждый токен и отправлять им свои конфиденциальные данные, если можно взять отличную открытую модель, быстро и недорого дообучить ее на нашей платформе и получить полный контроль над своим AI?»

Этот ход — прямое следствие тренда на «суверенный AI». Компании, от банков до промышленных гигантов, осознали риски зависимости от внешних API. Они хотят владеть своими моделями, данными и инфраструктурой. Databricks продает им именно эту мечту, а ускорение обучения — это просто вишенка на торте, делающая эту мечту более доступной. Это уже не просто соревнование моделей, это битва бизнес-философий. И в этой битве лагерь open-source только что получил в свое распоряжение тяжелую артиллерию и хорошо укрепленный плацдарм.

Наш вердикт: это на 20% технология и на 80% — блестящий маркетинг и стратегия. Сами по себе оптимизации с помощью DeepSpeed и FlashAttention не новы, и умелые инженеры могли добиться схожих результатов и раньше. Но Databricks и Hugging Face упаковали это в удобный продукт и подали под соусом «легкого и доступного AI для всех». Реальное ускорение на проектах, конечно, будет зависеть от десятка факторов, и обещанные 40% окажутся достижимы в лабораторных условиях. Но это не отменяет главного. Этот альянс — мощный сигнал рынку, что эпоха доминирования нескольких закрытых моделей подходит к концу. Будущее, скорее всего, за гибридным миром, где десятки тысяч специализированных, дообученных на частных данных open-source моделей будут решать конкретные задачи бизнеса. И Databricks делает серьезную заявку на то, чтобы стать главной фабрикой по производству таких моделей.

Read more