Сокол прилетел: Falcon 2 — арабский ответ Llama 3 с прицелом на ваш ноутбук

TII выпустили Falcon 2 11B — компактную мультимодальную модель с открытой лицензией. Анализ производительности, архитектуры и ее места в гонке ИИ.

Сокол прилетел: Falcon 2 — арабский ответ Llama 3 с прицелом на ваш ноутбук

Пока всеобщее внимание приковано к гладиаторским боям между OpenAI и Google, на арену тихо, но уверенно вышел новый игрок. Институт инновационных технологий (TII) из Абу-Даби выкатил в опенсорс Falcon 2 — модель нового поколения, которая заставляет пересмотреть ставки в большой AI-игре. На бумаге все выглядит солидно: 11 миллиардов параметров, обучение на массиве из более чем 5 триллионов токенов и, что самое интересное, мультимодальность. Да, этот «Сокол» не только читает, но и смотрит. И все это под либеральной лицензией Apache 2.0, которая не связывает руки разработчикам.

Давайте к деталям. Falcon 2 — это не просто очередная LLM. Это семейство, состоящее из двух версий: текстовой Falcon 2 11B и визуально-языковой (VLM) Falcon 2 11B VLM. Последняя как раз и представляет наибольший интерес, ставя модель в один ряд с такими проектами, как Llama 3 и GPT-4o. Обучающий датасет, как утверждают разработчики, представляет собой «тщательно отфильтрованную смесь веб-данных», что намекает на попытку избежать «мусора» и токсичности, свойственных сырым данным из интернета. Обучение на 11 языках делает модель по-настояшему глобальным продуктом, а не очередной англоцентричной игрушкой. Но главный фокус здесь — эффективность. В отличие от монстров на сотни миллиардов параметров, требующих для работы целых дата-центров, Falcon 2 спроектирован с прицелом на запуск на одной потребительской видеокарте. Это демократизация доступа к мощному AI в чистом виде.

Этот релиз — не случайность, а часть большой стратегии. ОАЭ, сделавшие состояние на нефти, прекрасно понимают, что новые «углеводороды» — это данные и алгоритмы. Вливая миллиарды в TII, они стремятся обеспечить себе технологический суверенитет и место за столом, где делят будущее. И пока OpenAI строит закрытую экосистему, а Google пытается догнать конкурента, TII вместе с французской Mistral AI и Meta формируют мощный альянс сторонников открытого кода. Их стратегия проста: если нельзя победить Голиафа в лобовой атаке, нужно вооружить тысячу Давидов. Дать сообществу инструменты, которые оно сможет свободно использовать, дообучать и внедрять в свои продукты.

Эта ставка на компактные, но производительные модели — один из самых здоровых трендов в индустрии. Вместо погони за заоблачными бенчмарками, которые слабо коррелируют с реальными задачами, фокус смещается на доступность и практичность. Мы уже видели этот подход у Mistral 7B и моделей Gemma от Google, о чем подробно писали в нашем разборе феномена «маленьких гигантов». Falcon 2 продолжает эту славную традицию, доказывая, что размер — далеко не всегда главное. Гораздо важнее качество данных для обучения и продуманная архитектура.

Наш вердикт: Falcon 2 — это не «убийца GPT-4» и не технологический прорыв, меняющий все законы физики. Это нечто более важное: зрелый, качественный и по-настоящему открытый инструмент в руках глобального сообщества. Это мощный стратегический ход, который укрепляет позиции open-source лагеря и доказывает, что для создания первоклассных AI-моделей не обязательно быть корпорацией из Кремниевой долины. Маркетингового шума здесь меньше, чем у конкурентов, зато инженерной прагматики — с избытком. А в долгосрочной перспективе именно она и побеждает.

Read more