Семейство Falcon 3: новый игрок из Абу-Даби бросает вызов Llama 3

Подробный разбор ИИ-моделей Falcon 3 110B и 8B. Сравнение с Llama 3, анализ производительности, лицензии и наш вердикт: прорыв или хайп?

Семейство Falcon 3: новый игрок из Абу-Даби бросает вызов Llama 3

Гонка вооружений в мире open-source LLM получила новый, весьма неожиданный виток. Пока Meta праздновала успех Llama 3, а сообщество переваривало ее возможности, из Абу-Даби прилетела новость, которую нельзя игнорировать. Технологический инновационный институт (TII), щедро финансируемый правительством ОАЭ, представил целое семейство моделей Falcon 3. И это не просто плановое обновление. Это прямой вызов гегемонии американских техногигантов. Флагманская модель, Falcon 3 110B, с ее 110 миллиардами параметров, по опубликованным бенчмаркам, не просто догоняет, а в ряде тестов опережает хваленую Llama 3 70B. В придачу к ней идет и более легковесная версия на 8 миллиардов параметров, нацеленная на запуск на локальных машинах и в мобильных устройствах.

Давайте к цифрам, ведь в них, как известно, вся соль. Разработчики утверждают, что модели обучались на колоссальном датасете в 12 триллионов токенов — это массив данных, сопоставимый с тем, что используют лидеры рынка. Архитектурно, Falcon 3 110B использует продвинутые техники вроде Grouped-Query Attention (GQA), что позволяет ей быть эффективнее при инференсе, чем можно было бы ожидать от модели такого размера. Лицензия — еще один интересный момент. Модели распространяются под «TII Falcon License 2.0», которая, по сути, является Apache 2.0 с некоторыми дополнительными оговорками. Это значит, что ее можно использовать в коммерческих проектах, но, как всегда, дьявол кроется в деталях, и юристам будет что почитать на досуге. Это «открытость», но с легким арабским акцентом и пристальным взглядом корпоративных адвокатов.

Этот релиз нельзя рассматривать в вакууме. Это часть большой геополитической игры. ОАЭ уже не первый год вливают миллиарды в собственную технологическую экосистему, стремясь превратиться из нефтяной державы в цифровой хаб. Создание и «дарение» миру мощной фундаментальной модели — это не акт альтруизма, а блестящий ход по привлечению лучших умов, стартапов и инвестиций в регион. Зачем стартапу платить за API OpenAI, если можно построить свой продукт на базе Falcon 3, разместив дата-центры где-нибудь в Дубае? Это умная и дальновидная стратегия, которая создает «третий полюс» силы в мире ИИ, до сих пор поделенном между США и, с оговорками, Китаем.

На фоне этого релиза вечная битва титанов выглядит еще более напряженной. Meta, позиционирующая себя как главный знаменосец open-source, получила мощного конкурента, который играет на ее же поле. Google, пытающийся оправиться после череды имиджевых провалов с Gemini, вынужден смотреть, как еще один игрок откусывает долю рынка. OpenAI, со своей закрытой экосистемой и слухами о скором выходе GPT-5, пока что остается на Олимпе, но давление снизу нарастает с каждым днем. Выигрывает от всего этого, безусловно, сообщество разработчиков. Еще вчера Llama 3 казалась вершиной доступных технологий, а сегодня у нее уже есть альтернатива с сопоставимой, а где-то и лучшей производительностью.

Конечно, к громким заявлениям и впечатляющим графикам стоит относиться со здоровым скепсисом, который мы здесь исповедуем. Бенчмарки — вещь лукавая, и реальная производительность модели в конкретных задачах может сильно отличаться от синтетических тестов. Насколько хорошо Falcon 3 справляется с русским языком и культурным контекстом, не связанным с англосаксонским миром? Насколько сильны в ней скрытые предвзятости, заложенные на этапе отбора данных? И насколько «открытой» можно считать модель, процесс обучения и фильтрации данных которой остается черным ящиком? Ответы на эти вопросы мы получим только после массового тестирования модели энтузиастами и независимыми исследователями.

Наш вердикт: Falcon 3 — это не маркетинговая пустышка, а серьезное технологическое достижение и сильный стратегический ход. Называть ее «убийцей GPT-4» пока преждевременно, но «убийцей самоуспокоенности» на рынке — вполне. Релиз от TII доказывает, что для создания передовых ИИ-моделей больше не нужен паспорт Кремниевой долины, но нужны очень, очень большие деньги и политическая воля. Для open-source сообщества это огромный плюс: конкуренция обостряется, качество бесплатных инструментов растет. А для корпораций — еще одно напоминание, что их уютный дуопольный мирок может в любой момент быть нарушен дерзким новичком с Востока. И это, черт возьми, прекрасно.

Read more