Aya 23: открытый вызов гегемонии англоязычных LLM
Разбор новой модели Aya 23 от Cohere for AI. Как открытая нейросеть для 114 языков бросает вызов Google Gemini и меняет правила игры в AI.
Пока технологические гиганты меряются размерами своих флагманских моделей и количеством нулей в инвестиционных раундах, некоммерческое крыло Cohere вместе с армией из 3000 независимых исследователей молча сделало то, что другие лишь обещают в рекламных проспектах. Они выпустили Aya 23 — семейство по-настоящему многоязычных и, что важнее, открытых моделей на 8 и 35 миллиардов параметров. Речь идет не о кривом машинном переводе с английского, а о полноценной поддержке 114 языков, многие из которых редко попадают в фокус внимания Кремниевой долины. Это не просто очередной релиз на Hugging Face, это — идеологический вызов всей индустрии, зацикленной на англосфере.
Давайте к цифрам и фактам. В основе Aya 23 лежит архитектура коммерческой модели Cohere Command, но главное сокровище здесь — обучающий датасет. Команда собрала «Aya Collection», массив из 513 миллионов пар «промпт-ответ», охватывающий беспрецедентное количество языков. Этот титанический труд позволил добиться впечатляющих результатов. По данным разработчиков, Aya 23 значительно превосходит существующие открытые аналоги, включая таких фаворитов, как Mistral и Gemma от Google. Модели распространяются под либеральной лицензией Apache 2.0, что открывает дорогу для коммерческого использования без лишних юридических танцев с бубном. Это прямой удар по моделям с ограничительными лицензиями, которые вроде бы «открыты», но на деле сковывают разработчиков по рукам и ногам.
Релиз Aya 23 происходит на фоне обостряющейся борьбы за глобальный рынок ИИ. Google во всех презентациях делает ставку на мультимодальность и многоязычность своего флагмана Gemini, позиционируя его как универсальный инструмент для всего мира. OpenAI, хоть и доминирует, исторически была сфокусирована на английском языке, догоняя в мультилингвальности. И тут на сцену выходит Cohere с открытой альтернативой, которая не просто «умеет» в другие языки, а создана для них. Это классическая асимметричная война: вместо того чтобы в лоб конкурировать с GPT-5, Cohere for AI создает и вооружает глобальное сообщество разработчиков. Они делают ставку на то, что армия энтузиастов, строящих локальные продукты на базе Aya 23, в итоге создаст более живую и разнообразную экосистему, чем закрытый «сад за высоким забором» от конкурентов.
Важно понимать, что для Cohere это не просто альтруизм. Создавая лучший в классе открытый инструмент для многоязычного AI, компания решает сразу несколько задач. Во-первых, она привлекает к своей экосистеме таланты со всего мира. Во-вторых, повышает узнаваемость бренда и лояльность, которые затем можно конвертировать в продажи коммерческих продуктов. В-третьих, собирает бесценные данные о том, как используются и дообучаются их модели в самых разных культурных и языковых контекстах. Это та информация, которую не купить ни за какие деньги. И пока одни соревнуются в абстрактных бенчмарках, другие строят фундамент для реального глобального доминирования, как мы уже не раз обсуждали, изучая лидерборды LLM.
Наш вердикт: это не просто очередной прорыв, а один из самых умных ходов на AI-шахматной доске за последнее время. Aya 23 — это и мощнейший технологический артефакт, и блестящая маркетинговая стратегия. Cohere не пытается победить OpenAI на ее поле, играя по ее правилам. Вместо этого они создают совершенно новое поле игры, где знание суахили или тагальского внезапно становится конкурентным преимуществом. Это не благотворительность, а грамотный стратегический ход по захвату умов и рынков, которые большие корпорации до сих пор считали «нишевыми». И, честно говоря, за этим чертовски интересно наблюдать. Рынок AI становится менее американоцентричным, и это хорошая новость для всех.