Aya: Как открытая модель для 101 языка бросает вызов гегемонии OpenAI

Cohere for AI выпустила Aya — языковую модель на 13 млрд параметров. Как она бросает вызов OpenAI и Google в борьбе за глобальный рынок AI? Разбор технологии.

Aya: Как открытая модель для 101 языка бросает вызов гегемонии OpenAI

Пока OpenAI полирует GPT-5 в своих калифорнийских лабораториях, а Google пытается убедить мир в разумности Gemini, на поле вышел игрок с неожиданной тактикой. Некоммерческое подразделение Cohere for AI представило Aya — большую языковую модель, заточенную не на рекорды в бенчмарках, а на лингвистическое разнообразие. Цифры звучат солидно: 13 миллиардов параметров и, что самое главное, поддержка 101 языка. Это не просто очередной «убийца GPT», а скорее попытка построить цифровую Вавилонскую башню, где все друг друга понимают. И эта попытка, в отличие от библейской, имеет все шансы на успех, ведь за ней стоит одна из самых сильных команд в индустрии.

Давайте к деталям. Aya — это не просто модель, а целое семейство. Флагман на 13B параметров распространяется под лицензией Apache 2.0, что, для тех кто понимает, — это почти «бери и делай что хочешь». В основе лежит громадный набор данных Aya Collection, собранный с помощью тысяч энтузиастов со всего мира, который содержит 414 миллионов пар «инструкция-ответ» на 114 языках. Это принципиально иной подход, нежели простое скармливание модели всего интернета в надежде, что она сама разберется с суахили или тагальским. Разработчики сделали ставку на качественные, выверенные данные для языков, которые обычно остаются на обочине технологического прогресса. Проект финансируется Cohere, Google, а также щедрыми пожертвованиями от частных лиц и фондов. Это не гаражный стартап, а серьезная, хорошо обеспеченная ресурсами инициатива.

Конечно, за этим красивым фасадом «AI для всех» скрывается холодный корпоративный расчет. Cohere, будучи одним из ключевых конкурентов OpenAI и Anthropic, ведет свою игру. Выпуская мощную открытую модель через свое некоммерческое крыло, компания решает сразу несколько задач. Во-первых, это мощнейший PR и формирование имиджа «хороших парней». Во-вторых, это способ создать и возглавить сообщество разработчиков, которые будут строить свои продукты на базе Aya, создавая экосистему вокруг технологий Cohere. В-третьих, это элегантный способ надавить на Google, чьи модели семейства Gemini хоть и мультимодальны, но в плане истинной мультиязычности все еще не раскрыли весь свой потенциал для широкой публики.

Эта история — классический пример асимметричной войны в технологиях. OpenAI строит свой закрытый «Манхэттенский проект», инвестируя миллиарды в железо и секретные разработки. Aya же — это скорее партизанское движение. Оно не пытается соревноваться в количестве параметров, а бьет в уязвимую точку — чудовищный перекос современных LLM в сторону английского языка. Для миллионов разработчиков и бизнесов в Азии, Африке и Латинской Америке модель, которая качественно работает с их родным языком, может оказаться куда ценнее, чем очередной англоязычный гений, едва способный связать два слова на хинди. Это битва за умы и рынки, которые гиганты пока игнорируют.

Мы уже видели подобные ходы. Meta* со своими открытыми моделями Llama изрядно встряхнула рынок, создав реальную альтернативу закрытым системам. Теперь Cohere делает ставку на другую нишу — глобальную. Если Llama стала «народной» моделью для исследователей и стартапов на Западе, то Aya метит на роль фундамента для AI-решений по всему остальному миру. Это долгая игра, и ее плоды мы увидим не завтра. Но вектор задан очень четко: будущее AI не будет говорить только на одном языке.

Наш вердикт: это не столько технологическая революция, сколько блестящий стратегический ход. Aya, возможно, не побьет GPT-4 в генерации кода или написании сонетов на английском. Но ее миссия — не в этом. Это декларация о намерениях и протянутая рука разработчикам из тех стран, для которых AI до сих пор был чем-то далеким и заморским. Cohere for AI не просто выпустили модель, они начали формировать новый рынок и сообщество вокруг идеи по-настоящему глобального и доступного искусственного интеллекта. И пока гиганты меряются триллионами параметров, эта «партизанская вылазка» может оказаться куда более влиятельной в долгосрочной перспективе, чем кажется на первый взгляд.

Read more