Ettin Suite: Двуглавый гигант, который должен научить GPT-4 скромности

Helios AI Research представила Ettin — парные энкодер-декодер модели, превосходящие GPT-4 в узких задачах. Разбираем, прорыв это или умный маркетинг.

Ettin Suite: Двуглавый гигант, который должен научить GPT-4 скромности

В нашей уютной AI-песочнице снова праздник — на арену выкатили нового гладиатора по имени Ettin Suite. Имя, отсылающее к двуглавым гигантам из фольклора, выбрано не случайно. Вместо того чтобы строить очередной Вавилонский зиккурат из триллиона параметров, исследователи из малоизвестной, но дерзкой лаборатории Helios AI Research пошли другим путем. Они представили архитектуру, основанную на «парных» энкодерах и декодерах. Идея проста, как все гениальное: один «мозг» (энкодер) учится идеально понимать и сжимать входящую информацию, а второй (декодер) — идеально разворачивать ее в нужный результат. Согласно их техническому отчету, такой подход позволил их флагманской 70B-модели обойти признанных титанов вроде GPT-4 Turbo и Claude 3 Opus на 12-15% в таких узких, но денежных задачах, как генерация сложного Python-кода и мультимодальный анализ финансовых отчетов. Звучит как заявка на победу в отдельно взятой дисциплине.

Теперь к деталям, которые любят инвесторы и инженеры. Ettin Suite — это не одна модель, а целое семейство, от компактной 7B-версии, которую можно запустить на приличном ноутбуке, до упомянутой 70B, требующей стойки серверов. Helios AI, будучи темной лошадкой, поступила хитро: веса младших моделей выложены в открытый доступ под лицензией Apache 2.0, а вот за доступ к «старшему брату» через API придется выложить круглую сумму, сопоставимую с прайсом от OpenAI. Они не просто хвастаются SOTA-результатами, они тут же пытаются их монетизировать. В их бенчмарках, конечно, все выглядит радужно — особенно на кастомном наборе тестов CodeEttinBench, где их модель предсказуемо рвет всех. Но даже на общепринятых площадках вроде HumanEval и MMLU цифры впечатляют и заставляют задуматься.

Этот релиз — не просто техническое достижение, а тонкий укол в сторону гигантов. Пока Google и OpenAI ведут позиционную войну, наращивая массу и сложность своих монолитных архитектур, появляется альтернативный путь — путь специализации. Идея модульности и разделения труда в нейросетях витала в воздухе давно, но Ettin, похоже, первым довел ее до коммерчески привлекательного продукта. Это прямой вызов философии «одна модель, чтобы править всеми». Зачем использовать термоядерный реактор для кипячения чайника, если можно взять специализированный и энергоэффективный кипятильник? Helios AI делает ставку именно на это: их решения могут оказаться в разы дешевле и эффективнее для корпоративных клиентов, которым не нужна вся мощь GPT-4 для решения конкретной бизнес-задачи.

Мы уже видели нечто подобное на заре интернета. Были огромные порталы вроде Yahoo, которые пытались быть всем и сразу, а потом пришли специализированные сервисы и съели их по частям. История повторяется, но теперь на уровне архитектур ИИ. Вместо одного всемогущего, но неповоротливого «искусственного бога», будущее, возможно, за экосистемой узкоспециализированных моделей, которые можно будет комбинировать, как кубики Lego. Ettin — это первая серьезная заявка в этой новой, «постмонолитной» эре. И это куда интереснее, чем очередные 0.5% прироста в каком-нибудь синтетическом тесте у очередной LLM-переростка.

Наш вердикт: это не «убийца GPT-4», как наверняка напишут в десятках блогов. Это скорее элегантный инженерный выпад, демонстрирующий, что грубая сила — не единственный путь к вершине. Ettin Suite — это умный маркетинг, подкрепленный солидной технологией. Они не пытаются выиграть войну, они открывают новый фронт, на котором у них есть все шансы стать локальным королем. Это не революция, но очень громкий звонок для лидеров рынка, которые, возможно, слишком увлеклись гонкой за размером, забыв про эффективность и здравый смысл. А мы любим, когда гигантам напоминают о здравом смысле.

Read more