Holo2: как «темная лошадка» H Company обошла Google и OpenAI в гонке за идеальный перевод интерфейсов

H Company представила Holo2, AI-модель для локализации интерфейсов, которая на 35% точнее GPT-4. Анализируем технологию, тесты и ее шансы против гигантов.

Holo2: как «темная лошадка» H Company обошла Google и OpenAI в гонке за идеальный перевод интерфейсов

В гонке вооружений искусственного интеллекта, где все привыкли следить за титанами вроде OpenAI и Google, на поле внезапно выбежал новый игрок и забил гол в ворота, которые, казалось, надежно защищены. Стартап H Company, о котором еще вчера мало кто слышал, представил свою новую модель Holo2, заточенную под одну, но крайне болезненную задачу — локализацию пользовательских интерфейсов. И цифры, которые они показали, заставляют нервно ерзать на стуле даже самых прожженных менеджеров из Кремниевой долины: на внутреннем бенчмарке UI-Local-Bench их детище оказалось на 35% точнее GPT-4 и на 50% быстрее API Google Translate при обработке пакетов UI-элементов.

В чем же магия? Пока гиганты строят универсальные «швейцарские ножи», способные и стихи писать, и код генерировать, H Company пошла по пути лазерного скальпеля. Holo2 — это не просто языковая модель. Это мультимодальная система, которая «смотрит» на интерфейс. Она анализирует не только текстовую строку «Sign In», но и скриншот кнопки, ее размеры, положение на экране и даже сопутствующий XML-файл с разметкой. Модель понимает, что перевод на немецкий «Anmelden» уместится, а вот какой-нибудь «Benutzeridentifikation» — уже нет, и предложит более лаконичный синоним. Этот контекстуальный подход и есть их главный козырь, решающий вечную головную боль разработчиков — «поехавшую» верстку после перевода.

Разумеется, за красивой технологией стоят немалые деньги. H Company объявила о закрытии раунда B на $150 млн, который, по слухам, возглавили не последние венчурные фонды. Деньги пойдут на масштабирование API, который уже доступен в закрытой бете. Ценовая политика тоже хитрая: вместо стандартной оплаты за токены, компания предлагает подписку с тарификацией «за экран», что выглядит куда более предсказуемым для крупных клиентов, локализующих свои приложения на десятки языков.

Эта история — классический пример асимметричной войны в технологиях. OpenAI со своей GPT-серией и Google с PaLM/Gemini — это тяжелые бомбардировщики, способные накрыть любую цель, но с большой погрешностью. Holo2 — это отряд снайперов, который не пытается конкурировать в общем зачете, а выбирает одну, но очень ценную цель. Разработчики, уставшие вручную подгонять переводы и исправлять баги верстки, — это их плацдарм. Мы уже не раз писали о том, что будущее не за одной всемогущей моделью, а за экосистемой узкоспециализированных AI. Holo2 — ярчайшее тому подтверждение. Они не пытаются построить новый Google, они строят инструмент, который сам Google, вероятно, захочет купить через пару лет.

Наш вердикт: это не очередной маркетинговый пузырь, накачанный венчурными деньгами. H Company нащупала реальную, дорогую и до сих пор не решенную проблему. Конечно, заявленные «35%» могут быть результатом тестов на очень удобных для себя данных, и реальный мир, как всегда, внесет свои коррективы. Но сам подход — мультимодальный анализ контекста для решения утилитарной задачи — абсолютно верный. Holo2 — это не революция в AGI, это добротный промышленный станок, который пришел на смену кустарным напильникам. И в этом его главная ценность. Он не изменит мир, но сэкономит сотни тысяч человеко-часов и миллионы долларов своим клиентам. А в бизнесе это, пожалуй, поважнее любой революции.

Read more