OpenAI представила GPT-4o: флагманская модель с поддержкой аудио и видео в реальном времени

Редакция AI News

27 янв. 2026 — 1 min read

Компания OpenAI официально анонсировала запуск GPT-4o («Omni») — своей новой флагманской модели искусственного интеллекта. Ключевой особенностью разработки стала полноценная мультимодальность: алгоритм способен воспринимать, анализировать и генерировать информацию, объединяя аудио, визуальные образы и текст в режиме реального времени. Это знаменует собой качественный скачок в развитии нейросетей, предоставляя пользователям беспрецедентную скорость и гибкость взаимодействия.

В отличие от предыдущих итераций, где разные задачи выполнялись отдельными специализированными модулями, GPT-4o представляет собой единую нейросеть, обученную сразу на всех типах данных. Такой подход позволяет модели «рассуждать» (reason) и переключаться между форматами без задержек. Теперь искусственный интеллект может не только читать текст, но и слушать интонации голоса, а также анализировать происходящее через камеру устройства, мгновенно реагируя на изменения контекста.

Представители OpenAI подчеркивают, что новая архитектура делает общение с машиной максимально естественным. Устранение задержек при обработке аудио и видео приближает скорость реакции ИИ к человеческой, что открывает новые возможности для использования голосовых ассистентов и инструментов визуального анализа в повседневной жизни и бизнесе.

Sentence Transformers v5: Как обучать Sparse-модели и почему это убьет классический поиск

Новая версия Sentence Transformers позволяет легко обучать sparse-модели (SPLADE). Разбираемся, как эта технология изменит семантический поиск и RAG-системы.

NVIDIA и Dassault Systèmes построят «виртуальных двойников» для всей индустрии

CEO NVIDIA Дженсен Хуанг анонсировал партнерство с Dassault Systèmes. Цель — создать единую платформу для промышленных виртуальных двойников на базе AI.

Пять месяцев спустя: как лопнул план Nvidia по инвестициям в OpenAI на $100 миллиардов

Почему сорвалась крупнейшая инвестиция в истории AI? Анализ провала сделки Nvidia и OpenAI на $100 млрд, последствия для рынка и битва за контроль.

Яблочный прагматизм: Xcode впускает AI-агентов от OpenAI и Anthropic, чтобы не проиграть войну за разработчиков

Apple Xcode 26.3 получает нативную поддержку AI-агентов от OpenAI и Anthropic. Как это изменит разработку под iOS и бросит вызов GitHub Copilot.

Read more

Sentence Transformers v5: Как обучать Sparse-модели и почему это убьет классический поиск

NVIDIA и Dassault Systèmes построят «виртуальных двойников» для всей индустрии

Пять месяцев спустя: как лопнул план Nvidia по инвестициям в OpenAI на $100 миллиардов

Яблочный прагматизм: Xcode впускает AI-агентов от OpenAI и Anthropic, чтобы не проиграть войну за разработчиков