Источник: OpenAI Blog
Оригинал
Релизы моделей

GPT-5 официально представлен: нативная мультимодальность и агентный режим

AIHub Team10 апреля 2026 г.5 мин чтения89 200

Введение

OpenAI представила GPT-5 -- следующее поколение своей флагманской языковой модели. Новая версия получила значительные улучшения в мультимодальности, контексте и агентном поведении.

Основные возможности

GPT-5 поддерживает нативную мультимодальность: текст, изображения, аудио и видео на входе и выходе. Контекстное окно расширено до 500K токенов, а агентный режим позволяет модели самостоятельно планировать и выполнять многошаговые задачи.

Бенчмарки и производительность

По бенчмаркам GPT-5 превосходит GPT-4o на 15-20% в задачах рассуждения и кодирования. Особенно заметен прогресс в математических задачах и длинных контекстах. Модель демонстрирует значительное улучшение в задачах, требующих многошагового рассуждения.

Цены и доступность

GPT-5 доступен через API и ChatGPT Plus. Стоимость за токен выросла незначительно по сравнению с GPT-4o, при этом качество генерации существенно улучшилось. Бесплатные пользователи ChatGPT получат ограниченный доступ к новой модели.

Заключение

GPT-5 -- значительный шаг вперед для OpenAI, особенно в мультимодальности и агентных возможностях. Модель устанавливает новые стандарты качества для коммерческих LLM.

Часто задаваемые вопросы

Что нового в GPT-5?
GPT-5 получил нативную мультимодальность (текст, изображения, аудио, видео), контекст 500K токенов и агентный режим для многошаговых задач.
Сколько стоит GPT-5?
Цена за токен выросла незначительно по сравнению с GPT-4o. Точные цены доступны на platform.openai.com.
GPT-5 лучше Claude 4?
GPT-5 выигрывает в скорости и мультимодальности. Claude 4 Opus лучше в точности инструкций и работе с длинными документами (1M контекст).

Теги

OpenAIGPT-5LLMМультимодальность

Поделиться