GPT-5 официально представлен: нативная мультимодальность и агентный режим
Введение
OpenAI представила GPT-5 -- следующее поколение своей флагманской языковой модели. Новая версия получила значительные улучшения в мультимодальности, контексте и агентном поведении.
Основные возможности
GPT-5 поддерживает нативную мультимодальность: текст, изображения, аудио и видео на входе и выходе. Контекстное окно расширено до 500K токенов, а агентный режим позволяет модели самостоятельно планировать и выполнять многошаговые задачи.
Бенчмарки и производительность
По бенчмаркам GPT-5 превосходит GPT-4o на 15-20% в задачах рассуждения и кодирования. Особенно заметен прогресс в математических задачах и длинных контекстах. Модель демонстрирует значительное улучшение в задачах, требующих многошагового рассуждения.
Цены и доступность
GPT-5 доступен через API и ChatGPT Plus. Стоимость за токен выросла незначительно по сравнению с GPT-4o, при этом качество генерации существенно улучшилось. Бесплатные пользователи ChatGPT получат ограниченный доступ к новой модели.
Заключение
GPT-5 -- значительный шаг вперед для OpenAI, особенно в мультимодальности и агентных возможностях. Модель устанавливает новые стандарты качества для коммерческих LLM.