Глоссарий

Что такое LLM

Large Language Model (Большая языковая модель)

LLM -- это нейросеть с миллиардами параметров, обученная на огромных объемах текстовых данных для понимания и генерации естественного языка.

Большие языковые модели (Large Language Models, LLM) -- это класс моделей искусственного интеллекта, основанных на архитектуре Transformer. Они обучаются на массивных наборах текстовых данных из интернета, книг и других источников.

Ключевые характеристики LLM:

Масштаб. Современные LLM содержат от десятков миллиардов до триллионов параметров. Рост масштаба приводит к появлению новых способностей -- так называемые "emerging abilities", которые отсутствуют у меньших моделей.

Обучение. LLM обучаются в несколько этапов: предобучение (pre-training) на большом корпусе текста, тонкая настройка (fine-tuning) на размеченных данных и обучение с обратной связью (RLHF) для выравнивания с человеческими предпочтениями.

Возможности. Современные LLM способны вести диалог, генерировать тексты, переводить, писать код, анализировать данные и решать логические задачи. Мультимодальные модели также работают с изображениями, аудио и видео.

Примеры. GPT-4o (OpenAI), Claude 4 (Anthropic), Llama 4 (Meta), Gemini 2 (Google), Mistral Large (Mistral AI).

Ограничения. LLM могут генерировать недостоверную информацию (галлюцинации), имеют ограниченное контекстное окно, не имеют доступа к актуальной информации (без дополнительных инструментов) и требуют значительных вычислительных ресурсов.

Что такое LLM -- Large Language Model (Большая языковая модель) | AIHub