Глоссарий

Что такое Speech-to-Text (распознавание речи)

Speech-to-Text (распознавание речи)

Speech-to-Text — технология автоматического преобразования устной речи в письменный текст с точностью до 98%.

Speech-to-Text (STT) — технология автоматического преобразования устной речи в письменный текст. Современные модели (Whisper от OpenAI, Deepgram, AssemblyAI) поддерживают десятки языков, различают говорящих и работают в реальном времени. Применяется для транскрипции встреч, субтитров, голосового ввода, анализа звонков колл-центров и создания заметок. Точность лучших моделей достигает 95-98% для чистой речи.