Whisper v3
speech_to_textOpen SourceOpen-source модель распознавания речи
(0)
OpenAIОписание
Whisper v3 — открытая модель распознавания речи от OpenAI. Поддерживает более 100 языков, автоматическое определение языка и перевод. Доступна для локального запуска и через API. Широко используется для транскрипции и субтитров.
Характеристики
| Провайдер | OpenAI |
| Тип модели | speech_to_text |
| Параметры | 1.5B |
| Контекст | N/A |
| Цена (input) | $0.006/1M токенов |
| Цена (output) | $0/1M токенов |
| Дата релиза | 2023-11-06 |
| Лицензия | MIT |
Бенчмарки
wer_en4.2%
wer_multilingual8.7%