Whisper v3

speech_to_textOpen Source

Open-source модель распознавания речи

(0)
OpenAI

Описание

Whisper v3 — открытая модель распознавания речи от OpenAI. Поддерживает более 100 языков, автоматическое определение языка и перевод. Доступна для локального запуска и через API. Широко используется для транскрипции и субтитров.

Характеристики

ПровайдерOpenAI
Тип моделиspeech_to_text
Параметры1.5B
КонтекстN/A
Цена (input)$0.006/1M токенов
Цена (output)$0/1M токенов
Дата релиза2023-11-06
ЛицензияMIT

Бенчмарки

wer_en4.2%
wer_multilingual8.7%

Сильные стороны

    Слабые стороны

      Whisper v3 -- характеристики, бенчмарки, отзывы | AIHub