← Все проекты

Transcribator

Бесплатный локальный инструмент распознавания речи на базе OpenAI Whisper. Аудио и видео → текст. Работает на вашем компьютере – без подписок, API-ключей и лимитов.

Faster Whisper Gradio Open Source

Задача

Нужен инструмент для распознавания речи, который работает локально, бесплатно и без ограничений. Облачные сервисы требуют подписок, отправляют данные на сторонние серверы и имеют лимиты по времени.

Решение

Open-source инструмент на базе OpenAI Whisper:

  • Два режима: веб-интерфейс (панель в браузере) и командная строка
  • 99 языков: русский, английский, украинский, немецкий и др.
  • Форматы вывода: чистый текст, текст с таймкодами, SRT-субтитры
  • Входные форматы: mp3, wav, m4a, mp4, mkv, avi и другие

Результат

  • Полная приватность данные не покидают компьютер
  • Без ограничений никаких подписок, лимитов и API-ключей
  • 99 языков автоматическое определение языка
  • Гибкий вывод текст, таймкоды, SRT-субтитры