Speech Studio

Open-source Mac-приложение для локального клонирования голоса и генерации диалогов с несколькими спикерами. Перетащите образец голоса, клонируйте, напишите сцену, синтезируйте — всё на вашем ноутбуке. Без API-ключей, без облака, без оплаты за символы.

30-секундный слепой тест: реальный голос, тот же голос, клонированный локально Speech Studio на MacBook, и тот же голос, клонированный ElevenLabs в облаке. Сможете отличить?

Что умеет

Требования

Установка

Скачайте сборку для вашей платформы с GitHub Releases — macOS .dmg, Windows .msi/.exe или Linux .deb/.AppImage — затем запустите:

Сборки не подписаны: на macOS открывайте через правый клик → Открыть (или Системные настройки → Конфиденциальность и безопасность → Открыть всё равно); на Windows выберите Подробнее → Выполнить в любом случае в SmartScreen. При первом запуске скачивается речевая модель VoxCPM2 (~2.75 GB на macOS, ~4.6 GB на Windows/Linux) и кэшируется; последующие запуски используют кэш.

Предпочитаете CLI?

Тот же конвейер клонирования есть в CLI speech: brew install speech, затем speech speak --engine voxcpm2 --voxcpm2-ref-audio reference.wav -o cloned.wav "Hello, this is my cloned voice." — удобно для скриптов и батч-предрендеринга. Полный поток смотрите в руководстве по клонированию голоса.

Статус

Speech Studio в активном превью (v0.0.4), с установщиками для macOS, Windows, and Linux — macOS клонирует через MLX, Windows и Linux через движок LiteRT VoxCPM2 в speech-core. Репозиторий github.com/soniqo/speech-studio отслеживает GUI-приложение; поставьте star/watch, чтобы получать уведомления о релизах.

На чём построено

Speech Studio — тонкий GUI поверх speech-swift, open-source Swift-библиотеки, в которой собраны все модели из демо:

Roadmap

Обратная связь

Открывайте issue на github.com/soniqo/speech-studio/issues — каждое читается.