Démos
Speech Demo (Android)
Démo de pipeline d'écho — transcrit la parole et la resynthétise. Visualisation de forme d'onde VAD en temps réel, interface en bulles de chat avec affichage de latence STT/TTS.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Démo CLI Linux
Pipeline vocal en ligne de commande pour Linux embarqué. Entrée micro ALSA ou pipe PCM via stdin.
Linux ARM64Linux x86_64ONNX Runtime
Démo Android
Téléchargez l'APK pré-compilé (20 Mo) ou compilez depuis les sources :
app-release.apk (APK signé, 20 Mo)- Les modèles se téléchargent automatiquement depuis HuggingFace (~1,2 Go au premier lancement)
- Parakeet TDT v3 STT (114 langues), Kokoro 82M TTS (8 langues)
- Silero VAD, suppression de bruit DeepFilterNet3, support du barge-in
Démo CLI Linux
Compilation et exécution :
git clone https://github.com/soniqo/speech-core.git
cd speech-core
./examples/linux/setup_linux.sh
cmake -B build \
-DCMAKE_BUILD_TYPE=Release \
-DSPEECH_CORE_WITH_ONNX=ON \
-DSPEECH_CORE_BUILD_EXAMPLES=ON \
-DORT_DIR=ort-linux
cmake --build build
./build/speech_demo --model-dir /path/to/models