Demos

Speech Demo (Android)

Echo-Pipeline-Demo — Sprache transkribieren und wieder synthetisieren. Echtzeit-VAD-Wellenform-Visualisierung, Chatblasen-UI mit STT/TTS-Latenzanzeige.

Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3

Linux-CLI-Demo

Kommandozeilen-Sprach-Pipeline für eingebettetes Linux. ALSA-Mikrofoneingang oder stdin-PCM-Pipe.

Linux ARM64Linux x86_64ONNX Runtime

Android-Demo

Lade die vorgebaute APK (20 MB) herunter oder baue aus dem Quellcode:

app-release.apk (Signierte APK, 20 MB)

Modelle werden automatisch von HuggingFace heruntergeladen (~1,2 GB beim ersten Start)
Parakeet TDT v3 STT (114 Sprachen), Kokoro 82M TTS (8 Sprachen)
Silero VAD, DeepFilterNet3-Rauschunterdrückung, Barge-in-Unterstützung

Linux-CLI-Demo

Bauen und ausführen:

git clone https://github.com/soniqo/speech-core.git
cd speech-core
./examples/linux/setup_linux.sh

cmake -B build \
    -DCMAKE_BUILD_TYPE=Release \
    -DSPEECH_CORE_WITH_ONNX=ON \
    -DSPEECH_CORE_BUILD_EXAMPLES=ON \
    -DORT_DIR=ort-linux
cmake --build build

./build/speech_demo --model-dir /path/to/models