デモ
Speech Demo (Android)
エコーパイプラインデモ — 音声を文字起こしし、合成してエコーバックします。リアルタイムVAD波形可視化、STT/TTSレイテンシー表示付きのチャットバブルUI。
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Linux CLI Demo
embedded Linux向けのコマンドライン音声パイプライン。ALSAマイク入力またはstdin PCMパイプ。
Linux ARM64Linux x86_64ONNX Runtime
Androidデモ
プリビルドAPK(20 MB)をダウンロードするか、ソースからビルドします。
app-release.apk (署名済みAPK、20 MB)- モデルはHuggingFaceから自動ダウンロードされます(初回起動時約1.2 GB)
- Parakeet TDT v3 STT(114言語)、Kokoro 82M TTS(8言語)
- Silero VAD、DeepFilterNet3ノイズキャンセリング、バージインサポート
Linux CLIデモ
ビルドと実行:
git clone https://github.com/soniqo/speech-core.git
cd speech-core
./examples/linux/setup_linux.sh
cmake -B build \
-DCMAKE_BUILD_TYPE=Release \
-DSPEECH_CORE_WITH_ONNX=ON \
-DSPEECH_CORE_BUILD_EXAMPLES=ON \
-DORT_DIR=ort-linux
cmake --build build
./build/speech_demo --model-dir /path/to/models