Demos
Speech Demo (Android)
Echo 流水线 demo — 把语音转写后再合成出来。实时 VAD 波形可视化,带 STT/TTS 延迟显示的聊天气泡 UI。
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Linux CLI Demo
面向嵌入式 Linux 的命令行语音流水线。支持 ALSA 麦克风输入或 stdin PCM 管道。
Linux ARM64Linux x86_64ONNX Runtime
Android Demo
下载预构建 APK(20 MB)或从源码构建:
app-release.apk (已签名 APK,20 MB)- 模型从 HuggingFace 自动下载(首次启动约 1.2 GB)
- Parakeet TDT v3 STT(114 种语言)、Kokoro 82M TTS(8 种语言)
- Silero VAD、DeepFilterNet3 降噪、barge-in 支持
Linux CLI Demo
构建并运行:
git clone https://github.com/soniqo/speech-core.git
cd speech-core
./examples/linux/setup_linux.sh
cmake -B build \
-DCMAKE_BUILD_TYPE=Release \
-DSPEECH_CORE_WITH_ONNX=ON \
-DSPEECH_CORE_BUILD_EXAMPLES=ON \
-DORT_DIR=ort-linux
cmake --build build
./build/speech_demo --model-dir /path/to/models