Demo
Speech Demo (Android)
Demo pipeline echo — chuyển giọng nói thành văn bản và tổng hợp lại. Hiển thị dạng sóng VAD theo thời gian thực, giao diện bong bóng chat với hiển thị độ trễ STT/TTS.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Demo CLI cho Linux
Pipeline giọng nói qua dòng lệnh cho Linux nhúng. Đầu vào từ micro ALSA hoặc qua ống PCM stdin.
Linux ARM64Linux x86_64ONNX Runtime
Demo Android
Tải xuống APK đã biên dịch sẵn (20 MB) hoặc xây dựng từ mã nguồn:
app-release.apk (APK đã ký, 20 MB)- Các mô hình tự động tải về từ HuggingFace (~1.2 GB ở lần khởi động đầu tiên)
- Parakeet TDT v3 STT (114 ngôn ngữ), Kokoro 82M TTS (8 ngôn ngữ)
- Silero VAD, khử nhiễu DeepFilterNet3, hỗ trợ barge-in
Demo CLI cho Linux
Biên dịch và chạy:
git clone https://github.com/soniqo/speech-core.git
cd speech-core
./examples/linux/setup_linux.sh
cmake -B build \
-DCMAKE_BUILD_TYPE=Release \
-DSPEECH_CORE_WITH_ONNX=ON \
-DSPEECH_CORE_BUILD_EXAMPLES=ON \
-DORT_DIR=ort-linux
cmake --build build
./build/speech_demo --model-dir /path/to/models