เดโม
Speech Demo (Android)
เดโมไปป์ไลน์ echo — ถอดเสียงพูดเป็นข้อความและสังเคราะห์กลับ แสดงคลื่น VAD แบบเรียลไทม์ UI บับเบิลแชตพร้อมแสดงเวลาแฝง STT/TTS
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
เดโม CLI สำหรับ Linux
ไปป์ไลน์เสียงพูดผ่านบรรทัดคำสั่งสำหรับ Linux แบบฝังตัว อินพุตจากไมโครโฟน ALSA หรือผ่าน pipe PCM stdin
Linux ARM64Linux x86_64ONNX Runtime
เดโม Android
ดาวน์โหลด APK ที่บิลด์ไว้ล่วงหน้า (20 MB) หรือบิลด์จากซอร์ส:
app-release.apk (APK ที่เซ็นแล้ว, 20 MB)- โมเดลดาวน์โหลดอัตโนมัติจาก HuggingFace (~1.2 GB ในการเปิดใช้ครั้งแรก)
- Parakeet TDT v3 STT (114 ภาษา), Kokoro 82M TTS (8 ภาษา)
- Silero VAD, การลดเสียงรบกวน DeepFilterNet3, รองรับ barge-in
เดโม CLI สำหรับ Linux
บิลด์และรัน:
git clone https://github.com/soniqo/speech-core.git
cd speech-core
./examples/linux/setup_linux.sh
cmake -B build \
-DCMAKE_BUILD_TYPE=Release \
-DSPEECH_CORE_WITH_ONNX=ON \
-DSPEECH_CORE_BUILD_EXAMPLES=ON \
-DORT_DIR=ort-linux
cmake --build build
./build/speech_demo --model-dir /path/to/models