عروض توضيحية
Speech Demo (Android)
عرض توضيحي لخط أنابيب الصدى — يفرّغ الكلام ويُعيد توليده. تصوّر فوري لشكل موجة VAD، وواجهة فقاعات دردشة مع عرض زمن استجابة STT/TTS.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
عرض توضيحي لـ CLI على Linux
خط أنابيب كلام يعمل من سطر الأوامر لـ Linux المضمّن. دخل ميكروفون ALSA أو أنبوب PCM من stdin.
Linux ARM64Linux x86_64ONNX Runtime
عرض Android التوضيحي
نزّل ملف APK الجاهز (20 ميغابايت) أو ابنِه من المصدر:
app-release.apk (APK موقَّع، 20 ميغابايت)- تُنزَّل النماذج تلقائيًا من HuggingFace (~1.2 غيغابايت عند الإطلاق الأول)
- Parakeet TDT v3 STT (114 لغة)، Kokoro 82M TTS (8 لغات)
- Silero VAD، إلغاء الضوضاء بـ DeepFilterNet3، دعم المقاطعة (barge-in)
عرض CLI التوضيحي على Linux
البناء والتشغيل:
git clone https://github.com/soniqo/speech-core.git
cd speech-core
./examples/linux/setup_linux.sh
cmake -B build \
-DCMAKE_BUILD_TYPE=Release \
-DSPEECH_CORE_WITH_ONNX=ON \
-DSPEECH_CORE_BUILD_EXAMPLES=ON \
-DORT_DIR=ort-linux
cmake --build build
./build/speech_demo --model-dir /path/to/models