시청
MacBook에서 동작하는 로컬 음성 AI
4분 분량의 오픈소스 라이브러리 투어: Nemotron Streaming 실시간 전사, PersonaPlex 로컬 음성 대화, VoxCPM2 48 kHz 보이스 클로닝 — 모든 데모가 노트북에서 실행됩니다.
무엇을 만들 수 있나요
세 가지 온디바이스 사용 사례 그룹.
각 그룹은 Soniqo 컴포넌트로 엮은 여러 하위 사용 사례를 다룹니다. 오디오를 넣으면 대화·전사·생성된 음성이 로컬에서 실시간으로 돌아옵니다.
모든 컴포넌트
20개 이상의 모델. 하나의 스택.
위 유스케이스 파이프라인은 모두 이 모델들로 구성됩니다. 컴포넌트를 골라 아키텍처·CLI·Swift API·벤치마크를 확인하세요. 전부 Apple Silicon에서 동작하고 대부분 Android·Linux에서도 동작합니다.
음성 → 텍스트
텍스트 → 음성
CosyVoice 3
9 langs, zero-shot cloning, 4-bit → bf16
MLX
Qwen3-TTS
12 Hz codec LM, faster than real-time
MLX
CoreML
VoxCPM2
48 kHz, 30 langs, voice design + cloning
MLX
LiteRT
Kokoro 82M
50 voices, ~45 ms inference
CoreML
ONNX
VibeVoice
90-min podcasts / audiobooks
MLX
Magpie 357M
9 langs, 5 baked voices, streaming
MLX
Voice Cloning Suite
CosyVoice, Qwen3-TTS ICL, CAM++
MLX
