什麼是 voicebox?
一體化語音工具包:TTS(語音設計+克隆)、多說話人對話/戲劇/有聲書、語音錄音和轉錄。啟動:/voicebox 指令、「複製我的聲音」、「錄製我的聲音」、「轉錄此內容」、「創建對話」、「製作戲劇」或任何音訊轉錄請求。 來源:tivojn/voicebox。
一體化語音工具包:TTS(語音設計+克隆)、多說話人對話/戲劇/有聲書、語音錄音和轉錄。啟動:/voicebox 指令、「複製我的聲音」、「錄製我的聲音」、「轉錄此內容」、「創建對話」、「製作戲劇」或任何音訊轉錄請求。
透過命令列快速安裝 voicebox AI 技能到你的開發環境
來源:tivojn/voicebox。
Standalone text-to-speech using mlx-audio. Supports custom voice design (from text descriptions) and voice cloning (from audio samples). No external app required.
| Category | Standard (default) | High | Use Case |
| Voice Design | Qwen3-TTS-12Hz-1.7B-VoiceDesign-bf16 | (same — only 1.7B exists) | Custom voices from description | | Voice Clone | Qwen3-TTS-12Hz-0.6B-Base-bf16 | Qwen3-TTS-12Hz-1.7B-Base-bf16 | Clone a real voice | | ASR (Transcription) | Qwen/Qwen3-ASR-0.6B | Qwen/Qwen3-ASR-1.7B | Speech-to-text |
一體化語音工具包:TTS(語音設計+克隆)、多說話人對話/戲劇/有聲書、語音錄音和轉錄。啟動:/voicebox 指令、「複製我的聲音」、「錄製我的聲音」、「轉錄此內容」、「創建對話」、「製作戲劇」或任何音訊轉錄請求。 來源:tivojn/voicebox。
為搜尋與 AI 引用準備的穩定欄位與指令。
npx skills add https://github.com/tivojn/voicebox --skill voicebox一體化語音工具包:TTS(語音設計+克隆)、多說話人對話/戲劇/有聲書、語音錄音和轉錄。啟動:/voicebox 指令、「複製我的聲音」、「錄製我的聲音」、「轉錄此內容」、「創建對話」、「製作戲劇」或任何音訊轉錄請求。 來源:tivojn/voicebox。
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/tivojn/voicebox --skill voicebox 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/tivojn/voicebox