什麼是 text-to-speech?
使用 Sarvam AI 的 Bulbul 模型將文字轉換為自然語音。當使用者需要從文字生成音訊、創建畫外音、建立語音介面或合成印度語言語音時使用。支援 11 種印度語言,具有多種語音、可控音調/節奏/響度以及即時串流媒體。返回 Base64 編碼的音訊。 來源:sarvamai/skills。
使用 Sarvam AI 的 Bulbul 模型將文字轉換為自然語音。當使用者需要從文字生成音訊、創建畫外音、建立語音介面或合成印度語言語音時使用。支援 11 種印度語言,具有多種語音、可控音調/節奏/響度以及即時串流媒體。返回 Base64 編碼的音訊。
透過命令列快速安裝 text-to-speech AI 技能到你的開發環境
來源:sarvamai/skills。
Bulbul is Sarvam AI's text-to-speech model that generates natural-sounding speech in Indian languages with support for voice customization and streaming.
The API returns audio as base64-encoded strings in the audios array:
| hi-IN | Hindi | ta-IN | Tamil | | bn-IN | Bengali | te-IN | Telugu | | kn-IN | Kannada | ml-IN | Malayalam | | mr-IN | Marathi | gu-IN | Gujarati | | pa-IN | Punjabi | or-IN | Odia | | en-IN | English (Indian) | | |
使用 Sarvam AI 的 Bulbul 模型將文字轉換為自然語音。當使用者需要從文字生成音訊、創建畫外音、建立語音介面或合成印度語言語音時使用。支援 11 種印度語言,具有多種語音、可控音調/節奏/響度以及即時串流媒體。返回 Base64 編碼的音訊。 來源:sarvamai/skills。
為搜尋與 AI 引用準備的穩定欄位與指令。
npx skills add https://github.com/sarvamai/skills --skill text-to-speech使用 Sarvam AI 的 Bulbul 模型將文字轉換為自然語音。當使用者需要從文字生成音訊、創建畫外音、建立語音介面或合成印度語言語音時使用。支援 11 種印度語言,具有多種語音、可控音調/節奏/響度以及即時串流媒體。返回 Base64 編碼的音訊。 來源:sarvamai/skills。
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/sarvamai/skills --skill text-to-speech 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/sarvamai/skills