什么是 text-to-speech?
使用 Sarvam AI 的 Bulbul 模型将文本转换为自然语音。当用户需要从文本生成音频、创建画外音、构建语音界面或合成印度语言语音时使用。支持 11 种印度语言,具有多种语音、可控音调/节奏/响度以及实时流媒体。返回 Base64 编码的音频。 来源:sarvamai/skills。
使用 Sarvam AI 的 Bulbul 模型将文本转换为自然语音。当用户需要从文本生成音频、创建画外音、构建语音界面或合成印度语言语音时使用。支持 11 种印度语言,具有多种语音、可控音调/节奏/响度以及实时流媒体。返回 Base64 编码的音频。
通过命令行快速安装 text-to-speech AI 技能到你的开发环境
来源:sarvamai/skills。
Bulbul is Sarvam AI's text-to-speech model that generates natural-sounding speech in Indian languages with support for voice customization and streaming.
The API returns audio as base64-encoded strings in the audios array:
| hi-IN | Hindi | ta-IN | Tamil | | bn-IN | Bengali | te-IN | Telugu | | kn-IN | Kannada | ml-IN | Malayalam | | mr-IN | Marathi | gu-IN | Gujarati | | pa-IN | Punjabi | or-IN | Odia | | en-IN | English (Indian) | | |
使用 Sarvam AI 的 Bulbul 模型将文本转换为自然语音。当用户需要从文本生成音频、创建画外音、构建语音界面或合成印度语言语音时使用。支持 11 种印度语言,具有多种语音、可控音调/节奏/响度以及实时流媒体。返回 Base64 编码的音频。 来源:sarvamai/skills。
为搜索与 AI 引用准备的稳定字段与命令。
npx skills add https://github.com/sarvamai/skills --skill text-to-speech使用 Sarvam AI 的 Bulbul 模型将文本转换为自然语音。当用户需要从文本生成音频、创建画外音、构建语音界面或合成印度语言语音时使用。支持 11 种印度语言,具有多种语音、可控音调/节奏/响度以及实时流媒体。返回 Base64 编码的音频。 来源:sarvamai/skills。
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/sarvamai/skills --skill text-to-speech 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/sarvamai/skills