Generate natural-sounding speech from text using Gemini's TTS models through executable scripts with support for multiple voices and multi-speaker conversations.
scripts/tts.py Purpose: Convert text to speech using Gemini TTS models
| text | Text to convert (required) | "Hello, world!" | | --voice, -v | Voice name | Kore | | --output, -o | Base name for output file | welcome | | --output-dir | Output directory for audio | audio/ | | --no-timestamp | Disable auto timestamp | Flag | | --model, -m | TTS model | gemini-2.5-flash-preview-tts | | --stream, -s | Enable streaming | Flag |
Genera parlato dal testo utilizzando i modelli TTS di Google Gemini tramite script/. Utilizzare per la sintesi vocale, la generazione audio, la sintesi vocale, le conversazioni con più altoparlanti e la creazione di contenuti audio. Supporta più voci e streaming. Si attiva "sintesi vocale", "TTS", "genera audio", "sintesi vocale", "pronuncia questo testo". Fonte: akrindev/google-studio-skills.