什么是 document-to-narration?
将书面文档转换为带有 TTS 音频和字级计时的叙述视频脚本。在准备论文、博客文章或视频旁白文章时使用。输出带有精确单词时间戳的场景文件、音频和 VTT。关键词:旁白、画外音、TTS、场景、音频、计时、视频脚本、口语。 来源:jwynia/agent-skills。
将书面文档转换为带有 TTS 音频和字级计时的叙述视频脚本。在准备论文、博客文章或视频旁白文章时使用。输出带有精确单词时间戳的场景文件、音频和 VTT。关键词:旁白、画外音、TTS、场景、音频、计时、视频脚本、口语。
通过命令行快速安装 document-to-narration AI 技能到你的开发环境
来源:jwynia/agent-skills。
Convert written documents into narrated video scripts with precise word-level timing.
The agent interprets; the document guides. Rather than rigid template-based splits, this skill uses agent judgment to find where the content naturally breathes, argues, and transitions. The document's argument flow determines scene breaks, not a predetermined structure.
There are two approaches: per-scene (legacy) and full narration (recommended).
将书面文档转换为带有 TTS 音频和字级计时的叙述视频脚本。在准备论文、博客文章或视频旁白文章时使用。输出带有精确单词时间戳的场景文件、音频和 VTT。关键词:旁白、画外音、TTS、场景、音频、计时、视频脚本、口语。 来源:jwynia/agent-skills。
为搜索与 AI 引用准备的稳定字段与命令。
npx skills add https://github.com/jwynia/agent-skills --skill document-to-narration将书面文档转换为带有 TTS 音频和字级计时的叙述视频脚本。在准备论文、博客文章或视频旁白文章时使用。输出带有精确单词时间戳的场景文件、音频和 VTT。关键词:旁白、画外音、TTS、场景、音频、计时、视频脚本、口语。 来源:jwynia/agent-skills。
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/jwynia/agent-skills --skill document-to-narration 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/jwynia/agent-skills