video-understand
✓Videoverständnis und -transkription mit intelligentem Multi-Provider-Fallback. Wird verwendet, wenn: (1) Video- oder Audioinhalte transkribiert werden, (2) Videoinhalte einschließlich visueller Elemente und Szenen verstanden werden, (3) YouTube-Videos anhand der URL analysiert werden, (4) Informationen aus lokalen Videodateien extrahiert werden, (5) Zeitstempel und Zusammenfassungen abgerufen oder Fragen zu Videoinhalten beantwortet werden. Wählt automatisch den besten verfügbaren Anbieter basierend auf konfigurierten API-Schlüsseln aus – bevorzugt vollständiges Videoverständnis (Gemini/OpenRouter) gegenüber reinen ASR-Anbietern. Unterstützt die Modellauswahl pro Anbieter.
Installation
SKILL.md
Multi-provider video understanding with automatic fallback and model selection.
| Priority | Provider | Capability | Env Var | Default Model |
| 1 | Gemini | Full video | GEMINIAPIKEY | gemini-3-flash-preview | | 2 | Vertex AI | Full video | GOOGLEAPPLICATIONCREDENTIALS | gemini-3-flash-preview | | 3 | OpenRouter | Full video | OPENROUTERAPIKEY | google/gemini-3-flash-preview | | 4 | OpenAI | ASR only | OPENAIAPIKEY | whisper-1 | | 5 | AssemblyAI | ASR + analysis | ASSEMBLYAIAPIKEY | best |
Videoverständnis und -transkription mit intelligentem Multi-Provider-Fallback. Wird verwendet, wenn: (1) Video- oder Audioinhalte transkribiert werden, (2) Videoinhalte einschließlich visueller Elemente und Szenen verstanden werden, (3) YouTube-Videos anhand der URL analysiert werden, (4) Informationen aus lokalen Videodateien extrahiert werden, (5) Zeitstempel und Zusammenfassungen abgerufen oder Fragen zu Videoinhalten beantwortet werden. Wählt automatisch den besten verfügbaren Anbieter basierend auf konfigurierten API-Schlüsseln aus – bevorzugt vollständiges Videoverständnis (Gemini/OpenRouter) gegenüber reinen ASR-Anbietern. Unterstützt die Modellauswahl pro Anbieter. Quelle: jrusso1020/video-understand-skills.
Fakten (zitierbereit)
Stabile Felder und Befehle für KI/Such-Zitate.
- Installationsbefehl
npx skills add https://github.com/jrusso1020/video-understand-skills --skill video-understand- Kategorie
- *Kreativität
- Verifiziert
- ✓
- Erstes Auftreten
- 2026-02-05
- Aktualisiert
- 2026-02-18
Schnelle Antworten
Was ist video-understand?
Videoverständnis und -transkription mit intelligentem Multi-Provider-Fallback. Wird verwendet, wenn: (1) Video- oder Audioinhalte transkribiert werden, (2) Videoinhalte einschließlich visueller Elemente und Szenen verstanden werden, (3) YouTube-Videos anhand der URL analysiert werden, (4) Informationen aus lokalen Videodateien extrahiert werden, (5) Zeitstempel und Zusammenfassungen abgerufen oder Fragen zu Videoinhalten beantwortet werden. Wählt automatisch den besten verfügbaren Anbieter basierend auf konfigurierten API-Schlüsseln aus – bevorzugt vollständiges Videoverständnis (Gemini/OpenRouter) gegenüber reinen ASR-Anbietern. Unterstützt die Modellauswahl pro Anbieter. Quelle: jrusso1020/video-understand-skills.
Wie installiere ich video-understand?
Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/jrusso1020/video-understand-skills --skill video-understand Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor
Wo ist das Quell-Repository?
https://github.com/jrusso1020/video-understand-skills
Details
- Kategorie
- *Kreativität
- Quelle
- skills.sh
- Erstes Auftreten
- 2026-02-05