·video-understand
*

video-understand

jrusso1020/video-understand-skills

Videoverständnis und -transkription mit intelligentem Multi-Provider-Fallback. Wird verwendet, wenn: (1) Video- oder Audioinhalte transkribiert werden, (2) Videoinhalte einschließlich visueller Elemente und Szenen verstanden werden, (3) YouTube-Videos anhand der URL analysiert werden, (4) Informationen aus lokalen Videodateien extrahiert werden, (5) Zeitstempel und Zusammenfassungen abgerufen oder Fragen zu Videoinhalten beantwortet werden. Wählt automatisch den besten verfügbaren Anbieter basierend auf konfigurierten API-Schlüsseln aus – bevorzugt vollständiges Videoverständnis (Gemini/OpenRouter) gegenüber reinen ASR-Anbietern. Unterstützt die Modellauswahl pro Anbieter.

11Installationen·0Trend·@jrusso1020

Installation

$npx skills add https://github.com/jrusso1020/video-understand-skills --skill video-understand

SKILL.md

Multi-provider video understanding with automatic fallback and model selection.

| Priority | Provider | Capability | Env Var | Default Model |

| 1 | Gemini | Full video | GEMINIAPIKEY | gemini-3-flash-preview | | 2 | Vertex AI | Full video | GOOGLEAPPLICATIONCREDENTIALS | gemini-3-flash-preview | | 3 | OpenRouter | Full video | OPENROUTERAPIKEY | google/gemini-3-flash-preview | | 4 | OpenAI | ASR only | OPENAIAPIKEY | whisper-1 | | 5 | AssemblyAI | ASR + analysis | ASSEMBLYAIAPIKEY | best |

Videoverständnis und -transkription mit intelligentem Multi-Provider-Fallback. Wird verwendet, wenn: (1) Video- oder Audioinhalte transkribiert werden, (2) Videoinhalte einschließlich visueller Elemente und Szenen verstanden werden, (3) YouTube-Videos anhand der URL analysiert werden, (4) Informationen aus lokalen Videodateien extrahiert werden, (5) Zeitstempel und Zusammenfassungen abgerufen oder Fragen zu Videoinhalten beantwortet werden. Wählt automatisch den besten verfügbaren Anbieter basierend auf konfigurierten API-Schlüsseln aus – bevorzugt vollständiges Videoverständnis (Gemini/OpenRouter) gegenüber reinen ASR-Anbietern. Unterstützt die Modellauswahl pro Anbieter. Quelle: jrusso1020/video-understand-skills.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/jrusso1020/video-understand-skills --skill video-understand
Kategorie
*Kreativität
Verifiziert
Erstes Auftreten
2026-02-05
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist video-understand?

Videoverständnis und -transkription mit intelligentem Multi-Provider-Fallback. Wird verwendet, wenn: (1) Video- oder Audioinhalte transkribiert werden, (2) Videoinhalte einschließlich visueller Elemente und Szenen verstanden werden, (3) YouTube-Videos anhand der URL analysiert werden, (4) Informationen aus lokalen Videodateien extrahiert werden, (5) Zeitstempel und Zusammenfassungen abgerufen oder Fragen zu Videoinhalten beantwortet werden. Wählt automatisch den besten verfügbaren Anbieter basierend auf konfigurierten API-Schlüsseln aus – bevorzugt vollständiges Videoverständnis (Gemini/OpenRouter) gegenüber reinen ASR-Anbietern. Unterstützt die Modellauswahl pro Anbieter. Quelle: jrusso1020/video-understand-skills.

Wie installiere ich video-understand?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/jrusso1020/video-understand-skills --skill video-understand Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/jrusso1020/video-understand-skills

Details

Kategorie
*Kreativität
Quelle
skills.sh
Erstes Auftreten
2026-02-05

Verwandte Skills

Keine