Was ist smolvlm?
Lokales Vision-Sprachmodell für die Bildanalyse mit SmolVLM-2B Quelle: tdimino/claude-code-minoan.
Lokales Vision-Sprachmodell für die Bildanalyse mit SmolVLM-2B
Installieren Sie den KI-Skill smolvlm schnell in Ihrer Entwicklungsumgebung über die Kommandozeile
Quelle: tdimino/claude-code-minoan.
Analyze images locally using SmolVLM-2B, a state-of-the-art compact vision-language model optimized for Apple Silicon via mlx-vlm.
| Model | SmolVLM-2B-Instruct | | Size | 4GB | | Peak Memory | 5.8GB | | Speed | 94 tok/s (M-series) | | Supported Formats | PNG, JPG, JPEG, GIF, WebP |
"Model not found": First run downloads the model (4GB). Wait for completion.
Lokales Vision-Sprachmodell für die Bildanalyse mit SmolVLM-2B Quelle: tdimino/claude-code-minoan.
Stabile Felder und Befehle für KI/Such-Zitate.
npx skills add https://github.com/tdimino/claude-code-minoan --skill smolvlmLokales Vision-Sprachmodell für die Bildanalyse mit SmolVLM-2B Quelle: tdimino/claude-code-minoan.
Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/tdimino/claude-code-minoan --skill smolvlm Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code, Cursor oder OpenClaw
https://github.com/tdimino/claude-code-minoan