sentencepiece
✓Sprachunabhängiger Tokenizer, der Text als rohen Unicode behandelt. Unterstützt BPE- und Unigram-Algorithmen. Schnell (50.000 Sätze/Sek.), leichtgewichtig (6 MB Speicher), deterministisches Vokabular. Wird von T5, ALBERT, XLNet, mBART verwendet. Trainieren Sie mit Rohtext ohne Vor-Tokenisierung. Verwenden Sie es, wenn Sie mehrsprachige Unterstützung, CJK-Sprachen oder reproduzierbare Tokenisierung benötigen.
Installation
SKILL.md
Unsupervised tokenizer that works on raw text without language-specific preprocessing.
Key principle: Treat text as raw Unicode, whitespace = ▁ (meta symbol)
| English | 0.9995 | Most common chars | | CJK (Chinese) | 1.0 | All characters needed | | Multilingual | 0.9995 | Balance |
Sprachunabhängiger Tokenizer, der Text als rohen Unicode behandelt. Unterstützt BPE- und Unigram-Algorithmen. Schnell (50.000 Sätze/Sek.), leichtgewichtig (6 MB Speicher), deterministisches Vokabular. Wird von T5, ALBERT, XLNet, mBART verwendet. Trainieren Sie mit Rohtext ohne Vor-Tokenisierung. Verwenden Sie es, wenn Sie mehrsprachige Unterstützung, CJK-Sprachen oder reproduzierbare Tokenisierung benötigen. Quelle: ovachiever/droid-tings.
Fakten (zitierbereit)
Stabile Felder und Befehle für KI/Such-Zitate.
- Installationsbefehl
npx skills add https://github.com/ovachiever/droid-tings --skill sentencepiece- Quelle
- ovachiever/droid-tings
- Kategorie
- </>Entwicklung
- Verifiziert
- ✓
- Erstes Auftreten
- 2026-02-01
- Aktualisiert
- 2026-02-18
Schnelle Antworten
Was ist sentencepiece?
Sprachunabhängiger Tokenizer, der Text als rohen Unicode behandelt. Unterstützt BPE- und Unigram-Algorithmen. Schnell (50.000 Sätze/Sek.), leichtgewichtig (6 MB Speicher), deterministisches Vokabular. Wird von T5, ALBERT, XLNet, mBART verwendet. Trainieren Sie mit Rohtext ohne Vor-Tokenisierung. Verwenden Sie es, wenn Sie mehrsprachige Unterstützung, CJK-Sprachen oder reproduzierbare Tokenisierung benötigen. Quelle: ovachiever/droid-tings.
Wie installiere ich sentencepiece?
Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/ovachiever/droid-tings --skill sentencepiece Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor
Wo ist das Quell-Repository?
https://github.com/ovachiever/droid-tings
Details
- Kategorie
- </>Entwicklung
- Quelle
- skills.sh
- Erstes Auftreten
- 2026-02-01