·huggingface-tokenizers
</>

huggingface-tokenizers

orchestra-research/ai-research-skills

Schnelle Tokenizer, optimiert für Forschung und Produktion. Rust-basierte Implementierung tokenisiert 1 GB in <20 Sekunden. Unterstützt BPE-, WordPiece- und Unigram-Algorithmen. Trainieren Sie benutzerdefinierte Vokabeln, verfolgen Sie Ausrichtungen und behandeln Sie Auffüllungen/Kürzungen. Lässt sich nahtlos in Transformatoren integrieren. Verwenden Sie es, wenn Sie eine leistungsstarke Tokenisierung oder ein benutzerdefiniertes Tokenizer-Training benötigen.

16Installationen·1Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill huggingface-tokenizers

SKILL.md

Fast, production-ready tokenizers with Rust performance and Python ease-of-use.

Training time: 1-2 minutes for 100MB corpus, 10-20 minutes for 1GB

Complete pipeline: Normalization → Pre-tokenization → Model → Post-processing

Schnelle Tokenizer, optimiert für Forschung und Produktion. Rust-basierte Implementierung tokenisiert 1 GB in <20 Sekunden. Unterstützt BPE-, WordPiece- und Unigram-Algorithmen. Trainieren Sie benutzerdefinierte Vokabeln, verfolgen Sie Ausrichtungen und behandeln Sie Auffüllungen/Kürzungen. Lässt sich nahtlos in Transformatoren integrieren. Verwenden Sie es, wenn Sie eine leistungsstarke Tokenisierung oder ein benutzerdefiniertes Tokenizer-Training benötigen. Quelle: orchestra-research/ai-research-skills.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/orchestra-research/ai-research-skills --skill huggingface-tokenizers
Kategorie
</>Entwicklung
Verifiziert
Erstes Auftreten
2026-02-11
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist huggingface-tokenizers?

Schnelle Tokenizer, optimiert für Forschung und Produktion. Rust-basierte Implementierung tokenisiert 1 GB in <20 Sekunden. Unterstützt BPE-, WordPiece- und Unigram-Algorithmen. Trainieren Sie benutzerdefinierte Vokabeln, verfolgen Sie Ausrichtungen und behandeln Sie Auffüllungen/Kürzungen. Lässt sich nahtlos in Transformatoren integrieren. Verwenden Sie es, wenn Sie eine leistungsstarke Tokenisierung oder ein benutzerdefiniertes Tokenizer-Training benötigen. Quelle: orchestra-research/ai-research-skills.

Wie installiere ich huggingface-tokenizers?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/orchestra-research/ai-research-skills --skill huggingface-tokenizers Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/orchestra-research/ai-research-skills