·huggingface-tokenizers

</>

huggingface-tokenizers

✓

orchestra-research/ai-research-skills

針對研究和生產進行最佳化的快速分詞器。基於 Rust 的實作在 20 秒內標記 1GB。支援 BPE、WordPiece 和 Unigram 演算法。訓練自訂詞彙、追蹤對齊、處理填充/截斷。與變壓器無縫整合。當您需要高性能分詞器或自訂分詞器訓練時使用。

orchestra-research·huggingface·tokenizers

15安裝·0熱度·@orchestra-research

安裝

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill huggingface-tokenizers

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-11

相關 Skills

ml-paper-writing

serving-llms-vllm