·sentencepiece

</>

sentencepiece

✓

orchestra-research/ai-research-skills

独立于语言的分词器将文本视为原始 Unicode。支持 BPE 和 Unigram 算法。快速（50k 句子/秒）、轻量级（6MB 内存）、确定性词汇。由 T5、ALBERT、XLNet、mBART 使用。在没有预标记化的情况下训练原始文本。当您需要多语言支持、CJK 语言或可重现的标记化时使用。

orchestra-research·sentencepiece

14安装·0热度·@orchestra-research

安装

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill sentencepiece

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-11

相关 Skills

ml-paper-writing

serving-llms-vllm