sentencepiece

Name: sentencepiece
Author: orchestra-research

✓

獨立於語言的分詞器將文字視為原始 Unicode。支援 BPE 和 Unigram 演算法。快速（50k 句子/秒）、輕量級（6MB 記憶體）、確定性詞彙。由 T5、ALBERT、XLNet、mBART 使用。在沒有預標記化的情況下訓練原始文字。當您需要多語言支援、CJK 語言或可重現的標記化時使用。

orchestra-research·sentencepiece

15安裝·1熱度·@orchestra-research

安裝

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill sentencepiece

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-11

sentencepiece

安裝

SKILL.md

可引用資訊

快速解答

什麼是 sentencepiece？

如何安裝 sentencepiece？

這個 Skill 的原始碼在哪？

詳情

相關 Skills