sentencepiece

Name: sentencepiece
Author: orchestra-research

✓

言語に依存しないトークナイザーは、テキストを生の Unicode として処理します。 BPE および Unigram アルゴリズムをサポートします。高速 (50,000 文/秒)、軽量 (6MB メモリ)、決定的な語彙。 T5、ALBERT、XLNet、mBART によって使用されます。事前トークン化を行わずに生のテキストでトレーニングします。多言語サポート、CJK 言語、または再現可能なトークン化が必要な場合に使用します。

orchestra-research·sentencepiece

14インストール·0トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill sentencepiece

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

sentencepiece

インストール

SKILL.md

引用可能な情報

クイックアンサー

sentencepiece とは？

sentencepiece のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills