·huggingface-tokenizers
</>

huggingface-tokenizers

ovachiever/droid-tings

研究および生産用に最適化された高速トークナイザー。 Rust ベースの実装では、20 秒未満で 1GB をトークン化します。 BPE、WordPiece、Unigram アルゴリズムをサポートします。カスタム語彙のトレーニング、アライメントの追跡、パディング/切り捨てのハンドル。変圧器とシームレスに統合します。高パフォーマンスのトークン化またはカスタム トークナイザー トレーニングが必要な場合に使用します。

21インストール·0トレンド·@ovachiever

インストール

$npx skills add https://github.com/ovachiever/droid-tings --skill huggingface-tokenizers

SKILL.md

Fast, production-ready tokenizers with Rust performance and Python ease-of-use.

Training time: 1-2 minutes for 100MB corpus, 10-20 minutes for 1GB

Complete pipeline: Normalization → Pre-tokenization → Model → Post-processing

研究および生産用に最適化された高速トークナイザー。 Rust ベースの実装では、20 秒未満で 1GB をトークン化します。 BPE、WordPiece、Unigram アルゴリズムをサポートします。カスタム語彙のトレーニング、アライメントの追跡、パディング/切り捨てのハンドル。変圧器とシームレスに統合します。高パフォーマンスのトークン化またはカスタム トークナイザー トレーニングが必要な場合に使用します。 ソース: ovachiever/droid-tings。

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/ovachiever/droid-tings --skill huggingface-tokenizers
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-01
更新日
2026-02-18

クイックアンサー

huggingface-tokenizers とは?

研究および生産用に最適化された高速トークナイザー。 Rust ベースの実装では、20 秒未満で 1GB をトークン化します。 BPE、WordPiece、Unigram アルゴリズムをサポートします。カスタム語彙のトレーニング、アライメントの追跡、パディング/切り捨てのハンドル。変圧器とシームレスに統合します。高パフォーマンスのトークン化またはカスタム トークナイザー トレーニングが必要な場合に使用します。 ソース: ovachiever/droid-tings。

huggingface-tokenizers のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/ovachiever/droid-tings --skill huggingface-tokenizers インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/ovachiever/droid-tings