·pdf-text-extractor
#

pdf-text-extractor

willoscar/research-units-pipeline-skills

PDF (利用可能な場合) をダウンロードし、プレーン テキストを抽出してフルテキスト証拠をサポートし、`papers/fulltext_index.jsonl` および `papers/fulltext/*.txt` を書き込みます。 **トリガー**: PDF ダウンロード、全文、テキスト抽出、論文/PDF、全文抽出、ダウンロード PDF。 **次の場合に使用します**: `queries.md` が `evidence_mode: fulltext` (または明白に全文证文が必要) を設定し、紙のメモ/クレームでより多くの証拠を提供することを希望する場合。 **次の場合はスキップしてください**: `evidence_mode: abstract`(許可); または、ダウンロード/抽出(本/制限/時間)を実行することを望まないでください。 **ネットワーク**: フルテキストのダウンロードには通常、ネットワークが必要です (手作業で提供されている `papers/pdfs/` を除く)。 **Guardrail**: `papers/pdfs/` にダウンロードされています; 默褥不覆盖既に抽出されたテキスト本 (非显式要求重抽出) が存在します。

29インストール·0トレンド·@willoscar

インストール

$npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor

SKILL.md

Optionally collect full-text snippets to deepen evidence beyond abstracts.

This skill is intentionally conservative: in many survey runs, abstract/snippet mode is enough and avoids heavy downloads.

When you cannot/should not download PDFs (restricted network, rate limits, no permission), provide PDFs manually and run in “local PDFs only” mode.

PDF (利用可能な場合) をダウンロードし、プレーン テキストを抽出してフルテキスト証拠をサポートし、`papers/fulltext_index.jsonl` および `papers/fulltext/*.txt` を書き込みます。 **トリガー**: PDF ダウンロード、全文、テキスト抽出、論文/PDF、全文抽出、ダウンロード PDF。 **次の場合に使用します**: `queries.md` が `evidence_mode: fulltext` (または明白に全文证文が必要) を設定し、紙のメモ/クレームでより多くの証拠を提供することを希望する場合。 **次の場合はスキップしてください**: `evidence_mode: abstract`(許可); または、ダウンロード/抽出(本/制限/時間)を実行することを望まないでください。 **ネットワーク**: フルテキストのダウンロードには通常、ネットワークが必要です (手作業で提供されている `papers/pdfs/` を除く)。 **Guardrail**: `papers/pdfs/` にダウンロードされています; 默褥不覆盖既に抽出されたテキスト本 (非显式要求重抽出) が存在します。 ソース: willoscar/research-units-pipeline-skills。

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor
カテゴリ
#ドキュメント
認証済み
初回登録
2026-02-01
更新日
2026-02-18

クイックアンサー

pdf-text-extractor とは?

PDF (利用可能な場合) をダウンロードし、プレーン テキストを抽出してフルテキスト証拠をサポートし、`papers/fulltext_index.jsonl` および `papers/fulltext/*.txt` を書き込みます。 **トリガー**: PDF ダウンロード、全文、テキスト抽出、論文/PDF、全文抽出、ダウンロード PDF。 **次の場合に使用します**: `queries.md` が `evidence_mode: fulltext` (または明白に全文证文が必要) を設定し、紙のメモ/クレームでより多くの証拠を提供することを希望する場合。 **次の場合はスキップしてください**: `evidence_mode: abstract`(許可); または、ダウンロード/抽出(本/制限/時間)を実行することを望まないでください。 **ネットワーク**: フルテキストのダウンロードには通常、ネットワークが必要です (手作業で提供されている `papers/pdfs/` を除く)。 **Guardrail**: `papers/pdfs/` にダウンロードされています; 默褥不覆盖既に抽出されたテキスト本 (非显式要求重抽出) が存在します。 ソース: willoscar/research-units-pipeline-skills。

pdf-text-extractor のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/willoscar/research-units-pipeline-skills