·pdf-text-extractor
#

pdf-text-extractor

willoscar/research-units-pipeline-skills

下載 PDF(如果有)並提取純文本以支持全文證據,編寫“papers/fulltext_index.jsonl”和“papers/fulltext/*.txt”。 **觸發**:PDF下載、全文、摘錄文本、論文/pdf、全文抽取、下載PDF。 **使用時**:`queries.md`設置`evidence_mode: fulltext`(或者你明確需要全文證據)並希望紙質筆記/聲明提供更有力的證據。 **如果**: `evidence_mode: Abstract`(默認)則跳過;或者您不希望進行下載/提取(成本/權限/時間)。 **網絡**:全文下載通常需要網絡(除非您手動在 `papers/pdfs/` 中提供 PDF 緩存)。 **Guardrail**:服務器下載到 `papers/pdfs/`;默認不覆蓋現有文本抽取(除非顯式要求重提取)。

29安裝·0熱度·@willoscar

安裝

$npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor

SKILL.md

Optionally collect full-text snippets to deepen evidence beyond abstracts.

This skill is intentionally conservative: in many survey runs, abstract/snippet mode is enough and avoids heavy downloads.

When you cannot/should not download PDFs (restricted network, rate limits, no permission), provide PDFs manually and run in “local PDFs only” mode.

下載 PDF(如果有)並提取純文本以支持全文證據,編寫“papers/fulltext_index.jsonl”和“papers/fulltext/*.txt”。 **觸發**:PDF下載、全文、摘錄文本、論文/pdf、全文抽取、下載PDF。 **使用時**:`queries.md`設置`evidence_mode: fulltext`(或者你明確需要全文證據)並希望紙質筆記/聲明提供更有力的證據。 **如果**: `evidence_mode: Abstract`(默認)則跳過;或者您不希望進行下載/提取(成本/權限/時間)。 **網絡**:全文下載通常需要網絡(除非您手動在 `papers/pdfs/` 中提供 PDF 緩存)。 **Guardrail**:服務器下載到 `papers/pdfs/`;默認不覆蓋現有文本抽取(除非顯式要求重提取)。 來源:willoscar/research-units-pipeline-skills。

查看原文

可引用資訊

為搜尋與 AI 引用準備的穩定欄位與指令。

安裝指令
npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor
分類
#文件處理
認證
收錄時間
2026-02-01
更新時間
2026-02-18

快速解答

什麼是 pdf-text-extractor?

下載 PDF(如果有)並提取純文本以支持全文證據,編寫“papers/fulltext_index.jsonl”和“papers/fulltext/*.txt”。 **觸發**:PDF下載、全文、摘錄文本、論文/pdf、全文抽取、下載PDF。 **使用時**:`queries.md`設置`evidence_mode: fulltext`(或者你明確需要全文證據)並希望紙質筆記/聲明提供更有力的證據。 **如果**: `evidence_mode: Abstract`(默認)則跳過;或者您不希望進行下載/提取(成本/權限/時間)。 **網絡**:全文下載通常需要網絡(除非您手動在 `papers/pdfs/` 中提供 PDF 緩存)。 **Guardrail**:服務器下載到 `papers/pdfs/`;默認不覆蓋現有文本抽取(除非顯式要求重提取)。 來源:willoscar/research-units-pipeline-skills。

如何安裝 pdf-text-extractor?

開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code 或 Cursor 中使用

這個 Skill 的原始碼在哪?

https://github.com/willoscar/research-units-pipeline-skills