·pdf-text-extractor
#

pdf-text-extractor

Scarica i PDF (se disponibili) ed estrai testo semplice per supportare prove a testo completo, scrivendo "papers/fulltext_index.jsonl" e "papers/fulltext/*.txt". **Trigger**: download PDF, testo completo, estrazione testo, documenti/pdf, estrazione testo completo, download PDF. **Utilizzare quando**: `queries.md` imposta `evidence_mode: fulltext` (o hai esplicitamente bisogno di prove full-text) e vuoi fornire prove più forti per note/dichiarazioni cartacee. **Salta se**: `evidence_mode: abstract` (predefinito); oppure non vuoi effettuare download/estrazione (costi/autorizzazioni/tempi). **Rete**: il download del testo completo di solito richiede la rete (a meno che non si fornisca manualmente la cache PDF in `papers/pdfs/`). **Guardrail**: cache dei download in `papers/pdfs/`; per impostazione predefinita non sovrascrive il testo estratto esistente (a meno che non venga esplicitamente richiesto di riestrarlo).

53Installazioni·4Tendenza·@willoscar

Installazione

$npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor

Come installare pdf-text-extractor

Installa rapidamente la skill AI pdf-text-extractor nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: willoscar/research-units-pipeline-skills.

Optionally collect full-text snippets to deepen evidence beyond abstracts.

This skill is intentionally conservative: in many survey runs, abstract/snippet mode is enough and avoids heavy downloads.

When you cannot/should not download PDFs (restricted network, rate limits, no permission), provide PDFs manually and run in “local PDFs only” mode.

Scarica i PDF (se disponibili) ed estrai testo semplice per supportare prove a testo completo, scrivendo "papers/fulltext_index.jsonl" e "papers/fulltext/*.txt". **Trigger**: download PDF, testo completo, estrazione testo, documenti/pdf, estrazione testo completo, download PDF. **Utilizzare quando**: `queries.md` imposta `evidence_mode: fulltext` (o hai esplicitamente bisogno di prove full-text) e vuoi fornire prove più forti per note/dichiarazioni cartacee. **Salta se**: `evidence_mode: abstract` (predefinito); oppure non vuoi effettuare download/estrazione (costi/autorizzazioni/tempi). **Rete**: il download del testo completo di solito richiede la rete (a meno che non si fornisca manualmente la cache PDF in `papers/pdfs/`). **Guardrail**: cache dei download in `papers/pdfs/`; per impostazione predefinita non sovrascrive il testo estratto esistente (a meno che non venga esplicitamente richiesto di riestrarlo). Fonte: willoscar/research-units-pipeline-skills.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor
Categoria
#Documenti
Verificato
Prima apparizione
2026-02-01
Aggiornato
2026-03-10

Browse more skills from willoscar/research-units-pipeline-skills

Risposte rapide

Che cos'è pdf-text-extractor?

Scarica i PDF (se disponibili) ed estrai testo semplice per supportare prove a testo completo, scrivendo "papers/fulltext_index.jsonl" e "papers/fulltext/*.txt". **Trigger**: download PDF, testo completo, estrazione testo, documenti/pdf, estrazione testo completo, download PDF. **Utilizzare quando**: `queries.md` imposta `evidence_mode: fulltext` (o hai esplicitamente bisogno di prove full-text) e vuoi fornire prove più forti per note/dichiarazioni cartacee. **Salta se**: `evidence_mode: abstract` (predefinito); oppure non vuoi effettuare download/estrazione (costi/autorizzazioni/tempi). **Rete**: il download del testo completo di solito richiede la rete (a meno che non si fornisca manualmente la cache PDF in `papers/pdfs/`). **Guardrail**: cache dei download in `papers/pdfs/`; per impostazione predefinita non sovrascrive il testo estratto esistente (a meno che non venga esplicitamente richiesto di riestrarlo). Fonte: willoscar/research-units-pipeline-skills.

Come installo pdf-text-extractor?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/willoscar/research-units-pipeline-skills