·pdf-text-extractor

pdf-text-extractor

Name: pdf-text-extractor
Author: willoscar

✓

willoscar/research-units-pipeline-skills

Scarica i PDF (se disponibili) ed estrai testo semplice per supportare prove a testo completo, scrivendo "papers/fulltext_index.jsonl" e "papers/fulltext/*.txt". **Trigger**: download PDF, testo completo, estrazione testo, documenti/pdf, estrazione testo completo, download PDF. **Utilizzare quando**: `queries.md` imposta `evidence_mode: fulltext` (o hai esplicitamente bisogno di prove full-text) e vuoi fornire prove più forti per note/dichiarazioni cartacee. **Salta se**: `evidence_mode: abstract` (predefinito); oppure non vuoi effettuare download/estrazione (costi/autorizzazioni/tempi). **Rete**: il download del testo completo di solito richiede la rete (a meno che non si fornisca manualmente la cache PDF in `papers/pdfs/`). **Guardrail**: cache dei download in `papers/pdfs/`; per impostazione predefinita non sovrascrive il testo estratto esistente (a meno che non venga esplicitamente richiesto di riestrarlo).

willoscar·pdf·text·extractor

53Installazioni·4Tendenza·@willoscar