·pdf-text-extractor

pdf-text-extractor

Name: pdf-text-extractor
Author: willoscar

✓

willoscar/research-units-pipeline-skills

Descargue archivos PDF (cuando estén disponibles) y extraiga texto sin formato para respaldar la evidencia de texto completo, escribiendo `papers/fulltext_index.jsonl` y `papers/fulltext/*.txt`. **Activador**: descarga de PDF, texto completo, extracto de texto, artículos/pdf, 全文抽取, 下载PDF. **Usar cuando**: `queries.md` 设置 `evidence_mode: fulltext`（或你明确需要全文证据）并希望为 notas/reclamaciones en papel 提供更强 evidencia。 **Omitir si**: `evidence_mode: abstract`（默认）；或你不希望进行下载/抽取（成本/权限/时间）。 **Red**: texto completo 下载通常需要网络（除非你手工提供 PDF 缓存在 `papers/pdfs/`）。 **Guardrail**: 缓存下载到 `papers/pdfs/`；默认不覆盖已有抽取文本（除非显式要求重抽）。

willoscar·pdf·text·extractor

29Instalaciones·0Tendencia·@willoscar