pdf-text-extractor
✓Descargue archivos PDF (cuando estén disponibles) y extraiga texto sin formato para respaldar la evidencia de texto completo, escribiendo `papers/fulltext_index.jsonl` y `papers/fulltext/*.txt`. **Activador**: descarga de PDF, texto completo, extracto de texto, artículos/pdf, 全文抽取, 下载PDF. **Usar cuando**: `queries.md` 设置 `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notas/reclamaciones en papel 提供更强 evidencia。 **Omitir si**: `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Red**: texto completo 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Guardrail**: 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。
SKILL.md
Optionally collect full-text snippets to deepen evidence beyond abstracts.
This skill is intentionally conservative: in many survey runs, abstract/snippet mode is enough and avoids heavy downloads.
When you cannot/should not download PDFs (restricted network, rate limits, no permission), provide PDFs manually and run in “local PDFs only” mode.
Descargue archivos PDF (cuando estén disponibles) y extraiga texto sin formato para respaldar la evidencia de texto completo, escribiendo `papers/fulltext_index.jsonl` y `papers/fulltext/*.txt`. **Activador**: descarga de PDF, texto completo, extracto de texto, artículos/pdf, 全文抽取, 下载PDF. **Usar cuando**: `queries.md` 设置 `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notas/reclamaciones en papel 提供更强 evidencia。 **Omitir si**: `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Red**: texto completo 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Guardrail**: 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。 Fuente: willoscar/research-units-pipeline-skills.
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor- Categoría
- #Documentos
- Verificado
- ✓
- Primera vez visto
- 2026-02-01
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es pdf-text-extractor?
Descargue archivos PDF (cuando estén disponibles) y extraiga texto sin formato para respaldar la evidencia de texto completo, escribiendo `papers/fulltext_index.jsonl` y `papers/fulltext/*.txt`. **Activador**: descarga de PDF, texto completo, extracto de texto, artículos/pdf, 全文抽取, 下载PDF. **Usar cuando**: `queries.md` 设置 `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notas/reclamaciones en papel 提供更强 evidencia。 **Omitir si**: `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Red**: texto completo 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Guardrail**: 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。 Fuente: willoscar/research-units-pipeline-skills.
¿Cómo instalo pdf-text-extractor?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/willoscar/research-units-pipeline-skills
Detalles
- Categoría
- #Documentos
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-01