·pdf-text-extractor
#

pdf-text-extractor

willoscar/research-units-pipeline-skills

Descargue archivos PDF (cuando estén disponibles) y extraiga texto sin formato para respaldar la evidencia de texto completo, escribiendo `papers/fulltext_index.jsonl` y `papers/fulltext/*.txt`. **Activador**: descarga de PDF, texto completo, extracto de texto, artículos/pdf, 全文抽取, 下载PDF. **Usar cuando**: `queries.md` 设置 `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notas/reclamaciones en papel 提供更强 evidencia。 **Omitir si**: `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Red**: texto completo 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Guardrail**: 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。

29Instalaciones·0Tendencia·@willoscar

Instalación

$npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor

SKILL.md

Optionally collect full-text snippets to deepen evidence beyond abstracts.

This skill is intentionally conservative: in many survey runs, abstract/snippet mode is enough and avoids heavy downloads.

When you cannot/should not download PDFs (restricted network, rate limits, no permission), provide PDFs manually and run in “local PDFs only” mode.

Descargue archivos PDF (cuando estén disponibles) y extraiga texto sin formato para respaldar la evidencia de texto completo, escribiendo `papers/fulltext_index.jsonl` y `papers/fulltext/*.txt`. **Activador**: descarga de PDF, texto completo, extracto de texto, artículos/pdf, 全文抽取, 下载PDF. **Usar cuando**: `queries.md` 设置 `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notas/reclamaciones en papel 提供更强 evidencia。 **Omitir si**: `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Red**: texto completo 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Guardrail**: 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。 Fuente: willoscar/research-units-pipeline-skills.

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor
Categoría
#Documentos
Verificado
Primera vez visto
2026-02-01
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es pdf-text-extractor?

Descargue archivos PDF (cuando estén disponibles) y extraiga texto sin formato para respaldar la evidencia de texto completo, escribiendo `papers/fulltext_index.jsonl` y `papers/fulltext/*.txt`. **Activador**: descarga de PDF, texto completo, extracto de texto, artículos/pdf, 全文抽取, 下载PDF. **Usar cuando**: `queries.md` 设置 `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notas/reclamaciones en papel 提供更强 evidencia。 **Omitir si**: `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Red**: texto completo 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Guardrail**: 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。 Fuente: willoscar/research-units-pipeline-skills.

¿Cómo instalo pdf-text-extractor?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/willoscar/research-units-pipeline-skills