·pdf-text-extractor
#

pdf-text-extractor

willoscar/research-units-pipeline-skills

Téléchargez les PDF (si disponibles) et extrayez le texte brut pour prendre en charge les preuves en texte intégral, en écrivant « papers/fulltext_index.jsonl » et « papers/fulltext/*.txt ». **Déclencheur** : téléchargement PDF, texte intégral, extrait de texte, articles/pdfs, 全文抽取, 下载PDF. **À utiliser lorsque** : `queries.md` pour `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notes/réclamations papier ou preuves。 **Passer si** : `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Réseau** : texte intégral 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Garde-corps** : 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。

29Installations·0Tendance·@willoscar

Installation

$npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor

SKILL.md

Optionally collect full-text snippets to deepen evidence beyond abstracts.

This skill is intentionally conservative: in many survey runs, abstract/snippet mode is enough and avoids heavy downloads.

When you cannot/should not download PDFs (restricted network, rate limits, no permission), provide PDFs manually and run in “local PDFs only” mode.

Téléchargez les PDF (si disponibles) et extrayez le texte brut pour prendre en charge les preuves en texte intégral, en écrivant « papers/fulltext_index.jsonl » et « papers/fulltext/*.txt ». **Déclencheur** : téléchargement PDF, texte intégral, extrait de texte, articles/pdfs, 全文抽取, 下载PDF. **À utiliser lorsque** : `queries.md` pour `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notes/réclamations papier ou preuves。 **Passer si** : `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Réseau** : texte intégral 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Garde-corps** : 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。 Source : willoscar/research-units-pipeline-skills.

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor
Catégorie
#Documents
Vérifié
Première apparition
2026-02-01
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que pdf-text-extractor ?

Téléchargez les PDF (si disponibles) et extrayez le texte brut pour prendre en charge les preuves en texte intégral, en écrivant « papers/fulltext_index.jsonl » et « papers/fulltext/*.txt ». **Déclencheur** : téléchargement PDF, texte intégral, extrait de texte, articles/pdfs, 全文抽取, 下载PDF. **À utiliser lorsque** : `queries.md` pour `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notes/réclamations papier ou preuves。 **Passer si** : `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Réseau** : texte intégral 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Garde-corps** : 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。 Source : willoscar/research-units-pipeline-skills.

Comment installer pdf-text-extractor ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/willoscar/research-units-pipeline-skills