pdf-text-extractor
✓Téléchargez les PDF (si disponibles) et extrayez le texte brut pour prendre en charge les preuves en texte intégral, en écrivant « papers/fulltext_index.jsonl » et « papers/fulltext/*.txt ». **Déclencheur** : téléchargement PDF, texte intégral, extrait de texte, articles/pdfs, 全文抽取, 下载PDF. **À utiliser lorsque** : `queries.md` pour `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notes/réclamations papier ou preuves。 **Passer si** : `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Réseau** : texte intégral 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Garde-corps** : 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。
Installation
SKILL.md
Optionally collect full-text snippets to deepen evidence beyond abstracts.
This skill is intentionally conservative: in many survey runs, abstract/snippet mode is enough and avoids heavy downloads.
When you cannot/should not download PDFs (restricted network, rate limits, no permission), provide PDFs manually and run in “local PDFs only” mode.
Téléchargez les PDF (si disponibles) et extrayez le texte brut pour prendre en charge les preuves en texte intégral, en écrivant « papers/fulltext_index.jsonl » et « papers/fulltext/*.txt ». **Déclencheur** : téléchargement PDF, texte intégral, extrait de texte, articles/pdfs, 全文抽取, 下载PDF. **À utiliser lorsque** : `queries.md` pour `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notes/réclamations papier ou preuves。 **Passer si** : `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Réseau** : texte intégral 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Garde-corps** : 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。 Source : willoscar/research-units-pipeline-skills.
Faits (prêts à citer)
Champs et commandes stables pour les citations IA/recherche.
- Commande d'installation
npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor- Catégorie
- #Documents
- Vérifié
- ✓
- Première apparition
- 2026-02-01
- Mis à jour
- 2026-02-18
Réponses rapides
Qu'est-ce que pdf-text-extractor ?
Téléchargez les PDF (si disponibles) et extrayez le texte brut pour prendre en charge les preuves en texte intégral, en écrivant « papers/fulltext_index.jsonl » et « papers/fulltext/*.txt ». **Déclencheur** : téléchargement PDF, texte intégral, extrait de texte, articles/pdfs, 全文抽取, 下载PDF. **À utiliser lorsque** : `queries.md` pour `evidence_mode: fulltext`(或你明确需要全文证据)并希望为 notes/réclamations papier ou preuves。 **Passer si** : `evidence_mode: abstract`(默认);或你不希望进行下载/抽取(成本/权限/时间)。 **Réseau** : texte intégral 下载通常需要网络(除非你手工提供 PDF 缓存在 `papers/pdfs/`)。 **Garde-corps** : 缓存下载到 `papers/pdfs/`;默认不覆盖已有抽取文本(除非显式要求重抽)。 Source : willoscar/research-units-pipeline-skills.
Comment installer pdf-text-extractor ?
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Où se trouve le dépôt source ?
https://github.com/willoscar/research-units-pipeline-skills
Détails
- Catégorie
- #Documents
- Source
- skills.sh
- Première apparition
- 2026-02-01