·extracting-pdf-text
#

extracting-pdf-text

Extrayez le texte des PDF pour la consommation LLM. À utiliser lors du traitement de fichiers PDF pour RAG, l'analyse de documents ou l'extraction de texte. Prend en charge les services API (Mistral OCR) et les outils locaux (PyMuPDF, pdfplumber). Gère les PDF, les tableaux et les documents numérisés basés sur du texte avec OCR.

141Installations·13Tendance·@letta-ai

Installation

$npx skills add https://github.com/letta-ai/skills --skill extracting-pdf-text

Comment installer extracting-pdf-text

Installez rapidement le skill IA extracting-pdf-text dans votre environnement de développement via la ligne de commande

  1. Ouvrir le Terminal: Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.)
  2. Exécuter la commande d'installation: Copiez et exécutez cette commande : npx skills add https://github.com/letta-ai/skills --skill extracting-pdf-text
  3. Vérifier l'installation: Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Source : letta-ai/skills.

This skill provides tools and guidance for extracting text from PDFs in formats suitable for language model consumption.

| Simple text PDF | PyMuPDF | scripts/extractpymupdf.py | | PDF with tables | pdfplumber | scripts/extractpdfplumber.py | | Scanned/image PDF (local) | pytesseract | scripts/extractwithocr.py | | Complex layout, highest accuracy | Mistral OCR API | scripts/extractmistralocr.py | | End-to-end RAG pipeline | marker-pdf | pip install marker-pdf |

Best for: Text-heavy PDFs, speed-critical workflows, basic structure preservation.

Extrayez le texte des PDF pour la consommation LLM. À utiliser lors du traitement de fichiers PDF pour RAG, l'analyse de documents ou l'extraction de texte. Prend en charge les services API (Mistral OCR) et les outils locaux (PyMuPDF, pdfplumber). Gère les PDF, les tableaux et les documents numérisés basés sur du texte avec OCR. Source : letta-ai/skills.

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/letta-ai/skills --skill extracting-pdf-text
Catégorie
#Documents
Vérifié
Première apparition
2026-02-18
Mis à jour
2026-03-10

Browse more skills from letta-ai/skills

Réponses rapides

Qu'est-ce que extracting-pdf-text ?

Extrayez le texte des PDF pour la consommation LLM. À utiliser lors du traitement de fichiers PDF pour RAG, l'analyse de documents ou l'extraction de texte. Prend en charge les services API (Mistral OCR) et les outils locaux (PyMuPDF, pdfplumber). Gère les PDF, les tableaux et les documents numérisés basés sur du texte avec OCR. Source : letta-ai/skills.

Comment installer extracting-pdf-text ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/letta-ai/skills --skill extracting-pdf-text Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Où se trouve le dépôt source ?

https://github.com/letta-ai/skills