Comprehensive guide for working with PDF files in Python, covering extraction, manipulation, creation, and advanced operations using progressive disclosure for efficiency.
For detailed installation instructions including system dependencies, see:
pypdf: Basic operations (merge, split, rotate, metadata) pdfplumber: Advanced text/table extraction with layout awareness reportlab: Create PDFs from scratch (reports, invoices, documents) PyMuPDF (fitz): Advanced manipulation, annotations, compression pdf2image: Convert PDF pages to images (requires poppler)
Комплексное манипулирование, извлечение и создание PDF-файлов с поддержкой извлечения текста, заполнения форм, слияния, разделения, аннотаций и создания. Используйте при работе с файлами .pdf для: (1) извлечения текста и таблиц, (2) заполнения форм PDF, (3) объединения/разделения PDF-файлов, (4) программного создания PDF-файлов, (5) добавления водяных знаков/аннотаций, (6) управления метаданными PDF-файлов. Источник: autumnsgrove/claudeskills.