·pdf-text-extractor
#

pdf-text-extractor

Загрузите PDF-файлы (если они доступны) и извлеките простой текст для поддержки полнотекстовых доказательств, написав `papers/fulltext_index.jsonl` и `papers/fulltext/*.txt`. **Триггер**: загрузка PDF, полный текст, извлечение текста, документы/pdf-файлы, полнотекстовое извлечение, загрузка PDF. **Используйте, когда**: `queries.md` устанавливает `evidence_mode: fulltext` (или вам явно нужны полнотекстовые доказательства), и вы хотите предоставить более веские доказательства для бумажных заметок/заявлений. **Пропустить, если**: `evidence_mode: Abstract` (по умолчанию); или вы не хотите выполнять загрузку/извлечение (стоимость/разрешения/время). **Сеть**: для полнотекстовой загрузки обычно требуется сеть (если вы вручную не предоставляете кэш PDF в `papers/pdfs/`). **Guardrail**: загрузка кэша в `papers/pdfs/`; по умолчанию не перезаписывать существующий извлеченный текст (если явно не требуется повторное извлечение).

53Установки·4Тренд·@willoscar

Установка

$npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor

Как установить pdf-text-extractor

Быстро установите AI-навык pdf-text-extractor в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: willoscar/research-units-pipeline-skills.

Optionally collect full-text snippets to deepen evidence beyond abstracts.

This skill is intentionally conservative: in many survey runs, abstract/snippet mode is enough and avoids heavy downloads.

When you cannot/should not download PDFs (restricted network, rate limits, no permission), provide PDFs manually and run in “local PDFs only” mode.

Загрузите PDF-файлы (если они доступны) и извлеките простой текст для поддержки полнотекстовых доказательств, написав `papers/fulltext_index.jsonl` и `papers/fulltext/*.txt`. **Триггер**: загрузка PDF, полный текст, извлечение текста, документы/pdf-файлы, полнотекстовое извлечение, загрузка PDF. **Используйте, когда**: `queries.md` устанавливает `evidence_mode: fulltext` (или вам явно нужны полнотекстовые доказательства), и вы хотите предоставить более веские доказательства для бумажных заметок/заявлений. **Пропустить, если**: `evidence_mode: Abstract` (по умолчанию); или вы не хотите выполнять загрузку/извлечение (стоимость/разрешения/время). **Сеть**: для полнотекстовой загрузки обычно требуется сеть (если вы вручную не предоставляете кэш PDF в `papers/pdfs/`). **Guardrail**: загрузка кэша в `papers/pdfs/`; по умолчанию не перезаписывать существующий извлеченный текст (если явно не требуется повторное извлечение). Источник: willoscar/research-units-pipeline-skills.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor
Категория
#Документы
Проверено
Впервые замечено
2026-02-01
Обновлено
2026-03-10

Browse more skills from willoscar/research-units-pipeline-skills

Короткие ответы

Что такое pdf-text-extractor?

Загрузите PDF-файлы (если они доступны) и извлеките простой текст для поддержки полнотекстовых доказательств, написав `papers/fulltext_index.jsonl` и `papers/fulltext/*.txt`. **Триггер**: загрузка PDF, полный текст, извлечение текста, документы/pdf-файлы, полнотекстовое извлечение, загрузка PDF. **Используйте, когда**: `queries.md` устанавливает `evidence_mode: fulltext` (или вам явно нужны полнотекстовые доказательства), и вы хотите предоставить более веские доказательства для бумажных заметок/заявлений. **Пропустить, если**: `evidence_mode: Abstract` (по умолчанию); или вы не хотите выполнять загрузку/извлечение (стоимость/разрешения/время). **Сеть**: для полнотекстовой загрузки обычно требуется сеть (если вы вручную не предоставляете кэш PDF в `papers/pdfs/`). **Guardrail**: загрузка кэша в `papers/pdfs/`; по умолчанию не перезаписывать существующий извлеченный текст (если явно не требуется повторное извлечение). Источник: willoscar/research-units-pipeline-skills.

Как установить pdf-text-extractor?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/willoscar/research-units-pipeline-skills --skill pdf-text-extractor После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/willoscar/research-units-pipeline-skills

Детали

Категория
#Документы
Источник
skills.sh
Впервые замечено
2026-02-01