Что такое pdf-text-extractor?
Загрузите PDF-файлы (если они доступны) и извлеките простой текст для поддержки полнотекстовых доказательств, написав `papers/fulltext_index.jsonl` и `papers/fulltext/*.txt`. **Триггер**: загрузка PDF, полный текст, извлечение текста, документы/pdf-файлы, полнотекстовое извлечение, загрузка PDF. **Используйте, когда**: `queries.md` устанавливает `evidence_mode: fulltext` (или вам явно нужны полнотекстовые доказательства), и вы хотите предоставить более веские доказательства для бумажных заметок/заявлений. **Пропустить, если**: `evidence_mode: Abstract` (по умолчанию); или вы не хотите выполнять загрузку/извлечение (стоимость/разрешения/время). **Сеть**: для полнотекстовой загрузки обычно требуется сеть (если вы вручную не предоставляете кэш PDF в `papers/pdfs/`). **Guardrail**: загрузка кэша в `papers/pdfs/`; по умолчанию не перезаписывать существующий извлеченный текст (если явно не требуется повторное извлечение). Источник: willoscar/research-units-pipeline-skills.