ما هي pdf-text-extractor؟
قم بتنزيل ملفات PDF (عند توفرها) واستخرج نصًا عاديًا لدعم أدلة النص الكامل، وكتابة "papers/fulltext_index.jsonl" و"papers/fulltext/*.txt". ** الزناد **: تنزيل PDF، النص الكامل، استخراج النص، الأوراق / ملفات PDF، استخراج النص الكامل، تنزيل PDF. **الاستخدام عندما**: `queries.md` يعين `evidence_mode: fulltext` (أو تحتاج صراحةً إلى دليل النص الكامل) وتريد تقديم دليل أقوى للملاحظات/الادعاءات الورقية. **تخطي إذا**: `evidence_mode: Abstract` (افتراضي)؛ أو لا ترغب في إجراء التنزيل/الاستخراج (التكلفة/الأذونات/الوقت). **الشبكة**: عادةً ما يتطلب تنزيل النص الكامل شبكة (إلا إذا قمت بتوفير ذاكرة تخزين مؤقت لملف PDF يدويًا في `الأوراق/ملفات pdf/`). **Guardrail**: تنزيلات ذاكرة التخزين المؤقت إلى `papers/pdfs/`؛ افتراضيًا، لا تقم بالكتابة فوق النص المستخرج الموجود (ما لم يُطلب منك إعادة الاستخراج صراحةً). المصدر: willoscar/research-units-pipeline-skills.