·browser automation
*

browser automation

أتمتة المتصفح المستندة إلى الرؤية باستخدام Midscene. يعمل بالكامل من لقطات الشاشة - لا يلزم وجود DOM أو تسميات إمكانية الوصول. يمكن التفاعل مع جميع العناصر المرئية على الشاشة بغض النظر عن مجموعة التكنولوجيا. يفتح علامة تبويب متصفح جديدة لكل عنوان URL مستهدف عبر محرك الدمى (Chrome بدون رأس). استخدم هذه المهارة عندما يريد المستخدم: - تصفح صفحات الويب أو التنقل فيها أو فتحها - استخراج أو استخراج أو جمع البيانات من مواقع الويب - املأ النماذج، أو انقر فوق الأزرار، أو تفاعل مع عناصر الويب - التحقق من سلوك واجهة المستخدم الأمامية أو التحقق من صحته أو اختباره - التقاط لقطات شاشة لصفحات الويب - أتمتة سير عمل الويب متعدد الخطوات - قم بتشغيل أتمتة المتصفح أو التحقق من محتوى موقع الويب مدعوم من Midscene.js (https://midscenejs.com)

454التثبيتات·52الرائج·@web-infra-dev

التثبيت

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation

كيفية تثبيت browser automation

ثبّت مهارة الذكاء الاصطناعي browser automation بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: web-infra-dev/midscene-skills.

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

أتمتة المتصفح المستندة إلى الرؤية باستخدام Midscene. يعمل بالكامل من لقطات الشاشة - لا يلزم وجود DOM أو تسميات إمكانية الوصول. يمكن التفاعل مع جميع العناصر المرئية على الشاشة بغض النظر عن مجموعة التكنولوجيا. يفتح علامة تبويب متصفح جديدة لكل عنوان URL مستهدف عبر محرك الدمى (Chrome بدون رأس). استخدم هذه المهارة عندما يريد المستخدم: - تصفح صفحات الويب أو التنقل فيها أو فتحها - استخراج أو استخراج أو جمع البيانات من مواقع الويب - املأ النماذج، أو انقر فوق الأزرار، أو تفاعل مع عناصر الويب - التحقق من سلوك واجهة المستخدم الأمامية أو التحقق من صحته أو اختباره - التقاط لقطات شاشة لصفحات الويب - أتمتة سير عمل الويب متعدد الخطوات - قم بتشغيل أتمتة المتصفح أو التحقق من محتوى موقع الويب مدعوم من Midscene.js (https://midscenejs.com) المصدر: web-infra-dev/midscene-skills.

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
الفئة
*وسائط إبداعية
موثق
أول ظهور
2026-03-07
آخر تحديث
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

إجابات سريعة

ما هي browser automation؟

أتمتة المتصفح المستندة إلى الرؤية باستخدام Midscene. يعمل بالكامل من لقطات الشاشة - لا يلزم وجود DOM أو تسميات إمكانية الوصول. يمكن التفاعل مع جميع العناصر المرئية على الشاشة بغض النظر عن مجموعة التكنولوجيا. يفتح علامة تبويب متصفح جديدة لكل عنوان URL مستهدف عبر محرك الدمى (Chrome بدون رأس). استخدم هذه المهارة عندما يريد المستخدم: - تصفح صفحات الويب أو التنقل فيها أو فتحها - استخراج أو استخراج أو جمع البيانات من مواقع الويب - املأ النماذج، أو انقر فوق الأزرار، أو تفاعل مع عناصر الويب - التحقق من سلوك واجهة المستخدم الأمامية أو التحقق من صحته أو اختباره - التقاط لقطات شاشة لصفحات الويب - أتمتة سير عمل الويب متعدد الخطوات - قم بتشغيل أتمتة المتصفح أو التحقق من محتوى موقع الويب مدعوم من Midscene.js (https://midscenejs.com) المصدر: web-infra-dev/midscene-skills.

كيف أثبّت browser automation؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/web-infra-dev/midscene-skills

التفاصيل

الفئة
*وسائط إبداعية
المصدر
skills.sh
أول ظهور
2026-03-07