·browser automation
*

browser automation

Automatisation du navigateur basée sur la vision à l'aide de Midscene. Fonctionne entièrement à partir de captures d’écran – aucune étiquette DOM ou d’accessibilité n’est requise. Peut interagir avec tous les éléments visibles à l’écran, quelle que soit la pile technologique. Ouvre un nouvel onglet de navigateur pour chaque URL cible via Puppeteer (Chrome sans tête). Utilisez cette compétence lorsque l'utilisateur souhaite : - Parcourir, naviguer ou ouvrir des pages Web - Grattez, extrayez ou collectez des données à partir de sites Web - Remplissez des formulaires, cliquez sur des boutons ou interagissez avec des éléments Web - Vérifier, valider ou tester le comportement de l'interface utilisateur frontend - Prendre des captures d'écran de pages Web - Automatisez les flux de travail Web en plusieurs étapes - Exécutez l'automatisation du navigateur ou vérifiez le contenu du site Web Propulsé par Midscene.js (https://midscenejs.com)

454Installations·53Tendance·@web-infra-dev

Installation

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation

Comment installer browser automation

Installez rapidement le skill IA browser automation dans votre environnement de développement via la ligne de commande

  1. Ouvrir le Terminal: Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.)
  2. Exécuter la commande d'installation: Copiez et exécutez cette commande : npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
  3. Vérifier l'installation: Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Source : web-infra-dev/midscene-skills.

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

Automatisation du navigateur basée sur la vision à l'aide de Midscene. Fonctionne entièrement à partir de captures d’écran – aucune étiquette DOM ou d’accessibilité n’est requise. Peut interagir avec tous les éléments visibles à l’écran, quelle que soit la pile technologique. Ouvre un nouvel onglet de navigateur pour chaque URL cible via Puppeteer (Chrome sans tête). Utilisez cette compétence lorsque l'utilisateur souhaite : - Parcourir, naviguer ou ouvrir des pages Web - Grattez, extrayez ou collectez des données à partir de sites Web - Remplissez des formulaires, cliquez sur des boutons ou interagissez avec des éléments Web - Vérifier, valider ou tester le comportement de l'interface utilisateur frontend - Prendre des captures d'écran de pages Web - Automatisez les flux de travail Web en plusieurs étapes - Exécutez l'automatisation du navigateur ou vérifiez le contenu du site Web Propulsé par Midscene.js (https://midscenejs.com) Source : web-infra-dev/midscene-skills.

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
Catégorie
*Créativité
Vérifié
Première apparition
2026-03-07
Mis à jour
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

Réponses rapides

Qu'est-ce que browser automation ?

Automatisation du navigateur basée sur la vision à l'aide de Midscene. Fonctionne entièrement à partir de captures d’écran – aucune étiquette DOM ou d’accessibilité n’est requise. Peut interagir avec tous les éléments visibles à l’écran, quelle que soit la pile technologique. Ouvre un nouvel onglet de navigateur pour chaque URL cible via Puppeteer (Chrome sans tête). Utilisez cette compétence lorsque l'utilisateur souhaite : - Parcourir, naviguer ou ouvrir des pages Web - Grattez, extrayez ou collectez des données à partir de sites Web - Remplissez des formulaires, cliquez sur des boutons ou interagissez avec des éléments Web - Vérifier, valider ou tester le comportement de l'interface utilisateur frontend - Prendre des captures d'écran de pages Web - Automatisez les flux de travail Web en plusieurs étapes - Exécutez l'automatisation du navigateur ou vérifiez le contenu du site Web Propulsé par Midscene.js (https://midscenejs.com) Source : web-infra-dev/midscene-skills.

Comment installer browser automation ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Où se trouve le dépôt source ?

https://github.com/web-infra-dev/midscene-skills

Détails

Catégorie
*Créativité
Source
skills.sh
Première apparition
2026-03-07