·desktop computer automation
</>

desktop computer automation

Automatisation des postes de travail basée sur la vision à l'aide de Midscene. Contrôlez votre bureau (macOS, Windows, Linux) avec des commandes en langage naturel. Fonctionne entièrement à partir de captures d’écran – aucune étiquette DOM ou d’accessibilité n’est requise. Peut interagir avec tous les éléments visibles à l’écran, quelle que soit la pile technologique. Déclencheurs : ouvrir l'application, appuyer sur la touche, le bureau, l'ordinateur, cliquer sur l'écran, saisir du texte, faire une capture d'écran du bureau, lancer une application, changer de fenêtre, bureautique, contrôler l'ordinateur, clic de souris, raccourci clavier, capture d'écran, rechercher à l'écran, lire l'écran, vérifier la fenêtre, fermer l'application, minimiser la fenêtre, agrandir la fenêtre Propulsé par Midscene.js (https://midscenejs.com)

439Installations·78Tendance·@web-infra-dev

Installation

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation

Comment installer desktop computer automation

Installez rapidement le skill IA desktop computer automation dans votre environnement de développement via la ligne de commande

  1. Ouvrir le Terminal: Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.)
  2. Exécuter la commande d'installation: Copiez et exécutez cette commande : npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation
  3. Vérifier l'installation: Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Source : web-infra-dev/midscene-skills.

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

Automatisation des postes de travail basée sur la vision à l'aide de Midscene. Contrôlez votre bureau (macOS, Windows, Linux) avec des commandes en langage naturel. Fonctionne entièrement à partir de captures d’écran – aucune étiquette DOM ou d’accessibilité n’est requise. Peut interagir avec tous les éléments visibles à l’écran, quelle que soit la pile technologique. Déclencheurs : ouvrir l'application, appuyer sur la touche, le bureau, l'ordinateur, cliquer sur l'écran, saisir du texte, faire une capture d'écran du bureau, lancer une application, changer de fenêtre, bureautique, contrôler l'ordinateur, clic de souris, raccourci clavier, capture d'écran, rechercher à l'écran, lire l'écran, vérifier la fenêtre, fermer l'application, minimiser la fenêtre, agrandir la fenêtre Propulsé par Midscene.js (https://midscenejs.com) Source : web-infra-dev/midscene-skills.

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation
Catégorie
</>Développement
Vérifié
Première apparition
2026-03-07
Mis à jour
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

Réponses rapides

Qu'est-ce que desktop computer automation ?

Automatisation des postes de travail basée sur la vision à l'aide de Midscene. Contrôlez votre bureau (macOS, Windows, Linux) avec des commandes en langage naturel. Fonctionne entièrement à partir de captures d’écran – aucune étiquette DOM ou d’accessibilité n’est requise. Peut interagir avec tous les éléments visibles à l’écran, quelle que soit la pile technologique. Déclencheurs : ouvrir l'application, appuyer sur la touche, le bureau, l'ordinateur, cliquer sur l'écran, saisir du texte, faire une capture d'écran du bureau, lancer une application, changer de fenêtre, bureautique, contrôler l'ordinateur, clic de souris, raccourci clavier, capture d'écran, rechercher à l'écran, lire l'écran, vérifier la fenêtre, fermer l'application, minimiser la fenêtre, agrandir la fenêtre Propulsé par Midscene.js (https://midscenejs.com) Source : web-infra-dev/midscene-skills.

Comment installer desktop computer automation ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Où se trouve le dépôt source ?

https://github.com/web-infra-dev/midscene-skills

Détails

Catégorie
</>Développement
Source
skills.sh
Première apparition
2026-03-07