·desktop computer automation
</>

desktop computer automation

Automatización de escritorio basada en visión utilizando Midscene. Controle su escritorio (macOS, Windows, Linux) con comandos en lenguaje natural. Funciona completamente a partir de capturas de pantalla: no se requieren DOM ni etiquetas de accesibilidad. Puede interactuar con todos los elementos visibles en la pantalla independientemente de la pila de tecnología. Activadores: abrir aplicación, presionar tecla, escritorio, computadora, hacer clic en la pantalla, escribir texto, captura de pantalla del escritorio, iniciar aplicación, cambiar de ventana, automatización de escritorio, controlar la computadora, hacer clic con el mouse, método abreviado de teclado, captura de pantalla, buscar en pantalla, leer pantalla, verificar ventana, cerrar aplicación, minimizar ventana, maximizar ventana Desarrollado por Midscene.js (https://midscenejs.com)

439Instalaciones·78Tendencia·@web-infra-dev

Instalación

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation

Cómo instalar desktop computer automation

Instala rápidamente el skill de IA desktop computer automation en tu entorno de desarrollo mediante línea de comandos

  1. Abrir Terminal: Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.)
  2. Ejecutar comando de instalación: Copia y ejecuta este comando: npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation
  3. Verificar instalación: Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw

Fuente: web-infra-dev/midscene-skills.

SKILL.md

Ver original

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

Automatización de escritorio basada en visión utilizando Midscene. Controle su escritorio (macOS, Windows, Linux) con comandos en lenguaje natural. Funciona completamente a partir de capturas de pantalla: no se requieren DOM ni etiquetas de accesibilidad. Puede interactuar con todos los elementos visibles en la pantalla independientemente de la pila de tecnología. Activadores: abrir aplicación, presionar tecla, escritorio, computadora, hacer clic en la pantalla, escribir texto, captura de pantalla del escritorio, iniciar aplicación, cambiar de ventana, automatización de escritorio, controlar la computadora, hacer clic con el mouse, método abreviado de teclado, captura de pantalla, buscar en pantalla, leer pantalla, verificar ventana, cerrar aplicación, minimizar ventana, maximizar ventana Desarrollado por Midscene.js (https://midscenejs.com) Fuente: web-infra-dev/midscene-skills.

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation
Categoría
</>Desarrollo
Verificado
Primera vez visto
2026-03-07
Actualizado
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

Respuestas rápidas

¿Qué es desktop computer automation?

Automatización de escritorio basada en visión utilizando Midscene. Controle su escritorio (macOS, Windows, Linux) con comandos en lenguaje natural. Funciona completamente a partir de capturas de pantalla: no se requieren DOM ni etiquetas de accesibilidad. Puede interactuar con todos los elementos visibles en la pantalla independientemente de la pila de tecnología. Activadores: abrir aplicación, presionar tecla, escritorio, computadora, hacer clic en la pantalla, escribir texto, captura de pantalla del escritorio, iniciar aplicación, cambiar de ventana, automatización de escritorio, controlar la computadora, hacer clic con el mouse, método abreviado de teclado, captura de pantalla, buscar en pantalla, leer pantalla, verificar ventana, cerrar aplicación, minimizar ventana, maximizar ventana Desarrollado por Midscene.js (https://midscenejs.com) Fuente: web-infra-dev/midscene-skills.

¿Cómo instalo desktop computer automation?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw

¿Dónde está el repositorio de origen?

https://github.com/web-infra-dev/midscene-skills

Detalles

Categoría
</>Desarrollo
Fuente
skills.sh
Primera vez visto
2026-03-07