·browser automation
*

browser automation

Automatización del navegador basada en visión utilizando Midscene. Funciona completamente a partir de capturas de pantalla: no se requieren DOM ni etiquetas de accesibilidad. Puede interactuar con todos los elementos visibles en la pantalla independientemente de la pila de tecnología. Abre una nueva pestaña del navegador para cada URL de destino a través de Puppeteer (Chrome sin cabeza). Utilice esta habilidad cuando el usuario quiera: - Explorar, navegar o abrir páginas web - Extraer, extraer o recopilar datos de sitios web - Complete formularios, haga clic en botones o interactúe con elementos web - Verificar, validar o probar el comportamiento de la interfaz de usuario - Tomar capturas de pantalla de páginas web. - Automatizar flujos de trabajo web de varios pasos - Ejecute la automatización del navegador o verifique el contenido del sitio web Desarrollado por Midscene.js (https://midscenejs.com)

454Instalaciones·52Tendencia·@web-infra-dev

Instalación

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation

Cómo instalar browser automation

Instala rápidamente el skill de IA browser automation en tu entorno de desarrollo mediante línea de comandos

  1. Abrir Terminal: Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.)
  2. Ejecutar comando de instalación: Copia y ejecuta este comando: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
  3. Verificar instalación: Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw

Fuente: web-infra-dev/midscene-skills.

SKILL.md

Ver original

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

Automatización del navegador basada en visión utilizando Midscene. Funciona completamente a partir de capturas de pantalla: no se requieren DOM ni etiquetas de accesibilidad. Puede interactuar con todos los elementos visibles en la pantalla independientemente de la pila de tecnología. Abre una nueva pestaña del navegador para cada URL de destino a través de Puppeteer (Chrome sin cabeza). Utilice esta habilidad cuando el usuario quiera: - Explorar, navegar o abrir páginas web - Extraer, extraer o recopilar datos de sitios web - Complete formularios, haga clic en botones o interactúe con elementos web - Verificar, validar o probar el comportamiento de la interfaz de usuario - Tomar capturas de pantalla de páginas web. - Automatizar flujos de trabajo web de varios pasos - Ejecute la automatización del navegador o verifique el contenido del sitio web Desarrollado por Midscene.js (https://midscenejs.com) Fuente: web-infra-dev/midscene-skills.

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
Categoría
*Creatividad
Verificado
Primera vez visto
2026-03-07
Actualizado
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

Respuestas rápidas

¿Qué es browser automation?

Automatización del navegador basada en visión utilizando Midscene. Funciona completamente a partir de capturas de pantalla: no se requieren DOM ni etiquetas de accesibilidad. Puede interactuar con todos los elementos visibles en la pantalla independientemente de la pila de tecnología. Abre una nueva pestaña del navegador para cada URL de destino a través de Puppeteer (Chrome sin cabeza). Utilice esta habilidad cuando el usuario quiera: - Explorar, navegar o abrir páginas web - Extraer, extraer o recopilar datos de sitios web - Complete formularios, haga clic en botones o interactúe con elementos web - Verificar, validar o probar el comportamiento de la interfaz de usuario - Tomar capturas de pantalla de páginas web. - Automatizar flujos de trabajo web de varios pasos - Ejecute la automatización del navegador o verifique el contenido del sitio web Desarrollado por Midscene.js (https://midscenejs.com) Fuente: web-infra-dev/midscene-skills.

¿Cómo instalo browser automation?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw

¿Dónde está el repositorio de origen?

https://github.com/web-infra-dev/midscene-skills

Detalles

Categoría
*Creatividad
Fuente
skills.sh
Primera vez visto
2026-03-07