·browser automation
*

browser automation

Automazione del browser basata sulla visione utilizzando Midscene. Funziona interamente tramite screenshot: non sono richieste DOM o etichette di accessibilità. Può interagire con tutti gli elementi visibili sullo schermo indipendentemente dallo stack tecnologico. Apre una nuova scheda del browser per ciascun URL di destinazione tramite Puppeteer (Chrome senza testa). Utilizza questa abilità quando l'utente desidera: - Sfoglia, naviga o apri pagine web - Raschiare, estrarre o raccogliere dati da siti Web - Compila moduli, fai clic sui pulsanti o interagisci con elementi web - Verificare, convalidare o testare il comportamento dell'interfaccia utente del frontend - Cattura screenshot delle pagine web - Automatizza i flussi di lavoro web in più fasi - Esegui l'automazione del browser o controlla il contenuto del sito web Realizzato da Midscene.js (https://midscenejs.com)

454Installazioni·53Tendenza·@web-infra-dev

Installazione

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation

Come installare browser automation

Installa rapidamente la skill AI browser automation nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: web-infra-dev/midscene-skills.

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

Automazione del browser basata sulla visione utilizzando Midscene. Funziona interamente tramite screenshot: non sono richieste DOM o etichette di accessibilità. Può interagire con tutti gli elementi visibili sullo schermo indipendentemente dallo stack tecnologico. Apre una nuova scheda del browser per ciascun URL di destinazione tramite Puppeteer (Chrome senza testa). Utilizza questa abilità quando l'utente desidera: - Sfoglia, naviga o apri pagine web - Raschiare, estrarre o raccogliere dati da siti Web - Compila moduli, fai clic sui pulsanti o interagisci con elementi web - Verificare, convalidare o testare il comportamento dell'interfaccia utente del frontend - Cattura screenshot delle pagine web - Automatizza i flussi di lavoro web in più fasi - Esegui l'automazione del browser o controlla il contenuto del sito web Realizzato da Midscene.js (https://midscenejs.com) Fonte: web-infra-dev/midscene-skills.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
Categoria
*Creatività
Verificato
Prima apparizione
2026-03-07
Aggiornato
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

Risposte rapide

Che cos'è browser automation?

Automazione del browser basata sulla visione utilizzando Midscene. Funziona interamente tramite screenshot: non sono richieste DOM o etichette di accessibilità. Può interagire con tutti gli elementi visibili sullo schermo indipendentemente dallo stack tecnologico. Apre una nuova scheda del browser per ciascun URL di destinazione tramite Puppeteer (Chrome senza testa). Utilizza questa abilità quando l'utente desidera: - Sfoglia, naviga o apri pagine web - Raschiare, estrarre o raccogliere dati da siti Web - Compila moduli, fai clic sui pulsanti o interagisci con elementi web - Verificare, convalidare o testare il comportamento dell'interfaccia utente del frontend - Cattura screenshot delle pagine web - Automatizza i flussi di lavoro web in più fasi - Esegui l'automazione del browser o controlla il contenuto del sito web Realizzato da Midscene.js (https://midscenejs.com) Fonte: web-infra-dev/midscene-skills.

Come installo browser automation?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/web-infra-dev/midscene-skills

Dettagli

Categoria
*Creatività
Fonte
skills.sh
Prima apparizione
2026-03-07