·browser automation
*

browser automation

使用 Midscene 的視覺驅動瀏覽器自動化。完全透過螢幕截圖進行操作—不需要 DOM 或輔助功能標籤。無論技術堆疊如何,都可以與螢幕上的所有可見元素進行互動。 透過 Puppeteer(無頭 Chrome)為每個目標 URL 開啟新的瀏覽器標籤。 當使用者想要執行以下操作時使用此技能: - 瀏覽、導航或開啟網頁 - 從網站上抓取、提取或收集數據 - 填寫表格、點擊按鈕或與網路元素交互 - 驗證、驗證或測試前端 UI 行為 - 截取網頁截圖 - 自動化多步驟網路工作流程 - 執行瀏覽器自動化或檢查網站內容 由 Midscene.js (https://midscenejs.com) 提供支持

454安裝·52熱度·@web-infra-dev

安裝

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation

如何安裝 browser automation

透過命令列快速安裝 browser automation AI 技能到你的開發環境

  1. 開啟終端機: 開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等)
  2. 執行安裝指令: 複製並執行以下指令:npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
  3. 驗證安裝: 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用

來源:web-infra-dev/midscene-skills。

SKILL.md

查看原文

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

使用 Midscene 的視覺驅動瀏覽器自動化。完全透過螢幕截圖進行操作—不需要 DOM 或輔助功能標籤。無論技術堆疊如何,都可以與螢幕上的所有可見元素進行互動。 透過 Puppeteer(無頭 Chrome)為每個目標 URL 開啟新的瀏覽器標籤。 當使用者想要執行以下操作時使用此技能: - 瀏覽、導航或開啟網頁 - 從網站上抓取、提取或收集數據 - 填寫表格、點擊按鈕或與網路元素交互 - 驗證、驗證或測試前端 UI 行為 - 截取網頁截圖 - 自動化多步驟網路工作流程 - 執行瀏覽器自動化或檢查網站內容 由 Midscene.js (https://midscenejs.com) 提供支持 來源:web-infra-dev/midscene-skills。

可引用資訊

為搜尋與 AI 引用準備的穩定欄位與指令。

安裝指令
npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
分類
*創意媒體
認證
收錄時間
2026-03-07
更新時間
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

快速解答

什麼是 browser automation?

使用 Midscene 的視覺驅動瀏覽器自動化。完全透過螢幕截圖進行操作—不需要 DOM 或輔助功能標籤。無論技術堆疊如何,都可以與螢幕上的所有可見元素進行互動。 透過 Puppeteer(無頭 Chrome)為每個目標 URL 開啟新的瀏覽器標籤。 當使用者想要執行以下操作時使用此技能: - 瀏覽、導航或開啟網頁 - 從網站上抓取、提取或收集數據 - 填寫表格、點擊按鈕或與網路元素交互 - 驗證、驗證或測試前端 UI 行為 - 截取網頁截圖 - 自動化多步驟網路工作流程 - 執行瀏覽器自動化或檢查網站內容 由 Midscene.js (https://midscenejs.com) 提供支持 來源:web-infra-dev/midscene-skills。

如何安裝 browser automation?

開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用

這個 Skill 的原始碼在哪?

https://github.com/web-infra-dev/midscene-skills

詳情

分類
*創意媒體
來源
skills.sh
收錄時間
2026-03-07