·browser automation
*

browser automation

Midscene を使用したビジョン主導のブラウザ自動化。完全にスクリーンショットから操作できます。DOM やアクセシビリティ ラベルは必要ありません。テクノロジースタックに関係なく、画面上に表示されるすべての要素を操作できます。 Puppeteer (ヘッドレス Chrome) 経由でターゲット URL ごとに新しいブラウザー タブを開きます。 ユーザーが次のことを行う場合にこのスキルを使用します。 - Web ページを参照、移動、または開く - Web サイトからデータをスクレイピング、抽出、または収集する - フォームに記入する、ボタンをクリックする、または Web 要素を操作する - フロントエンド UI の動作を検証、検証、またはテストします。 - Webページのスクリーンショットを撮る - 複数ステップの Web ワークフローを自動化する - ブラウザ自動化を実行するか、Web サイトのコンテンツを確認します Midscene.js の提供 (https://midscenejs.com)

454インストール·52トレンド·@web-infra-dev

インストール

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation

browser automation のインストール方法

コマンドラインで browser automation AI スキルを開発環境にすばやくインストール

  1. ターミナルを開く: ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます
  2. インストールコマンドを実行: このコマンドをコピーして実行します: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
  3. インストールを確認: インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code、Cursor、OpenClaw で使用できるようになります

ソース: web-infra-dev/midscene-skills。

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

Midscene を使用したビジョン主導のブラウザ自動化。完全にスクリーンショットから操作できます。DOM やアクセシビリティ ラベルは必要ありません。テクノロジースタックに関係なく、画面上に表示されるすべての要素を操作できます。 Puppeteer (ヘッドレス Chrome) 経由でターゲット URL ごとに新しいブラウザー タブを開きます。 ユーザーが次のことを行う場合にこのスキルを使用します。 - Web ページを参照、移動、または開く - Web サイトからデータをスクレイピング、抽出、または収集する - フォームに記入する、ボタンをクリックする、または Web 要素を操作する - フロントエンド UI の動作を検証、検証、またはテストします。 - Webページのスクリーンショットを撮る - 複数ステップの Web ワークフローを自動化する - ブラウザ自動化を実行するか、Web サイトのコンテンツを確認します Midscene.js の提供 (https://midscenejs.com) ソース: web-infra-dev/midscene-skills。

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
カテゴリ
*クリエイティブ
認証済み
初回登録
2026-03-07
更新日
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

クイックアンサー

browser automation とは?

Midscene を使用したビジョン主導のブラウザ自動化。完全にスクリーンショットから操作できます。DOM やアクセシビリティ ラベルは必要ありません。テクノロジースタックに関係なく、画面上に表示されるすべての要素を操作できます。 Puppeteer (ヘッドレス Chrome) 経由でターゲット URL ごとに新しいブラウザー タブを開きます。 ユーザーが次のことを行う場合にこのスキルを使用します。 - Web ページを参照、移動、または開く - Web サイトからデータをスクレイピング、抽出、または収集する - フォームに記入する、ボタンをクリックする、または Web 要素を操作する - フロントエンド UI の動作を検証、検証、またはテストします。 - Webページのスクリーンショットを撮る - 複数ステップの Web ワークフローを自動化する - ブラウザ自動化を実行するか、Web サイトのコンテンツを確認します Midscene.js の提供 (https://midscenejs.com) ソース: web-infra-dev/midscene-skills。

browser automation のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code、Cursor、OpenClaw で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/web-infra-dev/midscene-skills

詳細

カテゴリ
*クリエイティブ
ソース
skills.sh
初回登録
2026-03-07