·browser automation
*

browser automation

Автоматизация браузера на основе визуального представления с использованием Midscene. Работает полностью на основе снимков экрана — не требуется DOM или метки доступности. Может взаимодействовать со всеми видимыми элементами на экране независимо от технологического стека. Открывает новую вкладку браузера для каждого целевого URL-адреса через Puppeteer (безголовый Chrome). Используйте этот навык, когда пользователь хочет: - Просматривайте, перемещайтесь или открывайте веб-страницы. - Очистка, извлечение или сбор данных с веб-сайтов. - Заполняйте формы, нажимайте кнопки или взаимодействуйте с веб-элементами. - Проверка, проверка или тестирование поведения пользовательского интерфейса внешнего интерфейса. - Делайте скриншоты веб-страниц. - Автоматизировать многоэтапные веб-рабочие процессы. - Запустите автоматизацию браузера или проверьте содержимое веб-сайта. При поддержке Midscene.js (https://midscenejs.com)

454Установки·52Тренд·@web-infra-dev

Установка

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation

Как установить browser automation

Быстро установите AI-навык browser automation в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: web-infra-dev/midscene-skills.

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

Автоматизация браузера на основе визуального представления с использованием Midscene. Работает полностью на основе снимков экрана — не требуется DOM или метки доступности. Может взаимодействовать со всеми видимыми элементами на экране независимо от технологического стека. Открывает новую вкладку браузера для каждого целевого URL-адреса через Puppeteer (безголовый Chrome). Используйте этот навык, когда пользователь хочет: - Просматривайте, перемещайтесь или открывайте веб-страницы. - Очистка, извлечение или сбор данных с веб-сайтов. - Заполняйте формы, нажимайте кнопки или взаимодействуйте с веб-элементами. - Проверка, проверка или тестирование поведения пользовательского интерфейса внешнего интерфейса. - Делайте скриншоты веб-страниц. - Автоматизировать многоэтапные веб-рабочие процессы. - Запустите автоматизацию браузера или проверьте содержимое веб-сайта. При поддержке Midscene.js (https://midscenejs.com) Источник: web-infra-dev/midscene-skills.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation
Категория
*Креатив
Проверено
Впервые замечено
2026-03-07
Обновлено
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

Короткие ответы

Что такое browser automation?

Автоматизация браузера на основе визуального представления с использованием Midscene. Работает полностью на основе снимков экрана — не требуется DOM или метки доступности. Может взаимодействовать со всеми видимыми элементами на экране независимо от технологического стека. Открывает новую вкладку браузера для каждого целевого URL-адреса через Puppeteer (безголовый Chrome). Используйте этот навык, когда пользователь хочет: - Просматривайте, перемещайтесь или открывайте веб-страницы. - Очистка, извлечение или сбор данных с веб-сайтов. - Заполняйте формы, нажимайте кнопки или взаимодействуйте с веб-элементами. - Проверка, проверка или тестирование поведения пользовательского интерфейса внешнего интерфейса. - Делайте скриншоты веб-страниц. - Автоматизировать многоэтапные веб-рабочие процессы. - Запустите автоматизацию браузера или проверьте содержимое веб-сайта. При поддержке Midscene.js (https://midscenejs.com) Источник: web-infra-dev/midscene-skills.

Как установить browser automation?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/web-infra-dev/midscene-skills --skill browser automation После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/web-infra-dev/midscene-skills

Детали

Категория
*Креатив
Источник
skills.sh
Впервые замечено
2026-03-07