·desktop computer automation
</>

desktop computer automation

使用 Midscene 的视觉驱动桌面自动化。使用自然语言命令控制您的桌面(macOS、Windows、Linux)。 完全通过屏幕截图进行操作——不需要 DOM 或辅助功能标签。无论技术堆栈如何,都可以与屏幕上的所有可见元素进行交互。 触发器:打开应用程序、按键、桌面、计算机、单击屏幕、键入文本、屏幕截图桌面、 启动应用程序、切换窗口、桌面自动化、控制计算机、鼠标单击、键盘快捷键、 屏幕截图、在屏幕上查找、读取屏幕、验证窗口、关闭应用程序、最小化窗口、最大化窗口 由 Midscene.js (https://midscenejs.com) 提供支持

439安装·80热度·@web-infra-dev

安装

$npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation

如何安装 desktop computer automation

通过命令行快速安装 desktop computer automation AI 技能到你的开发环境

  1. 打开终端: 打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等)
  2. 运行安装命令: 复制并运行以下命令:npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation
  3. 验证安装: 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用

来源:web-infra-dev/midscene-skills。

SKILL.md

查看原文

CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.

Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.

Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.

使用 Midscene 的视觉驱动桌面自动化。使用自然语言命令控制您的桌面(macOS、Windows、Linux)。 完全通过屏幕截图进行操作——不需要 DOM 或辅助功能标签。无论技术堆栈如何,都可以与屏幕上的所有可见元素进行交互。 触发器:打开应用程序、按键、桌面、计算机、单击屏幕、键入文本、屏幕截图桌面、 启动应用程序、切换窗口、桌面自动化、控制计算机、鼠标单击、键盘快捷键、 屏幕截图、在屏幕上查找、读取屏幕、验证窗口、关闭应用程序、最小化窗口、最大化窗口 由 Midscene.js (https://midscenejs.com) 提供支持 来源:web-infra-dev/midscene-skills。

可引用信息

为搜索与 AI 引用准备的稳定字段与命令。

安装命令
npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation
分类
</>开发工具
认证
收录时间
2026-03-07
更新时间
2026-03-10

Browse more skills from web-infra-dev/midscene-skills

快速解答

什么是 desktop computer automation?

使用 Midscene 的视觉驱动桌面自动化。使用自然语言命令控制您的桌面(macOS、Windows、Linux)。 完全通过屏幕截图进行操作——不需要 DOM 或辅助功能标签。无论技术堆栈如何,都可以与屏幕上的所有可见元素进行交互。 触发器:打开应用程序、按键、桌面、计算机、单击屏幕、键入文本、屏幕截图桌面、 启动应用程序、切换窗口、桌面自动化、控制计算机、鼠标单击、键盘快捷键、 屏幕截图、在屏幕上查找、读取屏幕、验证窗口、关闭应用程序、最小化窗口、最大化窗口 由 Midscene.js (https://midscenejs.com) 提供支持 来源:web-infra-dev/midscene-skills。

如何安装 desktop computer automation?

打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/web-infra-dev/midscene-skills --skill desktop computer automation 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用

这个 Skill 的源码在哪?

https://github.com/web-infra-dev/midscene-skills

详情

分类
</>开发工具
来源
skills.sh
收录时间
2026-03-07