CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.
Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.
Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.
Midscene을 사용한 비전 기반 데스크탑 자동화. 자연어 명령으로 데스크탑(macOS, Windows, Linux)을 제어하세요. 전적으로 스크린샷으로 작동합니다. DOM이나 접근성 라벨이 필요하지 않습니다. 기술 스택에 관계없이 화면에 보이는 모든 요소와 상호 작용할 수 있습니다. 트리거: 앱 열기, 키 누르기, 데스크톱, 컴퓨터, 화면 클릭, 텍스트 입력, 데스크톱 스크린샷, 응용 프로그램 실행, 창 전환, 데스크탑 자동화, 컴퓨터 제어, 마우스 클릭, 키보드 단축키, 화면 캡처, 화면에서 찾기, 화면 읽기, 창 확인, 앱 닫기, 창 최소화, 창 최대화 Midscene.js 제공(https://midscenejs.com) 출처: web-infra-dev/midscene-skills.