CRITICAL RULES — VIOLATIONS WILL BREAK THE WORKFLOW: Never run midscene commands in the background. Each command must run synchronously so you can read its output (especially screenshots) before deciding the next action. Background execution breaks the screenshot-analyze-act loop.
Run only one midscene command at a time. Wait for the previous command to finish, read the screenshot, then decide the next action. Never chain multiple commands together.
Allow enough time for each command to complete. Midscene commands involve AI inference and screen interaction, which can take longer than typical shell commands. A typical command needs about 1 minute; complex act commands may need even longer.
Midscene Bridge 모드를 사용한 비전 기반 브라우저 자동화. 전적으로 스크린샷으로 작동합니다. DOM이나 접근성 라벨이 필요하지 않습니다. 기술 스택에 관계없이 화면에 보이는 모든 요소와 상호 작용할 수 있습니다. 이 모드는 Midscene Chrome Extension을 통해 사용자의 데스크톱 Chrome 브라우저에 연결하여 쿠키, 세션 및 로그인 상태를 유지합니다. 사용자가 다음을 원할 때 이 기술을 사용하십시오. - 사용자 자신의 Chrome 브라우저에서 웹페이지 탐색, 탐색 또는 열기 - 로그인 세션, 쿠키 또는 기존 브라우저 상태가 필요한 페이지와 상호 작용합니다. - 사용자의 실제 브라우저를 사용하여 웹사이트에서 데이터를 스크랩, 추출 또는 수집합니다. - 양식을 작성하고, 버튼을 클릭하고, 웹 요소와 상호 작용합니다. - 프런트엔드 UI 동작 확인, 검증 또는 테스트 - 웹페이지 스크린샷 찍기 - 다단계 웹 워크플로 자동화 - 웹사이트 내용이나 외관 확인 Midscene.js 제공(https://midscenejs.com) 출처: web-infra-dev/midscene-skills.