什麼是 write-judge-prompt?
為基於程式碼的檢查無法處理的主觀標準設計 LLM-as-Judge 評估器。當故障模式需要解釋(語氣、忠實、相關性、完整性)時使用。當可以使用程式碼(正規表示式、模式驗證、執行測試)檢查故障模式時,請勿使用。當您需要驗證或校準判斷時,請勿使用 - 請改用 validate-evaluator。 來源:hamelsmu/evals-skills。
為基於程式碼的檢查無法處理的主觀標準設計 LLM-as-Judge 評估器。當故障模式需要解釋(語氣、忠實、相關性、完整性)時使用。當可以使用程式碼(正規表示式、模式驗證、執行測試)檢查故障模式時,請勿使用。當您需要驗證或校準判斷時,請勿使用 - 請改用 validate-evaluator。
透過命令列快速安裝 write-judge-prompt AI 技能到你的開發環境
來源:hamelsmu/evals-skills。
Design a binary Pass/Fail LLM-as-Judge evaluator for one specific failure mode. Each judge checks exactly one thing.
State what the judge evaluates. One failure mode per judge.
Not: "Evaluate whether the email is good" or "Rate the email quality from 1-5."
為基於程式碼的檢查無法處理的主觀標準設計 LLM-as-Judge 評估器。當故障模式需要解釋(語氣、忠實、相關性、完整性)時使用。當可以使用程式碼(正規表示式、模式驗證、執行測試)檢查故障模式時,請勿使用。當您需要驗證或校準判斷時,請勿使用 - 請改用 validate-evaluator。 來源:hamelsmu/evals-skills。
為搜尋與 AI 引用準備的穩定欄位與指令。
npx skills add https://github.com/hamelsmu/evals-skills --skill write-judge-prompt為基於程式碼的檢查無法處理的主觀標準設計 LLM-as-Judge 評估器。當故障模式需要解釋(語氣、忠實、相關性、完整性)時使用。當可以使用程式碼(正規表示式、模式驗證、執行測試)檢查故障模式時,請勿使用。當您需要驗證或校準判斷時,請勿使用 - 請改用 validate-evaluator。 來源:hamelsmu/evals-skills。
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/hamelsmu/evals-skills --skill write-judge-prompt 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/hamelsmu/evals-skills