什麼是 evaluate-rag?
指導 RAG 管道檢索和生成品質的評估。在評估檢索增強生成系統、測量檢索品質、評估生成可信度或相關性、產生用於檢索測試的綜合 QA 對或優化分塊策略時使用。 來源:hamelsmu/evals-skills。
指導 RAG 管道檢索和生成品質的評估。在評估檢索增強生成系統、測量檢索品質、評估生成可信度或相關性、產生用於檢索測試的綜合 QA 對或優化分塊策略時使用。
透過命令列快速安裝 evaluate-rag AI 技能到你的開發環境
來源:hamelsmu/evals-skills。
Complete error analysis on RAG pipeline traces before selecting metrics. Inspect what was retrieved vs. what the model needed. Determine whether the problem is retrieval, generation, or both. Fix retrieval first.
Measure each component independently. Use the appropriate metric for each retrieval stage:
Manual curation (highest quality): Write realistic questions and map each to the exact chunk(s) containing the answer.
指導 RAG 管道檢索和生成品質的評估。在評估檢索增強生成系統、測量檢索品質、評估生成可信度或相關性、產生用於檢索測試的綜合 QA 對或優化分塊策略時使用。 來源:hamelsmu/evals-skills。
為搜尋與 AI 引用準備的穩定欄位與指令。
npx skills add https://github.com/hamelsmu/evals-skills --skill evaluate-rag指導 RAG 管道檢索和生成品質的評估。在評估檢索增強生成系統、測量檢索品質、評估生成可信度或相關性、產生用於檢索測試的綜合 QA 對或優化分塊策略時使用。 來源:hamelsmu/evals-skills。
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/hamelsmu/evals-skills --skill evaluate-rag 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/hamelsmu/evals-skills