什么是 generate-synthetic-data?
使用基于维度的元组生成为 LLM 管道评估创建多样化的综合测试输入。在引导评估数据集、真实用户数据稀疏或对特定故障假设进行压力测试时使用。当您已经拥有 100 多个代表性真实跟踪(改为使用分层采样)或任务正在收集生产日志时,请勿使用。 来源:hamelsmu/evals-skills。
使用基于维度的元组生成为 LLM 管道评估创建多样化的综合测试输入。在引导评估数据集、真实用户数据稀疏或对特定故障假设进行压力测试时使用。当您已经拥有 100 多个代表性真实跟踪(改为使用分层采样)或任务正在收集生产日志时,请勿使用。
通过命令行快速安装 generate-synthetic-data AI 技能到你的开发环境
来源:hamelsmu/evals-skills。
Generate diverse, realistic test inputs that cover the failure space of an LLM pipeline.
Before generating synthetic data, identify where the pipeline is likely to fail. Ask the user about known failure-prone areas, review existing user feedback, or form hypotheses from available traces. Dimensions (Step 1) must target anticipated failures, not arbitrary variation.
Dimensions are axes of variation specific to your application. Choose dimensions based on where you expect failures.
使用基于维度的元组生成为 LLM 管道评估创建多样化的综合测试输入。在引导评估数据集、真实用户数据稀疏或对特定故障假设进行压力测试时使用。当您已经拥有 100 多个代表性真实跟踪(改为使用分层采样)或任务正在收集生产日志时,请勿使用。 来源:hamelsmu/evals-skills。
为搜索与 AI 引用准备的稳定字段与命令。
npx skills add https://github.com/hamelsmu/evals-skills --skill generate-synthetic-data使用基于维度的元组生成为 LLM 管道评估创建多样化的综合测试输入。在引导评估数据集、真实用户数据稀疏或对特定故障假设进行压力测试时使用。当您已经拥有 100 多个代表性真实跟踪(改为使用分层采样)或任务正在收集生产日志时,请勿使用。 来源:hamelsmu/evals-skills。
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/hamelsmu/evals-skills --skill generate-synthetic-data 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/hamelsmu/evals-skills