| quick | 快速测试 | 10 tokens | | standard | 中等长度 | 20 tokens | | long | 长输出测试 | 100+ tokens | | throughput | 高吞吐测试 | 300-500 tokens | | code | 代码生成(默认) | 500-1000 tokens | | json | JSON 输出测试 | 30 tokens |
| Task Type | Description | Target Output | Use Case |
| counting | 数字序列生成 | 50 tokens | TTFT 测试(最稳定) | | structured-list | 结构化列表 | 100-150 tokens | 中等负载测试 | | code-review | 代码审查报告 | 300-400 tokens | 代码工作负载 | | implementation | 完整代码实现(默认) | 500-700 tokens | 吞吐量测试 | | comprehensive | 综合分析报告 | 800-1000 tokens | 真实工作负载 |
Esta habilidad debe usarse cuando el usuario solicita "comparar la API de LLM", "probar la velocidad de la API", "medir el tiempo de respuesta", "verificar la latencia de la API", "probar el TPS", "comparar el punto final", "comparar el rendimiento del punto final", "测试端点性能", "基准测试", "测试LLM速度", o necesita evaluar las métricas de rendimiento de la API de LLM (TTFT, TPS, latencia). Fuente: ridewind/my-skills.