| quick | 快速测试 | 10 tokens | | standard | 中等长度 | 20 tokens | | long | 长输出测试 | 100+ tokens | | throughput | 高吞吐测试 | 300-500 tokens | | code | 代码生成(默认) | 500-1000 tokens | | json | JSON 输出测试 | 30 tokens |
| Task Type | Description | Target Output | Use Case |
| counting | 数字序列生成 | 50 tokens | TTFT 测试(最稳定) | | structured-list | 结构化列表 | 100-150 tokens | 中等负载测试 | | code-review | 代码审查报告 | 300-400 tokens | 代码工作负载 | | implementation | 完整代码实现(默认) | 500-700 tokens | 吞吐量测试 | | comprehensive | 综合分析报告 | 800-1000 tokens | 真实工作负载 |
Diese Fähigkeit sollte verwendet werden, wenn der Benutzer „Benchmark LLM API“, „API-Geschwindigkeit testen“, „Antwortzeit messen“, „API-Latenz prüfen“, „TPS testen“, „Endpunkt Benchmarking“, „Endpunktleistung vergleichen“, „LLM-API-Benchmark“, „LLM-API-Geschwindigkeit testen“ auffordert oder LLM-API-Leistungsmetriken bewerten muss (TTFT, TPS, Latenz). Quelle: ridewind/my-skills.