| quick | 快速测试 | 10 tokens | | standard | 中等长度 | 20 tokens | | long | 长输出测试 | 100+ tokens | | throughput | 高吞吐测试 | 300-500 tokens | | code | 代码生成(默认) | 500-1000 tokens | | json | JSON 输出测试 | 30 tokens |
| Task Type | Description | Target Output | Use Case |
| counting | 数字序列生成 | 50 tokens | TTFT 测试(最稳定) | | structured-list | 结构化列表 | 100-150 tokens | 中等负载测试 | | code-review | 代码审查报告 | 300-400 tokens | 代码工作负载 | | implementation | 完整代码实现(默认) | 500-700 tokens | 吞吐量测试 | | comprehensive | 综合分析报告 | 800-1000 tokens | 真实工作负载 |
Questa competenza deve essere utilizzata quando l'utente chiede di "eseguire il benchmark dell'API LLM", "testare la velocità dell'API", "misurare il tempo di risposta", "controllare la latenza dell'API", "testare il TPS", "effettuare il benchmark dell'endpoint", "confrontare le prestazioni dell'endpoint", "测试端点性能", "基准测试", "测试LLM速度" o ha bisogno di valutare le metriche delle prestazioni dell'API LLM (TTFT, TPS, latenza). Fonte: ridewind/my-skills.