Qu'est-ce que llm-api-benchmark ?
Cette compétence doit être utilisée lorsque l'utilisateur demande de « comparer l'API LLM », « tester la vitesse de l'API », « mesurer le temps de réponse », « vérifier la latence de l'API », « tester le TPS », « évaluer le point de terminaison », « comparer les performances des points de terminaison », « évaluer les métriques de performance de l'API LLM ». (TTFT, TPS, latence). Source : ridewind/my-skills.