Run scripts/fetchmetrics.py to query metrics from an MLflow tracking server.
Output: Average and median scores for each evaluator (e.g., correctness, relevance)
| -s, --server | Yes | MLflow server URL | | -x, --experiment-ids | Yes | Experiment IDs (comma-separated) | | -m, --metric | Yes | tracecount, latency, inputtokens, outputtokens, totaltokens | | -a, --aggregations | Yes | COUNT, SUM, AVG, MIN, MAX, P50, P95, P99 | | -d, --dimensions | No | Group by: tracename, tracestatus |
Получает агрегированные показатели трассировки (использование токенов, задержка, количество трассировок, оценки качества) с серверов отслеживания MLflow. Запускается по запросам на отображение показателей, анализ использования токенов, просмотр затрат LLM, проверку тенденций использования или запрос статистики трассировки. Источник: mlflow/skills.