Che cos'è eval-harness?
Quadro di valutazione completo per test sistematici, misurazione e garanzia della qualità delle implementazioni assistite dall'intelligenza artificiale. Supporta valutazioni di capacità, test di regressione, più tipi di valutatori e metriche standardizzate. Fonte: mhylle/claude-skills-collection.