Che cos'è runtime-skills?
Best practice per Universal Runtime per l'inferenza PyTorch, i modelli Transformers e il servizio FastAPI. Copre la gestione dei dispositivi, il caricamento dei modelli, l'ottimizzazione della memoria e l'ottimizzazione delle prestazioni. Fonte: llama-farm/llamafarm.