·nemo-curator

Data Curation accelerato da GPU per la formazione LLM. Supporta testo/immagine/video/audio. Dispone di deduplicazione fuzzy (16 volte più veloce), filtraggio della qualità (30+ euristiche), deduplicazione semantica, redazione PII, rilevamento NSFW. Scalabilità tra GPU con RAPIDS. Da utilizzare per preparare set di dati di addestramento di alta qualità, pulire dati Web o deduplicare corpora di grandi dimensioni.

39Installazioni·2Tendenza·@orchestra-research

Installazione

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator

Come installare nemo-curator

Installa rapidamente la skill AI nemo-curator nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: orchestra-research/ai-research-skills.

| Operation | CPU (16 cores) | GPU (A100) | Speedup |

| Fuzzy dedup (8TB) | 120 hours | 7.5 hours | 16× | | Exact dedup (1TB) | 8 hours | 0.5 hours | 16× | | Quality filtering | 2 hours | 0.2 hours | 10× |

Data Curation accelerato da GPU per la formazione LLM. Supporta testo/immagine/video/audio. Dispone di deduplicazione fuzzy (16 volte più veloce), filtraggio della qualità (30+ euristiche), deduplicazione semantica, redazione PII, rilevamento NSFW. Scalabilità tra GPU con RAPIDS. Da utilizzare per preparare set di dati di addestramento di alta qualità, pulire dati Web o deduplicare corpora di grandi dimensioni. Fonte: orchestra-research/ai-research-skills.

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator
Categoria
*Creatività
Verificato
Prima apparizione
2026-02-11
Aggiornato
2026-03-10

Browse more skills from orchestra-research/ai-research-skills

Risposte rapide

Che cos'è nemo-curator?

Data Curation accelerato da GPU per la formazione LLM. Supporta testo/immagine/video/audio. Dispone di deduplicazione fuzzy (16 volte più veloce), filtraggio della qualità (30+ euristiche), deduplicazione semantica, redazione PII, rilevamento NSFW. Scalabilità tra GPU con RAPIDS. Da utilizzare per preparare set di dati di addestramento di alta qualità, pulire dati Web o deduplicare corpora di grandi dimensioni. Fonte: orchestra-research/ai-research-skills.

Come installo nemo-curator?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/orchestra-research/ai-research-skills