nemo-curator
✓Curación de datos acelerada por GPU para formación LLM. Admite texto/imagen/vídeo/audio. Incluye deduplicación difusa (16 veces más rápida), filtrado de calidad (más de 30 heurísticas), deduplicación semántica, redacción de PII y detección de NSFW. Se escala entre GPU con RAPIDS. Úselo para preparar conjuntos de datos de entrenamiento de alta calidad, limpiar datos web o deduplicar grandes corpus.
Instalación
SKILL.md
| Operation | CPU (16 cores) | GPU (A100) | Speedup |
| Fuzzy dedup (8TB) | 120 hours | 7.5 hours | 16× | | Exact dedup (1TB) | 8 hours | 0.5 hours | 16× | | Quality filtering | 2 hours | 0.2 hours | 10× |
Curación de datos acelerada por GPU para formación LLM. Admite texto/imagen/vídeo/audio. Incluye deduplicación difusa (16 veces más rápida), filtrado de calidad (más de 30 heurísticas), deduplicación semántica, redacción de PII y detección de NSFW. Se escala entre GPU con RAPIDS. Úselo para preparar conjuntos de datos de entrenamiento de alta calidad, limpiar datos web o deduplicar grandes corpus. Fuente: ovachiever/droid-tings.
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/ovachiever/droid-tings --skill nemo-curator Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/ovachiever/droid-tings --skill nemo-curator- Fuente
- ovachiever/droid-tings
- Categoría
- *Creatividad
- Verificado
- ✓
- Primera vez visto
- 2026-02-01
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es nemo-curator?
Curación de datos acelerada por GPU para formación LLM. Admite texto/imagen/vídeo/audio. Incluye deduplicación difusa (16 veces más rápida), filtrado de calidad (más de 30 heurísticas), deduplicación semántica, redacción de PII y detección de NSFW. Se escala entre GPU con RAPIDS. Úselo para preparar conjuntos de datos de entrenamiento de alta calidad, limpiar datos web o deduplicar grandes corpus. Fuente: ovachiever/droid-tings.
¿Cómo instalo nemo-curator?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/ovachiever/droid-tings --skill nemo-curator Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/ovachiever/droid-tings
Detalles
- Categoría
- *Creatividad
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-01