·nemo-curator
*

nemo-curator

Обработка данных с ускорением на графическом процессоре для обучения LLM. Поддерживает текст/изображение/видео/аудио. Функции нечеткой дедупликации (в 16 раз быстрее), качественной фильтрации (более 30 эвристик), семантической дедупликации, редактирования PII, обнаружения NSFW. Масштабируется между графическими процессорами с помощью RAPIDS. Используйте для подготовки высококачественных наборов обучающих данных, очистки веб-данных или дедупликации крупных корпусов.

39Установки·2Тренд·@orchestra-research

Установка

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator

Как установить nemo-curator

Быстро установите AI-навык nemo-curator в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: orchestra-research/ai-research-skills.

| Operation | CPU (16 cores) | GPU (A100) | Speedup |

| Fuzzy dedup (8TB) | 120 hours | 7.5 hours | 16× | | Exact dedup (1TB) | 8 hours | 0.5 hours | 16× | | Quality filtering | 2 hours | 0.2 hours | 10× |

Обработка данных с ускорением на графическом процессоре для обучения LLM. Поддерживает текст/изображение/видео/аудио. Функции нечеткой дедупликации (в 16 раз быстрее), качественной фильтрации (более 30 эвристик), семантической дедупликации, редактирования PII, обнаружения NSFW. Масштабируется между графическими процессорами с помощью RAPIDS. Используйте для подготовки высококачественных наборов обучающих данных, очистки веб-данных или дедупликации крупных корпусов. Источник: orchestra-research/ai-research-skills.

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator
Категория
*Креатив
Проверено
Впервые замечено
2026-02-11
Обновлено
2026-03-10

Browse more skills from orchestra-research/ai-research-skills

Короткие ответы

Что такое nemo-curator?

Обработка данных с ускорением на графическом процессоре для обучения LLM. Поддерживает текст/изображение/видео/аудио. Функции нечеткой дедупликации (в 16 раз быстрее), качественной фильтрации (более 30 эвристик), семантической дедупликации, редактирования PII, обнаружения NSFW. Масштабируется между графическими процессорами с помощью RAPIDS. Используйте для подготовки высококачественных наборов обучающих данных, очистки веб-данных или дедупликации крупных корпусов. Источник: orchestra-research/ai-research-skills.

Как установить nemo-curator?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-curator После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/orchestra-research/ai-research-skills

Детали

Категория
*Креатив
Источник
skills.sh
Впервые замечено
2026-02-11