·training-data-curation
{}

training-data-curation

Рекомендации по созданию высококачественных наборов данных для пост-обучения LLM (SFT/DPO/RLHF). Используйте при подготовке данных для точной настройки, оценки качества данных или разработки стратегий сбора данных.

25Установки·0Тренд·@sundial-org

Установка

$npx skills add https://github.com/sundial-org/skills --skill training-data-curation

Как установить training-data-curation

Быстро установите AI-навык training-data-curation в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/sundial-org/skills --skill training-data-curation
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: sundial-org/skills.

Best practices for gathering and preparing training data for LLM fine-tuning.

Quality over quantity. Llama 2 used only 27,540 high-quality SFT examples and outperformed models trained on larger noisy datasets [[1]](#references). Focus on clean, diverse, well-formatted data.

Garbage in, garbage out. The model will learn patterns from your data—including errors, biases, and formatting issues. Inspect samples manually before training.

Рекомендации по созданию высококачественных наборов данных для пост-обучения LLM (SFT/DPO/RLHF). Используйте при подготовке данных для точной настройки, оценки качества данных или разработки стратегий сбора данных. Источник: sundial-org/skills.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/sundial-org/skills --skill training-data-curation
Источник
sundial-org/skills
Категория
{}Аналитика
Проверено
Впервые замечено
2026-02-01
Обновлено
2026-03-10

Browse more skills from sundial-org/skills

Короткие ответы

Что такое training-data-curation?

Рекомендации по созданию высококачественных наборов данных для пост-обучения LLM (SFT/DPO/RLHF). Используйте при подготовке данных для точной настройки, оценки качества данных или разработки стратегий сбора данных. Источник: sundial-org/skills.

Как установить training-data-curation?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/sundial-org/skills --skill training-data-curation После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/sundial-org/skills

Детали

Категория
{}Аналитика
Источник
skills.sh
Впервые замечено
2026-02-01