This skill generates high-quality synthetic training data in ChatML format for fine-tuning language models using frameworks like Unsloth, Axolotl, or similar tools.
| Planning my dataset - requirements, strategy, quality checklist | resources/dataset-strategy.md | | How to create diverse examples - variation techniques, multi-turn patterns, format-specific guidance | resources/generation-techniques.md |
| ChatML format details - structure, specification, common issues, framework compatibility | resources/chatml-format.md | | Example datasets - inspiration across domains, multi-turn samples, edge cases | resources/examples.md | | Validating quality - validation workflow, analyzing datasets, troubleshooting | resources/quality-validation.md |
Создает комплексные синтетические наборы данных для точной настройки в формате ChatML (JSONL) для использования с Unsloth, Axolotl и аналогичными платформами обучения. Собирает требования, создает наборы данных с разнообразными примерами, проверяет качество и предоставляет рекомендации по интеграции инфраструктуры. Источник: markpitt/claude-skills.