This skill generates high-quality synthetic training data in ChatML format for fine-tuning language models using frameworks like Unsloth, Axolotl, or similar tools.
| Planning my dataset - requirements, strategy, quality checklist | resources/dataset-strategy.md | | How to create diverse examples - variation techniques, multi-turn patterns, format-specific guidance | resources/generation-techniques.md |
| ChatML format details - structure, specification, common issues, framework compatibility | resources/chatml-format.md | | Example datasets - inspiration across domains, multi-turn samples, edge cases | resources/examples.md | | Validating quality - validation workflow, analyzing datasets, troubleshooting | resources/quality-validation.md |
يُنشئ مجموعات بيانات اصطناعية شاملة ومُحسنة بتنسيق ChatML (JSONL) للاستخدام مع Unsloth وAxolotl وأطر التدريب المشابهة. يجمع المتطلبات، وينشئ مجموعات بيانات بأمثلة متنوعة، ويتحقق من الجودة، ويقدم إرشادات حول تكامل إطار العمل. المصدر: markpitt/claude-skills.