data-quality
✓데이터 세트의 데이터 품질 문제를 진단하고 수정합니다. 더티 데이터 작업, 중복 찾기, 누락된 값 처리, 이상값/이상 감지, 제약 조건(기능 종속성, 참조 무결성) 검증, 데이터 세트 프로파일링, 분석 또는 ML을 위한 데이터 정리 등에 사용합니다. 정의, 감지, 정리, 측정 등 전체 데이터 품질 수명주기를 포괄합니다.
SKILL.md
| Data overview | dataprofiling.py | profiledataframe(df) | | Find quality issues | dataprofiling.py | detectglitches(df) | | Missing values | missingdata.py | analyzemissing(df) | | Imputation | missingdata.py | imputemean/median/regression() | | Duplicates | duplicatedetection.py | findduplicates(df, cols) |
| Deduplication | duplicatedetection.py | deduplicate(df, cols) | | Outliers | anomalydetection.py | detectanomalies(df) | | Constraint check | constraintchecking.py | validateconstraints(df, rules) | | String matching | similaritymetrics.py | jarowinklersimilarity() |
Re-run profiling and constraint checks on cleaned data to verify improvements.
데이터 세트의 데이터 품질 문제를 진단하고 수정합니다. 더티 데이터 작업, 중복 찾기, 누락된 값 처리, 이상값/이상 감지, 제약 조건(기능 종속성, 참조 무결성) 검증, 데이터 세트 프로파일링, 분석 또는 ML을 위한 데이터 정리 등에 사용합니다. 정의, 감지, 정리, 측정 등 전체 데이터 품질 수명주기를 포괄합니다. 출처: masterkram/data-quality-skill.
인용 가능한 정보
AI/검색 인용용 안정적인 필드와 명령어.
- 설치 명령어
npx skills add https://github.com/masterkram/data-quality-skill --skill data-quality- 카테고리
- {}데이터 분석
- 인증됨
- ✓
- 최초 등록
- 2026-02-01
- 업데이트
- 2026-02-18
빠른 답변
data-quality이란?
데이터 세트의 데이터 품질 문제를 진단하고 수정합니다. 더티 데이터 작업, 중복 찾기, 누락된 값 처리, 이상값/이상 감지, 제약 조건(기능 종속성, 참조 무결성) 검증, 데이터 세트 프로파일링, 분석 또는 ML을 위한 데이터 정리 등에 사용합니다. 정의, 감지, 정리, 측정 등 전체 데이터 품질 수명주기를 포괄합니다. 출처: masterkram/data-quality-skill.
data-quality 설치 방법은?
터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/masterkram/data-quality-skill --skill data-quality 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다
소스 저장소는 어디인가요?
https://github.com/masterkram/data-quality-skill
상세
- 카테고리
- {}데이터 분석
- 출처
- skills.sh
- 최초 등록
- 2026-02-01