Production-ready VCF processing and variant annotation skill combining local bioinformatics computation with ToolUniverse database integration. Designed to answer bioinformatics analysis questions about VCF data, mutation classification, variant filtering, and clinical annotation.
| VCF Parsing | Pure Python + cyvcf2 parsers. VCF 4.x, gzipped, multi-sample, SNV/indel/SV | | Mutation Classification | Maps SO terms, SnpEff ANN, VEP CSQ, GATK Funcotator to standard types | | VAF Extraction | Handles AF, AD, AO/RO, NR/NV, INFO AF formats |
| Filtering | VAF, depth, quality, PASS, variant type, mutation type, consequence, chromosome, SV size | | Statistics | Ti/Tv ratio, per-sample VAF/depth stats, mutation type distribution, SV size distribution | | Annotation | MyVariant.info (aggregates ClinVar, dbSNP, gnomAD, CADD, SIFT, PolyPhen) |
생물정보학 질문에 대한 생산 준비 VCF 처리, 변종 주석, 돌연변이 분석 및 구조적 변이(SV/CNV) 해석. VCF 파일(스트리밍, 대용량 파일) 구문 분석, 돌연변이 유형(미스센스, 넌센스, 동의어, 프레임시프트, 스플라이스, 인트론, 유전자간) 및 구조적 변형(삭제, 중복, 반전, 전위) 분류, VAF/깊이/품질/결과 필터 적용, ToolUniverse를 통해 ClinVar/dbSNP/gnomAD/CADD로 주석 달기, ClinGen 용량 감도를 사용하여 SV/CNV 임상적 중요성 해석 점수를 매기고 변형 통계를 계산하며 보고서를 생성합니다. "VAF < 0.3인 변이체 중 미스센스는 얼마나 됩니까?", "인트론/유전자간 필터링 후 남은 비참조 변이체는 몇 개입니까?", "BRCA1에 영향을 미치는 이 삭제의 병원성은 무엇입니까?" 또는 "이 CNV와 겹치는 용량 민감 유전자는 무엇입니까?"와 같은 질문을 해결합니다. VCF 파일 처리, 변종 주석 달기, VAF/깊이/결과별 필터링, 돌연변이 분류, 구조 변종 해석, CNV 병원성 평가, 코호트 비교 또는 변종 분석 질문에 답할 때 사용합니다. 출처: mims-harvard/tooluniverse.