Production-ready VCF processing and variant annotation skill combining local bioinformatics computation with ToolUniverse database integration. Designed to answer bioinformatics analysis questions about VCF data, mutation classification, variant filtering, and clinical annotation.
| VCF Parsing | Pure Python + cyvcf2 parsers. VCF 4.x, gzipped, multi-sample, SNV/indel/SV | | Mutation Classification | Maps SO terms, SnpEff ANN, VEP CSQ, GATK Funcotator to standard types | | VAF Extraction | Handles AF, AD, AO/RO, NR/NV, INFO AF formats |
| Filtering | VAF, depth, quality, PASS, variant type, mutation type, consequence, chromosome, SV size | | Statistics | Ti/Tv ratio, per-sample VAF/depth stats, mutation type distribution, SV size distribution | | Annotation | MyVariant.info (aggregates ClinVar, dbSNP, gnomAD, CADD, SIFT, PolyPhen) |
针对生物信息学问题的生产就绪 VCF 处理、变异注释、突变分析和结构变异 (SV/CNV) 解释。解析 VCF 文件(流、大文件),对突变类型(错义、无义、同义、移码、剪接、内含子、基因间)和结构变异(缺失、重复、倒位、易位)进行分类,应用 VAF/深度/质量/结果过滤器,通过 ToolUniverse 使用 ClinVar/dbSNP/gnomAD/CADD 进行注释,使用 ClinGen 剂量敏感性解释 SV/CNV 临床意义评分、计算变异统计数据并生成报告。解决诸如“VAF < 0.3 的变体中哪些部分是错义?”、“过滤内含子/基因间后剩余多少非参考变体?”、“影响 BRCA1 的此缺失的致病性是什么?”或“哪些剂量敏感基因与此 CNV 重叠?”等问题。在处理 VCF 文件、注释变异、按 VAF/深度/结果过滤、对突变进行分类、解释结构变异、评估 CNV 致病性、比较队列或回答变异分析问题时使用。 来源:mims-harvard/tooluniverse。