Production-ready VCF processing and variant annotation skill combining local bioinformatics computation with ToolUniverse database integration. Designed to answer bioinformatics analysis questions about VCF data, mutation classification, variant filtering, and clinical annotation.
| VCF Parsing | Pure Python + cyvcf2 parsers. VCF 4.x, gzipped, multi-sample, SNV/indel/SV | | Mutation Classification | Maps SO terms, SnpEff ANN, VEP CSQ, GATK Funcotator to standard types | | VAF Extraction | Handles AF, AD, AO/RO, NR/NV, INFO AF formats |
| Filtering | VAF, depth, quality, PASS, variant type, mutation type, consequence, chromosome, SV size | | Statistics | Ti/Tv ratio, per-sample VAF/depth stats, mutation type distribution, SV size distribution | | Annotation | MyVariant.info (aggregates ClinVar, dbSNP, gnomAD, CADD, SIFT, PolyPhen) |
針對生物資訊問題的生產就緒 VCF 處理、變異註釋、突變分析和結構變異 (SV/CNV) 解釋。解析 VCF 檔案(流、大檔案),對突變類型(錯義、無義、同義、移碼、剪接、內含子、基因間)和結構變異(缺失、重複、倒位、易位)進行分類,應用 VAF/深度/品質/結果過濾器,透過 ToolUniverse 使用 ClinVar/dbSNP/gnomAD/CADD 進行研究結果,透過 ToolUniverse 使用 ClinVar/dbSNP/gnomAD/CADD 進行變異數說明,使用統計量報告使用統計量和統計量。解決諸如「VAF < 0.3 的變異體中哪些部分是錯義?」、「過濾內含子/基因間後剩餘多少非參考變異體?」、「影響 BRCA1 的此缺失的致病性是什麼?」或「哪些劑量敏感基因與此 CNV 重疊?」等問題。在處理 VCF 檔案、註釋變異、按 VAF/深度/結果過濾、對突變進行分類、解釋結構變異、評估 CNV 致病性、比較隊列或回答變異分析問題時使用。 來源:mims-harvard/tooluniverse。