Production-ready VCF processing and variant annotation skill combining local bioinformatics computation with ToolUniverse database integration. Designed to answer bioinformatics analysis questions about VCF data, mutation classification, variant filtering, and clinical annotation.
| VCF Parsing | Pure Python + cyvcf2 parsers. VCF 4.x, gzipped, multi-sample, SNV/indel/SV | | Mutation Classification | Maps SO terms, SnpEff ANN, VEP CSQ, GATK Funcotator to standard types | | VAF Extraction | Handles AF, AD, AO/RO, NR/NV, INFO AF formats |
| Filtering | VAF, depth, quality, PASS, variant type, mutation type, consequence, chromosome, SV size | | Statistics | Ti/Tv ratio, per-sample VAF/depth stats, mutation type distribution, SV size distribution | | Annotation | MyVariant.info (aggregates ClinVar, dbSNP, gnomAD, CADD, SIFT, PolyPhen) |
本番環境に対応した VCF 処理、バリアント アノテーション、突然変異分析、バイオインフォマティクスに関する質問に対する構造バリアント (SV/CNV) の解釈。 VCF ファイル (ストリーミング、大きなファイル) を解析し、変異タイプ (ミスセンス、ナンセンス、シノニム、フレームシフト、スプライス、イントロン、遺伝子間) と構造変異 (欠失、重複、逆位、転座) を分類し、VAF/深度/品質/結果フィルターを適用し、ToolUniverse を介して ClinVar/dbSNP/gnomAD/CADD で注釈を付け、以下を使用して SV/CNV の臨床的重要性を解釈します。 ClinGen は用量感度スコアを作成し、バリアント統計を計算し、レポートを生成します。 「VAF < 0.3 のバリアントのどの部分がミスセンスですか?」、「イントロン / 遺伝子間のフィルタリング後に残る非参照バリアントの数は何ですか?」、「BRCA1 に影響を与えるこの欠失の病原性は何ですか?」、「どの用量感受性遺伝子がこの CNV と重複しますか?」などの質問を解決します。 VCF ファイルの処理、バリアントの注釈付け、VAF/深さ/結果によるフィルタリング、突然変異の分類、構造バリアントの解釈、CNV 病原性の評価、コホートの比較、またはバリアント分析の質問に答えるときに使用します。 ソース: mims-harvard/tooluniverse。