Production computer vision engineering skill for object detection, image segmentation, and visual AI system deployment.
| Frameworks | PyTorch, torchvision, timm | | Detection | Ultralytics (YOLO), Detectron2, MMDetection | | Segmentation | segment-anything, mmsegmentation | | Optimization | ONNX, TensorRT, OpenVINO, torch.compile | | Image Processing | OpenCV, Pillow, albumentations | | Annotation | CVAT, Label Studio, Roboflow |
| Experiment Tracking | MLflow, Weights & Biases | | Serving | Triton Inference Server, TorchServe |
オブジェクト検出、画像セグメンテーション、ビジュアル AI システムのためのコンピューター ビジョン エンジニアリング スキル。 CNN および Vision Transformer アーキテクチャ、YOLO/Faster R-CNN/DETR 検出、マスク R-CNN/SAM セグメンテーション、ONNX/TensorRT を使用した本番環境のデプロイメントをカバーします。 PyTorch、torchvision、Ultralytics、Detectron2、および MMDetection フレームワークが含まれます。検出パイプラインの構築、カスタム モデルのトレーニング、推論の最適化、ビジョン システムの導入時に使用します。 ソース: borghei/claude-skills。