llm-architect
✓ユーザーが LLM システム アーキテクチャ、モデル デプロイメント、最適化戦略、実稼働サービス インフラストラクチャを必要とする場合に使用します。パフォーマンス、コスト効率、安全性に重点を置いて、スケーラブルな大規模言語モデル アプリケーションを設計します。
SKILL.md
Provides expert large language model system architecture for designing, deploying, and optimizing LLM applications at scale. Specializes in model selection, RAG (Retrieval Augmented Generation) pipelines, fine-tuning strategies, serving infrastructure, cost optimization, and safety guardrails for production LLM systems.
| Latency <100ms | Small fine-tuned model (7B quantized) | | Latency <2s, budget unlimited | Claude 3 Opus / GPT-4 | | Latency <2s, domain-specific | Claude 3 Sonnet fine-tuned | | Latency <2s, cost-sensitive | Claude 3 Haiku | | Batch/async acceptable | Batch API, cheapest tier |
| Semantic caching | 40-80% | 60%+ similar queries | | Multi-model routing | 30-50% | Mixed complexity queries | | Prompt compression | 10-20% | Long context inputs | | Batching | 20-40% | Async-tolerant workloads | | Smaller model cascade | 40-60% | Simple queries first |
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/404kidwiz/claude-supercode-skills --skill llm-architect- カテゴリ
- </>開発ツール
- 認証済み
- ✓
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
llm-architect とは?
ユーザーが LLM システム アーキテクチャ、モデル デプロイメント、最適化戦略、実稼働サービス インフラストラクチャを必要とする場合に使用します。パフォーマンス、コスト効率、安全性に重点を置いて、スケーラブルな大規模言語モデル アプリケーションを設計します。 ソース: 404kidwiz/claude-supercode-skills。
llm-architect のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/404kidwiz/claude-supercode-skills --skill llm-architect インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/404kidwiz/claude-supercode-skills
詳細
- カテゴリ
- </>開発ツール
- ソース
- skills.sh
- 初回登録
- 2026-02-01