·llm-architect
</>

llm-architect

404kidwiz/claude-supercode-skills

사용자에게 LLM 시스템 아키텍처, 모델 배포, 최적화 전략 및 프로덕션 서비스 인프라가 필요할 때 사용합니다. 성능, 비용 효율성 및 안전성에 중점을 두고 확장 가능한 대규모 언어 모델 애플리케이션을 설계합니다.

48설치·2트렌드·@404kidwiz

설치

$npx skills add https://github.com/404kidwiz/claude-supercode-skills --skill llm-architect

SKILL.md

Provides expert large language model system architecture for designing, deploying, and optimizing LLM applications at scale. Specializes in model selection, RAG (Retrieval Augmented Generation) pipelines, fine-tuning strategies, serving infrastructure, cost optimization, and safety guardrails for production LLM systems.

| Latency <100ms | Small fine-tuned model (7B quantized) | | Latency <2s, budget unlimited | Claude 3 Opus / GPT-4 | | Latency <2s, domain-specific | Claude 3 Sonnet fine-tuned | | Latency <2s, cost-sensitive | Claude 3 Haiku | | Batch/async acceptable | Batch API, cheapest tier |

| Semantic caching | 40-80% | 60%+ similar queries | | Multi-model routing | 30-50% | Mixed complexity queries | | Prompt compression | 10-20% | Long context inputs | | Batching | 20-40% | Async-tolerant workloads | | Smaller model cascade | 40-60% | Simple queries first |

원본 보기

인용 가능한 정보

AI/검색 인용용 안정적인 필드와 명령어.

설치 명령어
npx skills add https://github.com/404kidwiz/claude-supercode-skills --skill llm-architect
카테고리
</>개발 도구
인증됨
최초 등록
2026-02-01
업데이트
2026-02-18

빠른 답변

llm-architect이란?

사용자에게 LLM 시스템 아키텍처, 모델 배포, 최적화 전략 및 프로덕션 서비스 인프라가 필요할 때 사용합니다. 성능, 비용 효율성 및 안전성에 중점을 두고 확장 가능한 대규모 언어 모델 애플리케이션을 설계합니다. 출처: 404kidwiz/claude-supercode-skills.

llm-architect 설치 방법은?

터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/404kidwiz/claude-supercode-skills --skill llm-architect 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다

소스 저장소는 어디인가요?

https://github.com/404kidwiz/claude-supercode-skills