constitutional-ai
✓자기 개선을 통해 무해한 AI를 훈련시키는 Anthropic의 방법. 2단계 접근 방식 - 자기 비판/수정을 통한 지도 학습, 그 다음 RLAIF(AI 피드백의 RL). 안전 정렬에 사용하여 사람이 라벨을 붙이지 않고도 유해한 출력을 줄입니다. 클로드의 안전 시스템에 전원을 공급합니다.
SKILL.md
Constitutional AI (CAI) trains models to be harmless through self-critique and AI feedback, without requiring human labels for harmful outputs.
Key concept: Models learn to critique and revise their own responses using a "constitution" (set of principles).
Workflow 2: RL phase (RLAIF - RL from AI Feedback)
자기 개선을 통해 무해한 AI를 훈련시키는 Anthropic의 방법. 2단계 접근 방식 - 자기 비판/수정을 통한 지도 학습, 그 다음 RLAIF(AI 피드백의 RL). 안전 정렬에 사용하여 사람이 라벨을 붙이지 않고도 유해한 출력을 줄입니다. 클로드의 안전 시스템에 전원을 공급합니다. 출처: ovachiever/droid-tings.
인용 가능한 정보
AI/검색 인용용 안정적인 필드와 명령어.
- 설치 명령어
npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai- 카테고리
- </>개발 도구
- 인증됨
- ✓
- 최초 등록
- 2026-02-01
- 업데이트
- 2026-02-18
빠른 답변
constitutional-ai이란?
자기 개선을 통해 무해한 AI를 훈련시키는 Anthropic의 방법. 2단계 접근 방식 - 자기 비판/수정을 통한 지도 학습, 그 다음 RLAIF(AI 피드백의 RL). 안전 정렬에 사용하여 사람이 라벨을 붙이지 않고도 유해한 출력을 줄입니다. 클로드의 안전 시스템에 전원을 공급합니다. 출처: ovachiever/droid-tings.
constitutional-ai 설치 방법은?
터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다
소스 저장소는 어디인가요?
https://github.com/ovachiever/droid-tings
상세
- 카테고리
- </>개발 도구
- 출처
- skills.sh
- 최초 등록
- 2026-02-01