·constitutional-ai
</>

constitutional-ai

ovachiever/droid-tings

자기 개선을 통해 무해한 AI를 훈련시키는 Anthropic의 방법. 2단계 접근 방식 - 자기 비판/수정을 통한 지도 학습, 그 다음 RLAIF(AI 피드백의 RL). 안전 정렬에 사용하여 사람이 라벨을 붙이지 않고도 유해한 출력을 줄입니다. 클로드의 안전 시스템에 전원을 공급합니다.

21설치·0트렌드·@ovachiever

설치

$npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai

SKILL.md

Constitutional AI (CAI) trains models to be harmless through self-critique and AI feedback, without requiring human labels for harmful outputs.

Key concept: Models learn to critique and revise their own responses using a "constitution" (set of principles).

Workflow 2: RL phase (RLAIF - RL from AI Feedback)

자기 개선을 통해 무해한 AI를 훈련시키는 Anthropic의 방법. 2단계 접근 방식 - 자기 비판/수정을 통한 지도 학습, 그 다음 RLAIF(AI 피드백의 RL). 안전 정렬에 사용하여 사람이 라벨을 붙이지 않고도 유해한 출력을 줄입니다. 클로드의 안전 시스템에 전원을 공급합니다. 출처: ovachiever/droid-tings.

원본 보기

인용 가능한 정보

AI/검색 인용용 안정적인 필드와 명령어.

설치 명령어
npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai
카테고리
</>개발 도구
인증됨
최초 등록
2026-02-01
업데이트
2026-02-18

빠른 답변

constitutional-ai이란?

자기 개선을 통해 무해한 AI를 훈련시키는 Anthropic의 방법. 2단계 접근 방식 - 자기 비판/수정을 통한 지도 학습, 그 다음 RLAIF(AI 피드백의 RL). 안전 정렬에 사용하여 사람이 라벨을 붙이지 않고도 유해한 출력을 줄입니다. 클로드의 안전 시스템에 전원을 공급합니다. 출처: ovachiever/droid-tings.

constitutional-ai 설치 방법은?

터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다

소스 저장소는 어디인가요?

https://github.com/ovachiever/droid-tings