constitutional-ai
✓Anthropics Methode zum Trainieren harmloser KI durch Selbstverbesserung. Zwei-Phasen-Ansatz – überwachtes Lernen mit Selbstkritik/Überarbeitung, dann RLAIF (RL von AI Feedback). Verwendung zur Sicherheitsausrichtung, Reduzierung schädlicher Emissionen ohne menschliche Kennzeichnung. Betreibt Claudes Sicherheitssystem.
Installation
SKILL.md
Constitutional AI (CAI) trains models to be harmless through self-critique and AI feedback, without requiring human labels for harmful outputs.
Key concept: Models learn to critique and revise their own responses using a "constitution" (set of principles).
Workflow 2: RL phase (RLAIF - RL from AI Feedback)
Anthropics Methode zum Trainieren harmloser KI durch Selbstverbesserung. Zwei-Phasen-Ansatz – überwachtes Lernen mit Selbstkritik/Überarbeitung, dann RLAIF (RL von AI Feedback). Verwendung zur Sicherheitsausrichtung, Reduzierung schädlicher Emissionen ohne menschliche Kennzeichnung. Betreibt Claudes Sicherheitssystem. Quelle: ovachiever/droid-tings.
Fakten (zitierbereit)
Stabile Felder und Befehle für KI/Such-Zitate.
- Installationsbefehl
npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai- Quelle
- ovachiever/droid-tings
- Kategorie
- </>Entwicklung
- Verifiziert
- ✓
- Erstes Auftreten
- 2026-02-01
- Aktualisiert
- 2026-02-18
Schnelle Antworten
Was ist constitutional-ai?
Anthropics Methode zum Trainieren harmloser KI durch Selbstverbesserung. Zwei-Phasen-Ansatz – überwachtes Lernen mit Selbstkritik/Überarbeitung, dann RLAIF (RL von AI Feedback). Verwendung zur Sicherheitsausrichtung, Reduzierung schädlicher Emissionen ohne menschliche Kennzeichnung. Betreibt Claudes Sicherheitssystem. Quelle: ovachiever/droid-tings.
Wie installiere ich constitutional-ai?
Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor
Wo ist das Quell-Repository?
https://github.com/ovachiever/droid-tings
Details
- Kategorie
- </>Entwicklung
- Quelle
- skills.sh
- Erstes Auftreten
- 2026-02-01