·constitutional-ai
</>

constitutional-ai

ovachiever/droid-tings

La méthode d'Anthropic pour entraîner une IA inoffensive grâce à l'auto-amélioration. Approche en deux phases - apprentissage supervisé avec autocritique/révision, puis RLAIF (RL from AI Feedback). À utiliser pour l'alignement de sécurité, réduisant les sorties nocives sans étiquettes humaines. Alimente le système de sécurité de Claude.

21Installations·0Tendance·@ovachiever

Installation

$npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai

SKILL.md

Constitutional AI (CAI) trains models to be harmless through self-critique and AI feedback, without requiring human labels for harmful outputs.

Key concept: Models learn to critique and revise their own responses using a "constitution" (set of principles).

Workflow 2: RL phase (RLAIF - RL from AI Feedback)

La méthode d'Anthropic pour entraîner une IA inoffensive grâce à l'auto-amélioration. Approche en deux phases - apprentissage supervisé avec autocritique/révision, puis RLAIF (RL from AI Feedback). À utiliser pour l'alignement de sécurité, réduisant les sorties nocives sans étiquettes humaines. Alimente le système de sécurité de Claude. Source : ovachiever/droid-tings.

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai
Catégorie
</>Développement
Vérifié
Première apparition
2026-02-01
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que constitutional-ai ?

La méthode d'Anthropic pour entraîner une IA inoffensive grâce à l'auto-amélioration. Approche en deux phases - apprentissage supervisé avec autocritique/révision, puis RLAIF (RL from AI Feedback). À utiliser pour l'alignement de sécurité, réduisant les sorties nocives sans étiquettes humaines. Alimente le système de sécurité de Claude. Source : ovachiever/droid-tings.

Comment installer constitutional-ai ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/ovachiever/droid-tings