·constitutional-ai
</>

constitutional-ai

ovachiever/droid-tings

Anthropic 通过自我完善来训练无害人工智能的方法。两阶段方法 - 通过自我批评/修改进行监督学习,然后是 RLAIF(来自 AI 反馈的 RL)。用于安全对齐,减少有害输出,无需人工标记。为克劳德的安全系统提供动力。

21安装·0热度·@ovachiever

安装

$npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai

SKILL.md

Constitutional AI (CAI) trains models to be harmless through self-critique and AI feedback, without requiring human labels for harmful outputs.

Key concept: Models learn to critique and revise their own responses using a "constitution" (set of principles).

Workflow 2: RL phase (RLAIF - RL from AI Feedback)

Anthropic 通过自我完善来训练无害人工智能的方法。两阶段方法 - 通过自我批评/修改进行监督学习,然后是 RLAIF(来自 AI 反馈的 RL)。用于安全对齐,减少有害输出,无需人工标记。为克劳德的安全系统提供动力。 来源:ovachiever/droid-tings。

查看原文

可引用信息

为搜索与 AI 引用准备的稳定字段与命令。

安装命令
npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai
分类
</>开发工具
认证
收录时间
2026-02-01
更新时间
2026-02-18

快速解答

什么是 constitutional-ai?

Anthropic 通过自我完善来训练无害人工智能的方法。两阶段方法 - 通过自我批评/修改进行监督学习,然后是 RLAIF(来自 AI 反馈的 RL)。用于安全对齐,减少有害输出,无需人工标记。为克劳德的安全系统提供动力。 来源:ovachiever/droid-tings。

如何安装 constitutional-ai?

打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/ovachiever/droid-tings --skill constitutional-ai 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code 或 Cursor 中使用

这个 Skill 的源码在哪?

https://github.com/ovachiever/droid-tings