·constitutional-ai

</>

constitutional-ai

✓

orchestra-research/ai-research-skills

Anthropic 通过自我完善来训练无害人工智能的方法。两阶段方法 - 通过自我批评/修改进行监督学习，然后是 RLAIF（来自 AI 反馈的 RL）。用于安全对齐，减少有害输出，无需人工标记。为克劳德的安全系统提供动力。

orchestra-research·constitutional·ai

15安装·1热度·@orchestra-research

安装

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill constitutional-ai

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-11

相关 Skills

ml-paper-writing

serving-llms-vllm