·reinforcement-learning

</>

reinforcement-learning

✓

omer-metin/skills-for-antigravity

在实现 RL 算法、通过奖励训练代理或根据人类反馈调整 LLM 时使用 - 涵盖策略梯度、PPO、Q-learning、RLHF 和 GRPO 在提到“,”时使用。

omer-metin·reinforcement·learning

17安装·0热度·@omer-metin

安装

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learning

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-01

相关 Skills

technical-analysis

crypto-trading-bots

pixel-art-sprites

quantitative-research

threejs-3d-graphics