·reinforcement-learning

</>

reinforcement-learning

✓

omer-metin/skills-for-antigravity

在實現 RL 算法、通過獎勵訓練代理或根據人類反饋調整 LLM 時使用 - 涵蓋策略梯度、PPO、Q-learning、RLHF 和 GRPO 在提到“,”時使用。

omer-metin·reinforcement·learning

17安裝·0熱度·@omer-metin

安裝

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learning

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-01

相關 Skills

technical-analysis

crypto-trading-bots

pixel-art-sprites

quantitative-research

threejs-3d-graphics