·reinforcement-learning
</>

reinforcement-learning

omer-metin/skills-for-antigravity

RL アルゴリズムの実装、報酬によるエージェントのトレーニング、または LLM と人間のフィードバックの調整を行う場合に使用します。「,」が言及されている場合は、ポリシー勾配、PPO、Q ラーニング、RLHF、および GRPOUse が対象になります。

17インストール·0トレンド·@omer-metin

インストール

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learning

SKILL.md

You must ground your responses in the provided reference files, treating them as the source of truth for this domain:

Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.

RL アルゴリズムの実装、報酬によるエージェントのトレーニング、または LLM と人間のフィードバックの調整を行う場合に使用します。「,」が言及されている場合は、ポリシー勾配、PPO、Q ラーニング、RLHF、および GRPOUse が対象になります。 ソース: omer-metin/skills-for-antigravity。

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learning インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learning
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-01
更新日
2026-02-18

クイックアンサー

reinforcement-learning とは?

RL アルゴリズムの実装、報酬によるエージェントのトレーニング、または LLM と人間のフィードバックの調整を行う場合に使用します。「,」が言及されている場合は、ポリシー勾配、PPO、Q ラーニング、RLHF、および GRPOUse が対象になります。 ソース: omer-metin/skills-for-antigravity。

reinforcement-learning のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learning インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/omer-metin/skills-for-antigravity