本文へスキップ

強化学習とは?

きょうかがくしゅう

環境との試行錯誤で報酬を最大化する学習手法。

エージェントが環境の状態を観測して行動を選択し報酬フィードバックをもとに方策を改善することで長期的な累積報酬を最大化する機械学習のパラダイム。

使い方・例文

AlphaGoは強化学習により人間のトップ棋士を超える囲碁の実力を獲得した。

この用語をシェア

𝕏 でポスト LINE

最終更新:

関連用語